2026年6月28日,谷歌正对Gemini人工智能平台的算力资源实施更严格的管控措施。这一调整源于开发者、企业及行业头部科技公司持续攀升的调用需求,已对平台现有承载能力构成显著压力。
数据显示,自2025年3月至8月间,Gemini API的请求总量增长一倍。面对这一迅猛增长,谷歌不得不重新评估其核心人工智能计算资源的分配逻辑——这类算力正成为当前科技领域最为稀缺与关键的基础能力之一。
据内部消息,谷歌于2026年3月左右向Meta明确表示,无法满足其提出的全部Gemini模型算力配额需求。由于Meta在模型调用量上远超其他客户,此次调整对其影响尤为突出。多个原计划推进的内部人工智能项目因此出现进度延缓。叠加公司整体优化人工智能投入成本的战略方向,Meta已要求全体员工精简AI令牌调用频次,提升单位算力的使用效能。
其他使用Gemini服务的客户同样面临算力配额收紧的情况,但影响范围与程度相对可控。
自2026年5月17日起,谷歌对Gemini应用正式启用基于算力额度的使用机制。该机制采用周期性配额管理方式:用户不再享有无限制调用权限,而是按每周滚动更新的五小时窗口获取可用额度,并受制于周度总量上限。该规则覆盖所有客户,无例外情形。
为保障平台在高速扩张阶段的稳定性与公平性,谷歌已建立多层级的速率控制与支出监测体系,确保各类客户在资源分配中获得合理、均衡的接入机会。

评论
更多评论