2026年6月15日,继上周发布Kimi 2.7 Code大模型后,月之暗面正式推出该模型的高速版本。相较标准版,其输出速度提升至约六倍。
在实际开发过程中,大模型的响应效率直接影响编码流畅度与整体工作节奏。尤其在代码生成、调试与重构等高频场景中,更快的推理速度意味着更短的等待时间、更高的迭代频率,从而显著提升开发者生产力。此次推出的Kimi K2.7 Code高速版,正是围绕这一核心需求进行深度优化。
官方说明显示,高速版与标准版基于完全相同的模型架构与参数,仅在推理引擎与服务部署层面进行了专项加速。在典型编程任务中(以输入长度中位数为基准),平均输出速度达每秒180个Token;在上下文较短的轻量级任务中,峰值速度可接近每秒260个Token,进一步强化实时交互体验。
服务定价方面,高速版API费用为标准版的两倍。企业客户与独立开发者可通过Kimi API开放平台调用该版本,模型标识符为kimi-k2.7-code-highspeed。同时,Kimi Code Plan用户可加入“抢先体验计划”(访问kimi.com/code/beta),在Kimi Code应用内率先使用高速版功能。
随着底层算力资源持续扩容,高速版的服务覆盖范围也将逐步扩大。自2026年7月起,Allegretto等级及以上会员将陆续获得使用权限。需注意的是,在Kimi Code Plan中调用高速版所消耗的配额为标准版的三倍。
此外,为确保Kimi K2.7 Code系列模型发挥最佳效果,必须启用思考模式(Thinking)。Kimi API与Kimi Code均默认开启该模式。若用户手动关闭,API将返回错误提示,而Kimi Code则自动降级至K2.6版本继续运行。
文章末尾强调,前沿人工智能技术理应秉持开放、高效、普适的原则,而非成为少数群体专享的资源。技术发展的本质在于连接与共享,任何人为设置的壁垒都将促使全球创新力量加快构建自主、稳健、可持续的技术生态。

评论
更多评论