2026年4月23日凌晨,小米正式发布MiMo-V2.5系列大模型,并同步启动公开测试。本次共推出四款模型:MiMo-V2.5、MiMo-V2.5-Pro、MiMo-V2.5-TTS Series以及MiMo-V2.5-ASR。
其中,MiMo-V2.5和MiMo-V2.5-Pro将面向全球开源。
MiMo-V2.5-Pro专为应对长周期、高复杂度的智能体任务设计,支持百万级上下文长度,是小米目前能力最强的模型。在通用智能体表现、复杂软件工程任务处理及长程任务执行等关键维度上,该模型已具备与国际同类顶尖模型如Claude Opus 4.6、GPT-5.4等直接对标的实力,相较前代MiMo-V2-Pro实现全面性能升级。
内部测试显示,在与配套运行框架协同工作时,MiMo-V2.5-Pro可稳定完成单次近一千轮工具调用的长周期任务,并在复杂指令解析与跨步骤逻辑一致性方面取得显著进步。
实际应用案例中,该模型曾参与北京大学编译原理课程项目——使用Rust语言开发完整SysY编译器。该项目通常需本科生投入数周时间完成,而MiMo-V2.5-Pro仅耗时4.3小时,通过672次工具调用即完成全部开发流程,并在未公开的测试集中获得满分233分。
MiMo-V2.5则聚焦原生全模态智能体能力,全面支持图像、音频与视频输入,推理速度更快,同样支持百万级上下文长度。在Claw-Eval等主流智能体评测中,其综合表现优于MiMo-V2-Pro,适用于日常轻量级任务,同时API调用成本降低约一半。
该模型在跨模态理解、视频内容分析、图表识别等方向亦有明显增强,在VideoMME、CharXiv、MMMU-Pro等专业评测中,表现已接近甚至超越当前业界领先的闭源模型。
此外,MiMo-V2.5系列在Token使用效率方面进行了深度优化,同等任务下可更高效利用计算资源。在ClawEval基准分数一致的前提下,MiMo-V2.5-Pro相比Kimi K2.6节省42%的Token消耗;MiMo-V2.5相较Muse Spark节省50%。
模型订阅服务也同步完成升级,新版Token Plan取消原有的四倍积分计费机制,不再区分256k与1M上下文的计费标准,并新增夜间时段优惠速率及自动续订功能。

评论
更多评论