国产人工智能领域即将迎来新一轮重要进展。继备受关注的DeepSeek V4.1将于六月发布之后,稀宇科技也正式确认其新一代大模型MiniMax M3的研发已进入发布准备阶段。
该公司在海外社交媒体平台转发了AI负责人Skyler Miao的一则动态,配文称“大的要来了”,并附上一张展示新模型架构的设计图。结合当前产品演进节奏与公开信息,该模型被普遍认定为MiniMax M3。
目前MiniMax最新公开版本为M2.7,发布于今年三月;此前M2.5于二月上线。自去年十一月M2系列首次亮相以来,整体迭代周期已逾半年。相较近期国际主流大模型频繁更新的节奏,此次M3的推出标志着研发步伐明显加快。
尽管M3的具体技术参数尚未正式公布,但从负责人发布的架构图可确认多项关键升级:模型将采用自主研发的稀疏注意力机制——MiniMax稀疏注意力,上下文窗口扩展至100万tokens,与DS V4处于同一量级;推理延迟显著优化,相较M2系列降低达十至十五倍,整体性能实现跃升。
此外,根据前期披露的信息,M3将原生支持多模态能力,综合性能达到全球领先水平。作为参照,当前M2系列为参数量超两千亿元、单次激活约百亿参数的模型;而M3有望进一步突破,参数规模或迈向万亿级别。其实际表现值得高度期待。

评论
更多评论