2025年11月13日,寒武纪宣布正式接入众智FlagOS生态系统。公司指出,随着人工智能应用的不断扩展,单一芯片架构已难以满足多样化的业务需求。目前,大模型应用厂商在部署不同类型的业务时,常需引入多种架构的AI芯片,导致跨架构的代码迁移与维护周期长达数月,成为制约业务高效迁移的主要障碍。
为应对这一挑战,北京智源人工智能研究院联合多家社区伙伴共同发起众智FlagOS项目。该项目旨在通过构建统一的软件层,实现AI模型与异构硬件之间的解耦,打破不同芯片架构间的软件壁垒,为底层硬件与上层AI应用提供高效、统一的连接通道,系统性解决行业长期存在的适配困难、调优缓慢、协同不足等问题,推动“一次开发,多端运行”的目标落地。
自2024年初起,寒武纪便与智源研究院展开深度合作,率先启动FlagGems——基于Triton的高性能通用AI算子库的联合开发。此后,双方合作逐步拓展至FlagTree(支持多后端的增强版Triton编译器)、FlagCX(统一通信库)以及FlagScale(集训练与推理于一体的并行框架)等多个核心组件。
此次寒武纪对FlagOS的适配与优化,重点聚焦于算子库、编译器、分布式通信库及并行计算框架等关键模块,致力于提升其在多架构环境下的兼容性与性能表现。
据了解,FlagOS是由北京智源人工智能研究院主导研发的开源系统软件栈,目前已支持超过20种国内外主流AI芯片型号。该平台整合了FlagScale并行训推框架、FlagAttention与FlagGems高性能算子库、FlagCX统一通信库等多项核心技术,整体平均性能优于芯片原厂提供的基础算子。
2025年9月,众智FlagOS 1.5版本正式推出,覆盖12家以上国内外主要芯片厂商的20余款芯片产品,显著降低硬件适配复杂度;通过优化并行策略与调度算法,在典型大模型任务中实现最高达36.8%的训练速度提升和20%的推理加速;同时全面支持机器人认知系统中“大脑”与“小脑”类模型(如RoboBrain、VLA等)的开发与部署,进一步拓展应用场景。

评论
更多评论