2026年2月5日,中科曙光正式启用全国首个三万张加速卡规模的scaleX超大规模AI算力集群。该集群由三套万卡级系统组成,同步在国家超算互联网郑州核心节点投入试运行,标志着我国迄今规模最大、已实际部署并投入运营的国产AI算力基础设施正式建成。
这一集群全面支撑万亿参数级大模型训练、高并发推理以及人工智能驱动的科学研究等典型大规模计算任务。自2025年12月scaleX万卡集群在HAIC大会完成首次真机展示以来,仅用不到两个月时间即实现三万卡规模的工程化落地与运行。
scaleX超集群采用开放式的AI计算架构设计,原生兼容CUDA等主流软件生态,支持多种国产加速芯片混合部署,显著降低开发者适配迁移成本。系统具备良好的横向扩展能力,可平滑延伸至十万卡乃至百万卡量级,契合人工智能产业持续规模化发展的实际需要。
目前,scaleX已针对四百余个主流大语言模型及世界模型完成适配与性能优化;依托国家超算互联网平台,可无缝接入上千种行业应用,并协同众多AI生态伙伴,提供从底层算力到上层应用的一体化服务。
在具体应用层面,该集群已在多个方向发挥关键支撑作用:在超大模型训练方面,支持整机规模的万亿参数模型训练及自动容错恢复;在高通量推理场景中,已稳定服务于多家头部互联网企业的核心智能业务,通过联合深度调优持续提升推理吞吐与响应效率;在人工智能赋能科学发现领域,成功支撑某材料科学大模型登顶国际权威评测榜单,并助力国内顶尖科研团队将蛋白质结构解析与功能预测的效率提升三至六个数量级。此外,配合OneScience科学大模型开发平台,进一步降低了跨学科科研创新的技术门槛与实施成本。

评论
更多评论