Cerebras公司最新推出的第三代芯片WSE-3,在相同功耗下性能比上一代产品翻倍。该芯片采用了台积电的5nm制程技术,拥有4万亿个晶体管和900万个AI核心,缓存容量达到44GB。此外,WSE-3还具备1.5TB、12TB或1.2PB三种片外内存容量可选。
借助于基于WSE-3的CS-3系统,用户可以训练规模比GPT-4和Gemini大十倍的下一代前沿模型。这款系统能够容纳24000T参数规模的模型,在简化开发人员工作方面具有显著优势。CS-3适合超大规模AI需求,四个系统集群可以在一天内微调70B模型;而使用最大规模的2048个CS-3系统集群时,可以在一天内完成Llama70B模型的训练。
Cerebras公司表示,CS-3系统具有卓越的易用性,并且相比GPU需要更少代码来实现大模型训练。只需565行代码即可达成标准实现GPT-3大小的模型。
同时,阿联酋的G42财团宣布将打造基于Cerebras CS-3系统的Condor Galaxy 3超级计算机。这台计算机将包含64个系统,并提供8 exaFLOP的AI算力。

评论
更多评论