近日,深度求索正式推出其最新大模型DeepSeek-V3.1,引发业界广泛关注。其中一大亮点,便是该模型首次支持UE8M0 FP8格式。
据该公司介绍,UE8M0 FP8是为即将面世的下一代国产芯片量身打造的一种新型数据格式。相关分析指出,这一格式具备更高的灵活性,有助于提升复杂模型的推理效率,增强芯片在处理大规模数据时的解码能力与运算表现,为国产芯片承载更大模型提供了切实可行的技术路径。业内观点认为,这将加速推动国产AI算力生态的发展与完善。
那么,UE8M0 FP8具体是什么?它又将带来哪些变化?
有业内人士、人工智能专家、清华大学计算机系博士梁斌指出,UE8M0 FP8与英伟达所推出的FP8格式并非同一标准,而是另一套独立的技术体系。
他表示,随着模型规模的快速扩张,显存容量逐渐成为瓶颈。为在有限资源下承载更大模型,参数表达必须通过量化方式压缩。例如,FP32使用32位来表示一个参数,而FP8则仅用8位,从而大幅节省显存占用。
在FP8体系中,英伟达采用了E4M3和E5M2两种格式,侧重小数位表达,精度更高;而UE8M0则不包含小数部分,强调低功耗和高效运算,对芯片要求更低,更适合国产芯片架构。
梁斌进一步指出,DeepSeek此次在模型中引入UE8M0 FP8支持,并推动国产芯片向该标准靠拢,意味着国产AI算力生态正逐步摆脱对国外体系的依赖。未来,推理模型将可能在这两种标准之间做出选择,国产芯片厂商也在积极对接这套体系。
他评价称,目前多家国产芯片企业在为适配该标准全力以赴,一旦成功将对国产算力发展带来深远影响。同时,他也表示,DeepSeek此举展现出强大的技术魄力,将国产大模型推向了新的高度,具有里程碑意义。

评论
更多评论