AMD坚守FP64原生支持，兼顾AI低精度与科学计算高精度需求-中关村在线

AMD坚守FP64原生支持，兼顾AI低精度与科学计算高精度需求

牛奶秋刀鱼

原创

06-18

近年来，图形处理器的计算能力持续向人工智能领域倾斜，从传统的单精度浮点运算FP32，逐步演进至半精度FP16、八位精度FP8，当前业界正加速推进四精度FP4的落地应用，整体算力呈现显著跃升态势。

然而，人工智能训练与推理所依赖的低精度计算，与高性能科学计算对数值精度的严苛要求已明显分化。在气象模拟、量子化学、流体力学等关键科研领域，双精度浮点运算FP64仍是不可替代的基础能力。全球超算TOP500榜单中，绝大多数系统仍以FP64性能作为核心评估指标，缺失该能力将直接影响大量基础科学研究的可行性。

实现高水准FP64运算对硬件设计提出极高挑战。回溯至十余年前，部分通用显卡架构曾大幅削减FP64计算单元规模，使其与单精度单元比例从最初的2比1压缩至64比1，由此催生出面向游戏与面向科学计算两类差异化产品路线。

近期一篇题为FP8 is All You Need（第一部分）：破除硬件FP64作为高性能计算终极目标的迷思的学术论文，在高性能计算领域引发广泛讨论。文中提出一种新思路：通过FP8硬件配合特定算法，软件层面模拟FP64运算效果，从而绕开原生双精度硬件的设计瓶颈。这一设想促使业界重新审视GPU厂商是否应继续投入FP64硬件研发。

对此，AMD负责人工智能与超算业务的高管约瑟夫·乔治公开表明立场：精度始终是科学计算的基石，AMD不会因追求AI算力而放弃对FP64原生支持的承诺。

其旗下Instinct系列加速器已集成Ozaki等先进软件框架，可基于FP8硬件实现FP64级精度的近似计算，但该技术属于增强选项而非替代方案。乔治强调，目前客户并未提出移除GPU中FP64硬件单元的要求，亦无意愿牺牲科学计算的原始精度保障。

他进一步指出，科研工作者可根据实际需求自由选择计算路径——若采用FP4、FP6或FP8精度即可满足任务目标，AMD完全支持；若借助Ozaki等工具实现精度扩展，系统同样兼容；若需原生FP64运算，AMD亦全力保障其高效执行。

归根结底，AMD的核心理念是服务科学本身——不预设路径，不限定精度层级，只为确保计算结果最大限度接近真实。在AI与科学计算并行发展的时代，兼顾全精度谱系的算力供给，才是支撑前沿探索最坚实的基础。

展开全文