近年来,图形处理器的计算能力持续向人工智能领域倾斜,从传统的单精度浮点运算FP32,逐步演进至半精度FP16、八位精度FP8,当前业界正加速推进四精度FP4的落地应用,整体算力呈现显著跃升态势。
然而,人工智能训练与推理所依赖的低精度计算,与高性能科学计算对数值精度的严苛要求已明显分化。在气象模拟、量子化学、流体力学等关键科研领域,双精度浮点运算FP64仍是不可替代的基础能力。全球超算TOP500榜单中,绝大多数系统仍以FP64性能作为核心评估指标,缺失该能力将直接影响大量基础科学研究的可行性。
实现高水准FP64运算对硬件设计提出极高挑战。回溯至十余年前,部分通用显卡架构曾大幅削减FP64计算单元规模,使其与单精度单元比例从最初的2比1压缩至64比1,由此催生出面向游戏与面向科学计算两类差异化产品路线。
近期一篇题为FP8 is All You Need(第一部分):破除硬件FP64作为高性能计算终极目标的迷思的学术论文,在高性能计算领域引发广泛讨论。文中提出一种新思路:通过FP8硬件配合特定算法,软件层面模拟FP64运算效果,从而绕开原生双精度硬件的设计瓶颈。这一设想促使业界重新审视GPU厂商是否应继续投入FP64硬件研发。
对此,AMD负责人工智能与超算业务的高管约瑟夫·乔治公开表明立场:精度始终是科学计算的基石,AMD不会因追求AI算力而放弃对FP64原生支持的承诺。
其旗下Instinct系列加速器已集成Ozaki等先进软件框架,可基于FP8硬件实现FP64级精度的近似计算,但该技术属于增强选项而非替代方案。乔治强调,目前客户并未提出移除GPU中FP64硬件单元的要求,亦无意愿牺牲科学计算的原始精度保障。
他进一步指出,科研工作者可根据实际需求自由选择计算路径——若采用FP4、FP6或FP8精度即可满足任务目标,AMD完全支持;若借助Ozaki等工具实现精度扩展,系统同样兼容;若需原生FP64运算,AMD亦全力保障其高效执行。
归根结底,AMD的核心理念是服务科学本身——不预设路径,不限定精度层级,只为确保计算结果最大限度接近真实。在AI与科学计算并行发展的时代,兼顾全精度谱系的算力供给,才是支撑前沿探索最坚实的基础。

评论
更多评论