近日,英伟达CEO黄仁勋发表长篇AI主题博客,系统阐释AI产业的底层逻辑,提出AI“五层架构”。
黄仁勋在博客开篇便抛出两个否定式定义与一个肯定式定义:AI并非仅仅是一款巧妙的应用程序,也不是单一的模型,而是如同电力和互联网一样必不可少的基础设施。这一全新定义的深意,在于通过连续否定剥离公众对AI的常见误读,将其从具体产品的认知迷思中抽离,纳入具有普遍性、前置性与不可替代性的基础设施范畴。
更深层的判断,在于黄仁勋对AI物质性的强调。他明确指出,AI依托真实的硬件、能源和经济体系运行,能够将原材料大规模地转化为智能。这一观点进一步印证了智能的产出绝非空中楼阁,而是需要真实的物理投入,遵循可量化的经济逻辑。每家公司都将应用AI,每个国家或地区都将发展AI,这一普遍性判断建立在物质基础之上,而非技术乌托邦的想象。
他进一步提出,要理解AI的发展逻辑,就必须从从基本原理进行推理,并了解计算领域发生了哪些根本性变化。这一表述,既超越了技术话语中常见的机会主义描述,也暗示后续论述并非经验现象的简单罗列,而是基于核心原理的系统性演绎。
从预制软件到实时生成智能:计算模式的颠覆
在计算技术的发展历程中,软件通常是预先制作完成的。人类描述算法,计算机忠实执行;数据需经过精心设计,存储于表格之中,再通过精确查询检索。SQL之所以成为过去时代的核心工具,正是因为这种确定性、预成性的模式支撑着当时的世界运转。这种模式的核心特征,是预设了一个已知、稳定、可穷尽的知识世界,结构化、分类、索引等操作均围绕这一前提展开。
而AI的出现,彻底打破了这一传统模式。人类首次拥有了能够理解非结构化信息的计算机,能识别图像、阅读文本、聆听声音并解读其含义,能根据上下文与用户意图进行推理,更重要的是,它能够实时生成智能。这里的“实时”与“生成”相互强化:智能并非预先存储的内容,而是在交互瞬间被创造出来的,这种创造不是复制,而是真正的生产。
笔者注意到,AI的每个回应都是全新创建的,每个答案都取决于提供的上下文。这并非传统软件对存储指令的检索,而是AI根据需求自主推理、生成智能的过程。这一变化的激进性,在于否定了传统软件的可复制性:传统软件一旦开发完成,边际分发成本趋近于零,而AI的每一次推理都需要消耗真实的计算资源,边际成本不为零。
这意味着,AI的经济逻辑更接近制造业,而非传统信息产业。也正因为智能是实时生成的,智能背后的整个计算架构都必须重新设计。这一推论将认识论的转变,转化为了系统性重构的工程指令,而非局部的优化调整。
五层架构完整展开:垂直整合的AI工业系统
从工业视角审视AI,其架构可清晰分解为五层。这一框架的颠覆性,在于将观察视角垂直翻转:不再是从应用层向下寻找支撑,而是从能源层向上追踪智能的转化路径。每一层都是下一层的产出物,同时也是上一层的约束条件,这种链式依赖结构,深刻揭示了AI产业的本质,AI产业不是一个可水平切分的平台生态,而是一个必须垂直整合的工业系统。
能源层:智能生产的底层根基
最底层是能源。实时生成的智能,离不开实时供给的电力支撑,每一个生成的token,都是电子流动、热量管理以及能量向计算转化的直接结果。在这一层面,不存在任何抽象层可以绕过物理约束,智能不会从算法中免费涌出,每一次token的生成都对应着真实的能量消耗。
能源是AI基础设施的首要原则,也是制约智能产出规模的核心瓶颈。这一双重强调意味着,能源既是AI发展的基础,也是AI扩展速度的硬上限。在当前技术路径下,AI的规模化扩展速度,最终受制于全球可调配的电力供给。
芯片层:能源向计算转化的核心枢纽
能源层之上是芯片。这些处理器的核心使命,是大规模、高效地将能源转化为计算能力——关键词是“高效”,而非单纯的算力堆砌,核心在于优化能源转化效率。芯片层直接决定了AI的扩展速度,以及智能的可适用性——而可适用性,直接决定了智能的成本曲线,进而划定智能的产业渗透边界:昂贵的智能只能局限于高价值场景,唯有廉价的智能,才能真正普及至千行百业。
AI工作负载对并行处理能力、高带宽内存和快速互连有着极高需求,这三者的组合要求芯片设计必须从单点优化转向协同优化,构建一个紧耦合的系统,而非孤立提升单一指标。
基础设施层:AI工厂引领的基建革命
芯片层之上是基础设施层,这一层涵盖土地、供电、冷却系统、建筑工程、网络通信,以及将成千上万台处理器编排成一台完整机器的系统,这些系统,就是黄仁勋口中的“AI工厂”。AI工厂的设计目的并非存储信息,而是“制造智能”,这一命名转换,标志着产业从仓储经济向生产经济的范式转移。
当前,全球正同步建设芯片工厂、计算机组装厂与AI工厂,这一场景正成为人类历史上规模最大的基础设施建设浪潮,AI的工业化进程正处于早期加速阶段。支撑这场建设的人力需求极为庞大:AI工厂需要电工、管道工、管件工、钢铁工人、网络技术人员、安装人员和操作员等各类技术工种,这些岗位技术性强、待遇优厚,且目前处于供不应求的状态。
这也意味着,AI的受益面并非局限于数字经济的精英群体,而是正在向传统技术工种扩散,让更多人能够参与到这场产业变革之中。
模型层:打破窄化认知,拓展AI创新边界
基础设施层之上是模型层。AI模型的能力早已超越单一领域,能够理解语言、生物学、化学、物理学、金融学、医学以及物理世界本身。事实上,这一观点打破了公众将AI等同于大语言模型的窄化认知。语言模型只是AI模型的一个类别,当前一些最具变革性的突破,正发生在蛋白质AI、化学AI、物理模拟、机器人技术和自主系统等领域。
黄仁勋的这一论述,意在引导产业注意力从语言模型的过度竞争,转向更具差异化、更具产业价值的创新领域。
应用层:经济价值的最终落地场景
最上层是应用层,也是AI经济价值的最终产生之地。药物研发平台、工业机器人、法律助手、自动驾驶汽车等人形机器人,都是AI应用的具体体现,同样的底层架构,能够催生出形态各异、价值多元的应用成果。
值得注意的是,每一个成功的应用,都会对应用下方的每一层产生拉动作用,直至支撑应用运行的动力设备。这一传导机制,定义了五层架构的动力学特征:需求传导是垂直整合的,应用层的突破的成功,会直接转化为对底层能源、芯片、基础设施的投资需求,形成层层联动、正向循环的发展格局。
这就是黄仁勋提出的“五层蛋糕”架构:能源、芯片、基础设施、模型、应用,层层支撑、互相拉动,构成一个完整的AI工业生态。
生产力效应与就业重构:AI不是替代,而是赋能
针对公众普遍关注的AI与就业的关系,黄仁勋以放射学为案例,给出了清晰的回应,消解了人们的焦虑。
目前,AI已能辅助解读医学扫描影像,但放射科医生的需求不仅没有减少,反而持续增长。这一看似矛盾的现象,实则揭示了AI对就业的真实影响,放射科医生的核心职责是照顾患者,解读扫描影像只是放射科医生工作中的一个环节。当AI承担起更多常规性、重复性的读片工作时,放射科医生便能从繁琐的机械劳动中解放出来,专注于更具价值的判断、沟通与护理工作。
这一逻辑链条清晰展现了AI就业效应的动态复杂性,局部的任务替代与整体的就业扩张可以并存,自动化的任务与职业能力的增强能够共生。医生从读片向判断、沟通、护理的转型,正是劳动力从可编码的机械任务,向关系性能力的迁移。
AI跨越关键门槛,开源激活全产业链
在过去的一年里,AI产业跨越了一个至关重要的门槛:模型性能显著提升,具备了大规模落地应用的条件;推理能力持续增强,幻觉现象大幅减少,实际落地能力得到质的飞跃。基于AI构建的应用,首次开始创造真实的经济价值,在药物研发、物流、客户服务、软件开发和制造等领域,已展现出强大的产品市场契合度。这些应用的爆发,正对应用下方的每一层架构产生强劲的拉动效应,推动整个AI产业加速发展。
在这一过程中,开源模型发挥了关键作用。目前,全球大多数AI模型都是免费开放的,研究人员、初创公司、企业甚至国家,都依靠开放模型参与到先进AI的研发与应用之中。当开放模型达到前沿水平时,开放模型改变的不仅仅是软件领域,更是激活了整个技术栈的需求,成为推动产业发展的重要力量。
DeepSeek-R1便是典型案例。通过广泛开放强大的推理模型,DeepSeek-R1加速了应用层的普及,进而带动了底层对训练、基础设施、芯片和能源的需求增长。这一机制也揭示了AI时代开源的悖论性功能:模型权重可免费获取,但运行模型需要投入真实的算力与能源,因此开源不仅不是基础设施投资的替代方案,反而成为了基础设施投资的加速器。
写在最后
当我们将AI视为必不可少的基础设施时,AI对世界的深远影响便清晰可见。AI始于Transformer大语言模型,但AI的意义远不止于此——这是一场深刻的工业变革,正重塑着能源的生产与消耗方式、工厂的建造模式、工作的组织形式,以及全球经济的增长路径。
AI工厂正在全球范围内兴建,因为智能已实现实时生成;芯片正在被重新设计,因为能源转化效率决定了智能的扩展速度;能源成为AI发展的核心要素,因为能源从根本上决定了智能的生产规模上限;应用层加速迭代,因为底层模型已跨越关键门槛,具备了大规模落地的条件。五层架构相互强化、层层联动,推动AI产业进入高速发展期。
当下,我们仍处于AI发展的早期阶段:大部分基础设施尚未建成,大部分劳动力尚未接受相关培训,大部分产业机遇尚未被发掘。但发展方向已然明确,AI正在成为现代世界的核心基础设施,而我们此刻的选择、构建的速度、参与的广度,以及如何负责任地部署AI,将直接决定产业走向。
在这样的时代背景下,凝聚全球共识、汇聚顶尖力量、共绘技术蓝图变得尤为重要。作为AI领域的标杆性行业盛会,NVIDIA将于美国当地时间2026年3月16日至19日,在美国圣何塞及线上同步举行大会。让我们共同聚焦这场盛会,携手探索下一代AI的无限可能。

评论
更多评论