2022年下半年,AI文生图软件首先点燃了生成式AI的热度,而后这股热潮随着ChatGPT的发布达到了巅峰。虽然最开始生成式AI的应用场景偏向娱乐创作,但很快企业就意识到了其在提升自身商业竞争力方面的作用,并尝试将生成式AI融入到不同的商业模式之中。有数据显示,到2026年,80%的企业将会使用生成式AI,并有50%的企业在边缘场景中部署各种不同的机器学习或者深度学习应用,从而提升企业竞争力。而企业在生成式AI上的支出则预计会从今年的400亿美元攀升到2027年的1510亿美元。
当下,AI更多承担的是一些简单的辅助功能,例如文生图、大纲提炼、会议总结等等,而后随着相关技术的成熟,AI助手的时代将会来临,届时AI可以帮助人们预测习惯、分析数据来采取一些简单的行动,例如智能客服、日常行程管理助手,或者帮助企业回答合规相关的问题。再之后则会迎来全功能AI的时代,AI助手可以通过互动执行复杂的任务和功能,推动企业部门自动化,并基于不同AI的数据交流,提供全方位且更精准的价值。
但无论是AI助手时代还是全功能AI时代,其基础都是将企业的数据和知识导入到现有的AI模型之上,然而由于对数据管理方式的不同,“企业”和“AI”仍然是两个相对独立的概念,因为企业数据相对更注重隐私性,但通用的AI模型则以公开数据作为基础,对此英特尔公司市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰表示,“英特尔针对这一现状提出了企业AI的概念,即通过开放的生态,实现更有规模性的、更可靠的帮助企业释放AI潜力,这是英特尔企业AI最基本的核心。”
不过不同的层级也有着不同的考量因素,企业AI对底层算力的需求要更加多样化,而且需要具备可获取性和隐私性;其次,AI基础设施要具备可扩展性和标准化,在支持私有云的同时也需要支持公有云部署;然后,软件需要具备安全和可靠的特性,理想状态下是基于公开API或者开源的软件;最后在应用生态方面,也要满足便捷和开放的需求。
全新至强6处理器提供坚实算力基础
作为企业AI的基础,算力的重要性毋庸置疑,从算力角度来看,英特尔可以提供涵盖云到边缘再到终端的多元异构算力,而针对企业AI,英特尔则在Intel Vision 2024上推出了面向的数据中心、云和边缘的下一代英特尔至强6处理器。
与前几代至强产品不同的是,至强6并非单独的产品,而是一个产品组合,包括配备能效核的英特尔至强6处理器(代号Sierra Forest)以及英特尔至强6性能核处理器(代号Granite Rapids),前者具备更高的能效,针对高密度和横向扩展工作负载进行了优化,而后者具备更高的性能、内核密度、内存和I/O创新,同时也有更高的能耗,针对计算密集型和AI工作负载进行了优化。
架构设计方面,Sierra Forest和Granite Rapids则全都采用了模块化的设计方式,通过fabric技术把模块化的die互连,从而实现更加灵活的架构。如此一来,可以将独立的计算和I/O的Chiplet实现更加灵活的组合,并借助EmiB封装技术实现高带宽和低延迟。
能效方面,Sierra Forest与第二代英特尔至强处理器相比,每瓦性能提高了2.4倍,机架密度提高了2.7倍,这样的能效提升不仅大幅减少了设备占用的物理空间,还节省了超过1兆瓦的工号,在当前国内节能减排要求日益严格的背景下,Sierra Forest无疑是一个理想的选择。
性能方面,Granite Rapids不仅能够支持MXFP4数据格式,并且在传统的FP16格式上也有性能提升,甚至能够运行700亿参数的Llama2,从而为客户带来更高的AI性能。此外,据最新消息,Granite Rapids在运行80亿参数的Llama 3模型推理时,延迟比第四代英特尔至强处理器表现出两倍的提升,并且能够以低于100毫秒的token延迟运行700亿参数的Llama 3模型推理。
携手生态合作伙伴助力数智变革
现如今,生成式AI正在重新所有企业的核心竞争力,且成为了一种不可逆的过程,相对应的,人工智能的下半场也一定是从技术突破进入到落地应用的阶段。在英特尔看来,AI策略能够落地的两大关键正是“开放”和“易部署”。“英特尔在中国始终秉承着‘水利万物而不争’的理念,尤其新的技术潮流来临、新一代技术的应用扩展之时,开放、可靠和易部署的策略对终端用户来说极为关键,这也是我们在以往每一次技术迭代过程中,与OEM、ODM、ISV、SI等在内整个生态系统合作的基础。技术并非为技术而生,而是为落地而生的。”英特尔公司市场营销集团副总裁、中国区云与行业解决方案部总经理梁雅莉表示。
多年以来,英特尔一直与中国的生态合作伙伴紧密合作,并通过一系列创新产品组合和解决方案来推动产业发展。例如在云计算领域,英特尔与金山云合作,在其第七代性能保障型云服务器X7中引入了第四代至强可扩展处理器进行了针对性优化,同时针对Stable Diffusion、Llama2和ChatGLM2三款主流大模型进行了调优,并发布了优化的模型镜像。相比优化前的模型,由英特尔AMX优化后的Stable Diffusion推理性能提升高达4.96倍,而在开源大语言模型Llama2和ChatGLM2模型上则实现了2.62倍和2.52倍的性能提升。
同样是在云计算领域,英特尔则与京东云展开了诸多AI场景的落地尝试,例如在智能营销方面,京东实现了可以根据产业洞察和带货思维进行服务的数字人,且成本极低;在智能客服方面,京东则利用AI技术实现了拥有超大服务量并且具备多模态理解能力的智能客服,这些大模型应用和云服务的背后正是基于英特尔至强可扩展处理器的云基础设施。性能方面,相较基于京东定制化第四代至强可扩展处理器的服务器平台,基于第五代至强可扩展处理器的京东云新一代云服务器整体性能提高了23%。
在智能制造领域,TCL华星则在英特尔的赋能下实现了生产效率的提高和成本的降低。具体来说,TCL华星通过英特尔的端边技术能力,成立了TCL华星光电与英特尔智能制造联合实验室,实现了设备端取图、端边计算、终端显示、结果反馈等闭环方案的打通。同时,在生产线检测体系和智慧物流中,TCL华星借助英特尔提供的硬件产品和“云边端”架构,降低了人力和设备配置成本,大幅提高了产品良率。
在生命科学领域,传统的制药流程往往需要10年以上的周期和庞大的研发成本,英矽智能与英特尔合作优化的PandaOmics平台可以为医院的医生、科研机构的研究者,以及药企的研发人员提供有效支持,在英特尔酷睿Ultra7以及基于第五代英特尔至强可扩展处理器的算力支持之下,可以加速从靶点发现、小分子生成到临床结果预测等整套的药物研发流程,实现制药流程的降本增效。
最后,在教育领域,华东师范大学则在英特尔的赋能之下开发了OpenEdu4ALL大模型应用平台,其不但可以显著提升教师备课效率,提高备课质量,还能有效提升教师的数字素养,实现智慧教育。
从上世纪的理论探索再到如今的生成式AI热潮,人工智能正在重塑生活与社会。作为领先的半导体制造商,英特尔多年来一直致力于通过开放、可扩展的软硬件平台以及端到端的解决方案,助力企业释放数据潜能。如今,随着AI时代的到来,英特尔也在以开放、易部署、可扩展、可靠为核心,凭借全栈的数据中心产品组合,为千行百业的加速创新赋能。
[SS1]Title TBD
[SS1]Title TBD
评论