【中国,东莞,2024年6月21日】今天,华为开发者大会2024(HDC 2024)在东莞篮球中心隆重揭幕。这是一场华为面向全球开发者的年度旗舰盛会,包含丰富多样的主题演讲、峰会、专题论坛、互动体验以及数百场面向开发者的特色活动。华为携手各领域客户及伙伴,全面分享了HarmonyOS、盘古大模型、昇腾AI云服务、GaussDB数据库等最新科技创新成果,探讨如何以科技创新为驱动,在鸿蒙生态和大模型技术中心把握新机遇,构建智慧未来的新商业蓝图。
在今天下午举行的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型5.0,在全系列、多模态、强思维三个方面全新升级;张平安还分享了盘古大模型在自动驾驶、工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域的丰富创新应用和落地实践,持续深入行业解难题。此外,华为诺亚方舟实验室主任姚骏、华为云CTO张宇昕分别就盘古大模型5.0技术解密和华为云全栈系统性创新发表主题演讲,详细解读华为云在AI领域的全栈创新优势。
华为常务董事、华为云CEO张平安发布盘古大模型5.0
盘古大模型5.0发布,三个方面全新升级
本次发布的盘古大模型5.0,在全系列、多模态、强思维三个方面带来全新升级:
全系列:盘古大模型5.0包含不同参数规格的模型,以适配不同的业务场景。十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、高效率的推理场景;千亿级参数的Pangu U系列适用于处理复杂任务;万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。
多模态:盘古大模型5.0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。在图片和视频识别方面,可支持10K超高分辨率;在内容生成方面,采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。
强思维:复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索深度结合,极大地提升了数学能力、复杂任务规划能力以及工具调用能力。
盘古大模型持续解难题做难事,重塑千行万业
张平安强调,一直以来,华为云盘古大模型都坚定的聚焦行业,在解难题、做难事的道路上不断攻坚克难,砥砺前行,重塑千行万业。华为云将与所有的客户、伙伴和开发者一起,创新不止,攀登不止,让云无处不在,让智能无所不及,加速千行万业的智能升级。
华为常务董事、华为云CEO张平安
在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、400多个场景中落地,在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥着巨大价值,重塑千行万业。
在自动驾驶领域,盘古大模型5.0通过创新的可控时空生成技术,结合场景视频生成、4D BEV视频生成、自动驾驶仿真库及路网信息,能更好地理解物理规律,大规模生成和实际场景相一致的驾驶视频数据,还可以灵活增加控制条件,生成不同路况、不同光照、不同天气的训练视频数据,加速自动驾驶技术的快速成熟。
在工业设计领域,以新车造型设计为例,周期一般需要1-2年,盘古大模型可以让汽车的造型设计时间大幅缩短。造型设计师可以将自己的灵感,通过对话、画图与大模型交互,生成3D汽车数字模型,并可进行风格化调整、零部件编辑、颜色更换等。盘古大模型生成的数字模型还可直接输出成3D文件,支持10几种主流格式,设计师可以直接3D打印成样品,减少制作油泥模型的轮次,极大地节省成本和时间。
除了汽车造型设计,盘古大模型还可以用于汽车的工装设计、模具设计,以及电子产品领域的工业设计等。华为云与东莞市政府共同打造了东莞市人工智能大模型中心,希望让当地更多的电子制造类企业使用到盘古大模型的工业设计服务。
在建筑设计领域,基于盘古大模型的可控生成能力,只需输入设计的黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频;基于盘古3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短到数十分钟,助力建筑师创造出更加出色的建筑作品。
在具身智能领域,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。
在媒体内容生产和应用领域,盘古大模型能够将实拍视频快速转换成特定风格的动漫,并保持角色样貌特征前后一致,舞蹈、武打等大运动轨迹也能确保合理一致的视觉效果;能自动将视频译制成不同语言,并保留原始角色的音色、情感、语气;将译制配音、动漫生成等场景的制作周期从月级缩短到天级,大大提升制作效率,作品一次拍摄多元化制作,实现价值最大化;还能通过AI翻译和拟人化语音合成能力,实现AI同声传译,让云会议、视频通话等可以实现母语交流体验。
在铁路领域,全国每天需要检测的动车大概有3.2万节车厢,过去需要大量的巡检工人在凌晨时段去完成,耗时耗力。如今结合盘古大模型和巡检机器人,可精准识别一列动车的3.2万个项点,覆盖8大类、350多种复杂故障,帮助高铁提升运营效率,降低成本,减少人工在凌晨时段去巡检的艰辛作业。
在钢铁领域,以上海宝武钢铁热轧生产线为例,每次调整生产钢板的种类和尺寸,都需要工程师重新调整7道精轧机组的300多个参数,需要耗费约5天的时间。盘古大模型能够对最优参数进行预测,显著降低热轧生产线调优时间,并提高预测精度和钢板成材率。目前盘古大模型目前已在宝钢1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。此外,盘古大模型还将应用于高炉场景,对炉温、铁水温度、硅含量等炉况进行仿真,从而辅助高炉精准控制,充分利用每一分能源,降低能源成本。
在气象领域,华为云联合深圳市气象局,在分辨率为25公里的全球模型基础上,融合区域高质量气象数据集,升级了分辨率分别为1公里、3公里、5公里的区域预报能力,包含气温、降雨、风速等气象要素。不仅如此,今年华为云还联合天融环境打造了环境大模型,将污染六项的预测准确度全面提升10%以上。
在医药领域,天士力基于盘古大模型打造“数智本草大模型”。一方面基于盘古L0能力,学习训练了378万篇文献等数据,尤其是学习了1000多本古籍,从古方古籍和现代文献中总结出知识和经验,可以赋能方剂筛选和优化、提升研发效率,也能辅助医生问诊。另一方面,天士力在盘古17亿化合物的药物分子大模型基础上,增训了350万天然产物分子数据,未来有望更好地优化方剂和发现新药。
除了盘古大模型的创新升级,华为云还对昇腾AI云服务进行持续优化。业界万亿参数模型训练的平均无中断时长约2.8天,昇腾AI云服务可实现40天无中断;业界平均集群故障恢复时间约60分钟,昇腾AI云服务可以缩短到10分钟,同时能将大模型的资源开通时间从月级缩短到天级,加速大模型的开发。目前昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式协助客户开发,训练,托管和应用模型,打造百模千态的“黑土地”。
华为云持续系统性创新,打造AI Native的云
生成式AI被认为是自互联网之后最大的技术变革,为千行万业带来了巨大的机遇和挑战。为了帮助客户更好地拥抱AI,华为云通过AI的全栈系统性创新,并通过AI重塑云服务,从两个方面打造AI Native的云。
华为云CTO张宇昕表示,通过全栈系统性创新,能够让大模型的数据准备、训练、推理、应用实现全流程的高效率和高性能。华为云的全栈系统性创新覆盖了数据中心、云平台架构和基础设施服务,为AI开发提供AI Native的基础设施。
华为云CTO张宇昕
当前云平台在大模型的训练和使用中通常存在“算力墙”“内存墙”“能效墙”等问题。为此,华为云打造了下一代的云基础设施CloudMatrix,改变传统数据中心的架构和算力供给模式,将传统的以CPU为中心的主从架构,演进为多元算力对等全互联架构;并通过高速互联网络协议,将CPU、NPU、GPU 等算力资源全部互联和池化,从而把AI算力从单体算力演进到矩阵算力,开启智能算力新纪元。
同时,针对云平台在大模型的训练和使用中存在的“内存墙”问题,华为云正式发布EMS弹性内存存储服务,基于Memory Pooling专利技术,通过显存扩展、算力卸载、以存代算等三大手段来打破内存墙,释放极致算力。
基于新一代云基础设施和EMS弹性内存存储服务、昇腾AI云服务等创新,华为云已经在贵安、乌兰察布和芜湖,构建了三大AI算力中心CloudOcean;同时也在华北、华东、华南等热点区域部署了AI算力资源池CloudSea;还通过华为云CloudLake和CloudPond边缘云平台,将AI算力推到客户身边,提供最低时延的AI训推服务。由此,华为云打造了云、网、边、端协同的AI Native的算力平台,提供给开发者、客户和伙伴使用。
盘古大模型也是基于华为云的AI平台开发。会上,华为诺亚方舟实验室主任姚骏从数据高效、参数高效和算力高效三个方面介绍了盘古大模型5.0的训练过程。他表示,数据合成技术已成为未来构建大模型核心竞争力的关键抓手。盘古大模型依托weak2strong数据合成技术,强化长序列、复杂推理等高阶数据分布。同时,结合类人的阶梯式数据课程,让模型以更加像人的方式从易到难地学习知识,实现更加可控、可预期的能力涌现。
华为诺亚方舟实验室主任姚骏介绍盘古大模型5.0关键创新
同时,华为云对AI 开发生产线ModelArts进行升级,在AI开发基础设施和流水线之上,构建了大模型即服务平台 ModelArts Studio,提供百模千态的第三方大模型托管服务,支持对大模型定制开发,并提供相应的工具和行业集成套件,让客户可以方便的将大模型与业务系统结合。
除了系统性创新,华为云还将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云CodeArts、DataArts、MetaStudio和GaussDB、云安全等系列云服务的智能化上。将华为云的服务重塑和升级,从而更智能、更高效。
在软件开发方面,华为云通过结合AI Agent能力,将CodeArts软件开发生产线从单点智能升级到项目级智能,大幅提升了问题定位率和项目级问题修复成功率,让开发者能轻松实现项目级智能。
在数据治理方面,华为云将盘古大模型和华为多年数据治理经验相结合,让不熟悉IT技术的业务人员、管理人员可以通过自然语言交互的方式,快速获取需要的数据,形成可视化的图表,直接高效的管数、用数。
在数字内容生产方面,华为云将盘古媒体大模型和华为有着深厚积累的音视频编解码、3D模型物理仿真、图形渲染等引擎能力相结合,一起用于AI内容生成。这样生成的数字内容更符合物理世界的规律,并且可以实现任意时长的实时互动,突破了当前AIGC的局限。
在数据库方面,华为云将产品文档、专家知识、运维经验等数据库专业数据和大模型相结合,构建盘古数据库大模型,让GaussDB数据库在开发、测试、迁移、运维等全生命周期实现智能化,显著提升开发人员和DBA的使用效率。
在安全方面,华为云打造了面向安全领域的盘古安全大模型,能够快速、精准地给出安全治理咨询的专业意见,让企业安全更加智能。
构建新生态,给全球开发者更优选择
华为云是华为公司面向开发者的统一底座,目标打造昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等各项根技术的生态,给广大开发者一个更优的选择。
为了让开发者更好地学习和使用这些技术,华为云为每个新生态的开发者免费提供一台云主机、一套开发工具和5GB的云存储空间。华为还在Chaspark网站上提供了开放的专利搜索工具-查思专利,开发者可以免费查询到全球近1.9亿件专利数据,与华为共同进步与成长。同时,张平安宣布推出华为开发者布道师计划,未来3年计划发展超过3000名 华为开发者布道师,用最优秀的人培养更优秀的人。
此外,华为开发者大赛2024赛季也宣布正式启动。大赛以“创想无限” 为主题,设置了应用创新和算法挑战两个赛道,围绕AI应用、云原生、鸿蒙等方向,鼓励开发者基于华为开放能力进行创新,解决千行万业的实际问题。
未来两天,华为云还将带来丰富的专题论坛、圆桌论坛,以及Codelabs、极客挑战赛、扫地僧见面会等开发者实操活动,开发者可以和华为专家面对面,共同碰撞技术创新的火花。
评论