DeepSeek将于下周正式推出V4多模态大模型,这是继2025年1月发布R1推理模型后,该公司推出的首个重要版本升级。
V4具备原生多模态能力,可直接处理图像、视频及文本内容,并支持跨模态的生成任务。该模型定位于兼顾性能与成本效益,有望更好满足国内市场对高性价比、开源可定制AI模型的迫切需求。
随模型发布,DeepSeek将同步公开一份精炼的技术说明文档,介绍其核心架构设计与关键能力边界。
在硬件协同层面,V4已针对国产主流算力平台完成深度适配,与华为、寒武纪等国内芯片企业开展联合优化工作。此举不仅有助于提升模型在本土硬件上的运行效率,也将进一步推动AI推理环节向国产芯片迁移,带动上游半导体产业的实际应用落地。

评论
更多评论