2026年5月9日,DeepSeek正式向更广泛用户开放其识图模式,结束此前的灰度测试阶段。此举标志着该平台首次具备原生图像理解能力。新功能涵盖图片内容识别、联网增强式问答以及一键截屏提问等核心能力,可精准解析图像中的文字、表格、数学公式等结构化信息。
DeepSeek V4版本于4月24日上线,初期仅支持文本输入与处理,由此引发业界对其多模态演进路径的高度关注。此次识图模式全面开放,有效弥补了其在视觉理解领域的关键能力空白,使整体技术能力迈入与国际主流多模态平台相当的水平。
根据前期灰度测试反馈,识图模式以模块化方式深度集成于V4主模型架构之上,在文档OCR识别、图表信息提取、基于图像的交互问答等典型应用场景中表现稳定且准确。与此同时,公司正推进新一轮融资,目标金额为五百亿元,并计划于下月推出V4.1版本更新。

评论
更多评论