近日,豆包官方微信公众号发布消息称,豆包App正式上线了实时视频通话功能。用户在拨打电话的界面中开启视频画面后,豆包能够根据实际场景与用户展开实时问答互动。这一功能使模型可以同时融合视觉与语言输入,实现更加深入的综合分析与内容生成。
据官方介绍,此次功能升级依托于豆包所采用的视觉推理模型,不仅提升了其在工作、学习和生活中的实用价值,还支持联网搜索以解决用户遇到的各种问题。用户只需通过视频对话的方式,即可随时与豆包进行交流。
用户如需使用该功能,只需将豆包App更新至最新版本,在App的对话界面中选择“打电话”按钮,随后点击右侧的“视频通话”选项,即可开启与豆包的视频互动。
值得关注的是,在此前举办的FORCE LINK AI创新巡展活动中,火山引擎已展示了豆包1.5版的视觉深度思考模型。而本次豆包App新增的视频通话功能,正是该模型在视频理解与视觉推理等方面能力的一次具体实践与应用。

评论
更多评论