近日,商汤科技推出“日日新融合大模型交互版”(SenseNova-5o),并提供实时音视频对话服务。该模型具备实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能够实现AI与人类更自然、更流畅的交流。同时,商汤还优化了配套的Realtime API服务,以实现与RTC网络的结合,在任何环境下都能稳定、实时、流畅地进行音视频对话和沟通。
“日日新融合大模型交互版”的亮点包括支持超长多模态交互记忆不少于5分钟,持续跟踪和积累与用户的交互信息来不断完善对用户需求的理解;当前的交互延迟缩短至2秒以内,并宣称“与人类自然交流几乎无差”;支持随时打断、持续对话和根据上下文引导新话题;还可以根据用户偏好,个性化设置交流风格和使用习惯(如人设、语气等);此外,“日日新融合大模型交互版”还能帮助家长辅导孩子作业。
需要注意的是,以上信息仅为官方发布内容,并未说明具体使用方式及限制条件等事项。
评论