商汤科技于7月5日发布了其最新的人工智能(AI)大模型体系“日日新 SenseNova 5.5”,并推出国内首个所见即所得模型“日日新 5o”。这款全新的AI交互模式,基于声音、文本、图像和视频等多种形式的跨模态信息,“日日新 5o”能听、会看、更会找话题,就如同“真人聊天一般”。这种交互模式适用于实时对话和语音识别等应用,并且能够在同一模型中自然处理多种任务。
据了解,“日日新 5o”的训练基于超过10TB高质量训练数据,包括大量高质量的人工合成数据,构建了高阶思维链。模型采用混合端云协同架构,拥有6000亿参数,并可最大限度发挥云边端协同能力,达到每秒109.5字的推理速度。
除了“日日新 SenseNova 5.5”,商汤科技还在世界人工智能大会上推出了首个“可控”人物视频生成大模型Vimi。通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。
以上就是商汤科技最新发布的产品和技术介绍。
评论