阶跃星辰昨日于其官方公众号宣布,正式推出名为Step-1o的千亿参数端到端语音大模型,该模型被誉为“国内首个”此规模级别的端到端语音大模型。
据阶跃星辰详细阐述,传统语音模型大多遵循级联方案,这一过程中,用户的语音信息需先转换为文本,再二次加工为语音输出。
这一繁琐的步骤不仅大幅降低了信息传输的效率,还不可避免地在转换过程中损失了诸如情绪等关键信息,从而导致了模型反应迟缓、回答质量与智能水平不尽如人意,以及情感表达上的空洞与刻板。
相比之下,Step-1o所采用的端到端语音方案,实现了语音理解与生成的一体化,极大地提升了模型的智商与情商表现。
Step-1o不仅支持语音、文本等混合形式的输入输出,更具备快速反应与随时打断的能力。它能深度理解并精准模仿音色、韵律、方言以及个性化的口语表达习惯等声音特征。
此外,Step-1o还能通过持续自学与模仿,不断优化回复质量,既能为用户提供解决问题的专业建议,也能作为高情绪价值的陪伴者。同时,它还继承了阶跃星辰语言大模型的卓越创作能力。
阶跃星辰还透露,Step-1o近期将接入跃问App端,为用户提供实时的语音通话服务,这将为用户带来更为便捷与智能的交互体验。
评论