中关村在线

热点资讯

阿里通义千问开源两款语音基座模型:SenseVoice和CosyVoice

7月9日,阿里云通义千问宣布开源了两款语音基座模型:SenseVoice和CosyVoice。SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测,特点包括支持超过50种语言的多语言识别能力,在测试数据上达到和超过目前最佳情感识别模型的效果,并具备优秀的声音事件检测能力。另一方面,CosyVoice同样支持多语言、音色和情感控制,表现出色的功能包括多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟随等。

值得一提的是,与开源的情感识别模型进行对比,SenseVoice-Large模型可以几乎在所有数据上达到最佳效果,而SenseVoice-Small模型同样可以在多数数据集上超越其他开源模型。这两款优秀的语音基座模型为开发者们提供了一种便捷的方式来进行语音技术开发。

相关链接:

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具