阿里通义千问开源两款语音基座模型：SenseVoice和CosyVoice

拿铁不加冰

原创

07-09

7月9日，阿里云通义千问宣布开源了两款语音基座模型：SenseVoice和CosyVoice。SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测，特点包括支持超过50种语言的多语言识别能力，在测试数据上达到和超过目前最佳情感识别模型的效果，并具备优秀的声音事件检测能力。另一方面，CosyVoice同样支持多语言、音色和情感控制，表现出色的功能包括多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟随等。

值得一提的是，与开源的情感识别模型进行对比，SenseVoice-Large模型可以几乎在所有数据上达到最佳效果，而SenseVoice-Small模型同样可以在多数数据集上超越其他开源模型。这两款优秀的语音基座模型为开发者们提供了一种便捷的方式来进行语音技术开发。

相关链接：

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X100 Ultra(12GB/256GB)

vivo X100 Ultra(12GB/256GB)

3952人评分

80%好评

HUAWEI Mate 60（12GB/256GB）

HUAWEI Mate 60（12GB/256GB）

2189人评分

79%好评

Redmi K70至尊版(12GB/256GB)

Redmi K70至尊版(12GB/256GB)

264人评分

79%好评

荣耀X50（8GB/128GB）

荣耀X50（8GB/128GB）

8635人评分

79%好评

苹果iPhone 15（128GB）

苹果iPhone 15（128GB）

6093人评分

76%好评

评论

更多评论

读过此文的还读过

点击加载更多

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具