中关村在线

热点资讯

阿里发布Fun-ASR1.5语音大模型:支持30语种、7大方言及智能文本整理

2026年4月20日,阿里通义实验室正式发布语音识别大模型Fun-ASR1.5。该模型采用统一的大模型架构设计,单一体系即可实现对30种语言、汉语七大方言以及20余种地方口音的全覆盖识别,同时支持古诗词吟诵等特殊语境下的高精度转写。

实测数据显示,在典型方言应用场景中,模型的字错误率较前代下降56.2%;其中5种方言识别准确率已超过90%,另有15种方言准确率突破80%。

Fun-ASR1.5还集成了智能化语音内容整理功能:可自动为连续语音输出添加合理标点,将口语表达中的数字、日期、金额、手机号等信息统一规范化为标准书面格式。在会议纪要生成、采访录音转录、司法笔录整理等实际业务场景中,显著降低人工校对负担。

用户可通过阿里云百炼平台调用模型API接口,也可登录魔搭社区免费在线体验Fun-ASR1.5的全部功能。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具