EMO终于来了！通义APP推出照片唱歌功能：所有用户可免费使用

散落的星星沙

原创

04-25

近日，阿里通义实验室开发的AI模型EMO正式推出通义APP，并对所有用户免费开放。该模型能将音频和照片输入AI模型，实现人物开口唱歌或说话的功能。例如，可以让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子等。

EMO背后的肖像说话技术是当前大热的AIGC领域中的弱控制设计。该技术无需建模就能驱动肖像开口说话，不仅降低了视频生成成本，还提高了视频生成质量。EMO学习并编码了人类表达情绪的能力，能将音频内容和人物的表情、嘴型匹配，并在人物微表情上反映出音频的语气特征和情绪色彩。

今年2月底，通义实验室公布了相关论文后，EMO成为最受关注的AI模型之一。现在，通义APP使所有人都能免费体验这一前沿模型的创造力。未来，EMO技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等领域。

近期，通义APP还陆续推出了超长文档解析、AI编码助手、AI会议助手等实用功能。通义大模型正在成为越来越多用户的超级AI助手。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



HUAWEI Pura 70(12GB/1TB)

HUAWEI Pura 70(12GB/1TB)

10人评分

77%好评

OPPO Find X7 Ultra(12GB/256GB)

OPPO Find X7 Ultra(12GB/256GB)

117人评分

94%好评

苹果iPhone 15（128GB）

苹果iPhone 15（128GB）

34人评分

68%好评

iQOO Z9 Turbo(12GB/256GB)

iQOO Z9 Turbo(12GB/256GB)

2人评分

67%好评

vivo S17（12GB/256GB）

vivo S17（12GB/256GB）

11人评分

94%好评

评论

更多评论

读过此文的还读过

点击加载更多

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具