突破性声音克隆技术VoiceEngine 预期应用广泛

海是天的倒影

原创

2024-03-31

据最新消息，OpenAI公司近日推出了一项突破性的声音克隆技术——Voice Engine。这项技术利用文本输入和15秒的音频样本，能够生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。

Voice Engine的研发始于2022年，并已在公司现有的文本转语音API和Read Aloud功能中的预设语音中应用。OpenAI认为，该技术在多个领域具有重要意义。

首先，在阅读辅助和语言翻译方面，Voice Engine提供了更加自然流畅的语音输出，从而增强了用户体验。其次，对于言语障碍患者来说，这更是一大福音。例如，在布朗大学的一个试点项目中，通过使用从学校项目录制的音频中提取的语音克隆技术成功帮助了言语障碍学生进行交流。

然而，考虑到合成语音技术可能带来的滥用风险，目前OpenAI仅对少数可信合作伙伴开放小规模测试。该公司旨在深入了解技术的潜在应用，并评估可能的风险。此外，OpenAI还采取了一系列安全措施来确保技术的安全使用。

为了追踪音频来源，OpenAI采用水印技术；同时对公司系统的使用方式进行主动监控。当产品正式推向市场时，公司将设立一个“禁止语音列表”，以检测并阻止与名人声音过于相似的人工智能生成声音，并避免潜在的版权和隐私问题。

总体而言，Voice Engine为各种应用场景带来了革命性的改变。然而，在推广这项新技术之前，我们需要认识到其中可能存在潜在的风险，并采取必要的措施来确保其安全可靠地被部署到市场上。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo S50(12GB/256GB)

vivo S50(12GB/256GB)

1人评分

96%好评

HUAWEI Mate 80(12GB/256GB)

HUAWEI Mate 80(12GB/256GB)

144人评分

80%好评

OPPO Reno15(12GB/256GB)

OPPO Reno15(12GB/256GB)

327人评分

100%好评

一加Ace 6T(12GB/256GB)

一加Ace 6T(12GB/256GB)

395人评分

100%好评

荣耀500 Pro(12GB/256GB)

荣耀500 Pro(12GB/256GB)

302人评分

80%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具