中关村在线

热点资讯

突破性声音克隆技术VoiceEngine 预期应用广泛

据最新消息,OpenAI公司近日推出了一项突破性的声音克隆技术——Voice Engine。这项技术利用文本输入和15秒的音频样本,能够生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。

Voice Engine的研发始于2022年,并已在公司现有的文本转语音API和Read Aloud功能中的预设语音中应用。OpenAI认为,该技术在多个领域具有重要意义。

首先,在阅读辅助和语言翻译方面,Voice Engine提供了更加自然流畅的语音输出,从而增强了用户体验。其次,对于言语障碍患者来说,这更是一大福音。例如,在布朗大学的一个试点项目中,通过使用从学校项目录制的音频中提取的语音克隆技术成功帮助了言语障碍学生进行交流。

然而,考虑到合成语音技术可能带来的滥用风险,目前OpenAI仅对少数可信合作伙伴开放小规模测试。该公司旨在深入了解技术的潜在应用,并评估可能的风险。此外,OpenAI还采取了一系列安全措施来确保技术的安全使用。

为了追踪音频来源,OpenAI采用水印技术;同时对公司系统的使用方式进行主动监控。当产品正式推向市场时,公司将设立一个“禁止语音列表”,以检测并阻止与名人声音过于相似的人工智能生成声音,并避免潜在的版权和隐私问题。

总体而言,Voice Engine为各种应用场景带来了革命性的改变。然而,在推广这项新技术之前,我们需要认识到其中可能存在潜在的风险,并采取必要的措施来确保其安全可靠地被部署到市场上。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具