百度最近宣布,其文心一言语音定制功能已经上线。这一技术能在2秒钟内完美重建任何一个人的声音,使每个人都能拥有自己的AI声优。用户只需打开文心一言App,选择创建智能体,点击创建自己的声音,随后系统会给出一句话,用平时说话的语气念一遍即可。约2秒左右就能获得与真人无异、流畅自然的合成效果,并且合成音频能完美保持朗读这句话时的情感、风格和自然度。此外,用户还能构建自己的个性化音库并搭配虚拟形象快速打造出一个数字分身。
该功能对不同性别、不同年龄的人均适用,尤其是小孩和重口音的兼容效果非常出色。不仅如此,百度新技术还具有较强的抗噪能力,在原始录制音频背景嘈杂的情况下仍然能获得流畅且干净的合成效果。
据百度介绍,之所以能在2秒钟内复刻声音是因为其语音合成新技术能够真正理解文本和声音的对应关系。甚至有时候还能理解文本中的情绪,最大程度地保持原声的情感、风格和自然度。因此,只需要极短的样本量,几秒钟就能完成整个过程。这项技术对行业而言是一个重大突破,它将为语音交互应用带来全新的体验,并在社会生活中得到广泛应用。
评论