近日,微软与“免费数字图书馆计划”Project Gutenberg合作,利用人工智能技术为电子书库制作了超过5000本免费有声书。这一项目结合了机器学习、自动文本选择和自然语音合成等AI技术,实现了电子书的自动语音转换。 据悉,项目团队首先开发了一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等。然后,使用WaveNet、Tacotron和FastSpeech等文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。 微软表示,此次计划已收集整理了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品。这些语音数据将以开源方式免费提供。用户也可以用自己录制的少量语音,生成“用自己的声音朗读整本书”的效果。这一项目丰富了网站有声书的内容,同时也为视障人士提供了便利。
评论