中关村在线

热点资讯

新能力|标贝科技语音合成支持数理化公式等复杂数字符号的自然朗读

“哪里不会点哪里,妈妈再也不担心我的学习了,soeasy!”

当年这段广告词可谓洗脑神句传遍大江南北,点读机作为教育场景的典型电子产品,也一度风靡市场。

随着AI技术在教育场景的广泛应用,特别是语音交互技术丰富了学生上课体验形式。以点读机、学习机、甚至AI虚拟老师等为代表的教学方式也越来越普及。让在线教育更加智能化、个性化,有效解决了学生们差异化的学习需求。

目前,语音合成已经进入较为成熟的发展阶段,在教学内容生产方面,可以增加配课、点读等有声教学素材,甚至可以取代部分真人对话的教育内容,大大降低教学配音的成本和周期。

例如,在语文、英语等语言学习科目中,AI虚拟老师可以通过教学视频和语音合成,生成虚拟教学内容,缓解线下教师的工作压力;学生则借助智能学习设备,扫描自己想要学习的文字或短语,听取正确的发音和语调,跟着模仿发音。

但是在数理化等科目里涉及到公式的读法时,大部分语音合成软件存在一定的难度。对于较为简单的,如数学中的加减乘除、开方、指数、三角函数等,一般语音合成软件通常可以给出正确的读法。而对于复杂的如物理、化学等领域的公式,由于这些公式中可能包含大量的特殊符号、单位和上下文信息等,需要逐字进行转换,耗费时间且准确率较低。

为了完善AI教育应用场景,标贝科技通过语音合成前端语言模型优化,实现了语音合成技术对Latex数理化公式朗读的支持,提供更好的教学体验。

什么是Latex?

LaTeX是一种基于TeX的排版系统,由美国计算机科学家莱斯利·兰伯特在20世纪80年代初期开发。 MathJax是一个跨浏览器的JavaScript库,它使用MathML、LaTeX和ASCIIMathML标记在Web浏览器中显示数学符号。

举例↓:

latex公式:

实际页面展示的公式:

标贝科技基于LaTeX公式的基本组成单元和语法规则,依托准确的词法分析和深入的句法分析技术,将复杂的LaTeX公式拆解为最细粒度的词法单元,然后将这些单元映射为能准确反映LaTeX公式层次结构的抽象语法树(AST)。

接着再建立一套规则,用于将LaTeX公式中的符号、元素和命令翻译成自然语言。通过在AST上进行遍历并应用这些翻译规则,最终成功实现从LaTeX公式到自然语言的转换。

目前,标贝科技语音合成技术能够以通俗易懂的方式朗读 LaTeX 公式,覆盖从小学到初中12年教科书中涉及到的数学、物理、化学公式。同时标贝科技还可以根据客户具体需求,定制高中及其他复杂数据符号的科目。

标贝科技前端语言模型优化定制方案

在语音合成技术中,前端语言模型主要负责对输入到语音合成系统的文本进行分析,并提取发声和韵律特征,以便声学模型根据这些特征生成对应的语音信号,是处理和生成语音信号的重要环节之一。

前端语言模型通常有一些通用方案,但是在不同的业务任务和数据特点下,通用方案无法直接将文本转化为可合成的语音信号时,就需要对前端语言模型进行改进和优化。

标贝科技可以提供前端语言模型优化定制方案,将文本中复杂的数字、符号、缩写等转换成语言文字,客户无需做二次转换,即可获得准确的发音,提高模型的性能和效果。

例如,除了支持以上LaTeX 公式类的朗读外,标贝科技还可以通过前端语言模型优化定制方案,输出对手机型号或者各类机器设备型号的正确读法。欢迎新老用户咨询体验!

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具