中关村在线

网络设备

Google推出低流量安卓语音转字幕应用

Google推出Android语音转字幕应用程序Live Transcribe,以帮助听障人士与外界沟通,并进一步公开其设计细节。这个应用程序使用了当前Google云端自动语音辨识(Automatic Speech Recognition ,ASR)技术,以及设备上机器学习,并且与专为聋人和弱听人士而设的高立德大学合作,进行使用者体验研究。

通过自动语音辨识技术,耳聋和听力障碍人士可以更方便的接受外界的语音信息,Google在YouTube中应用自动语音辨识提供字幕,也用于简报展示以及电话拨打中。虽然这项技术在这几年已经有长足的进步,但是听障人士仍主要依赖人工手动转录服务,而这些服务价格昂贵,还需要事先安排,间接影响听障人士参与社交的机会。

Google解释过去之所以自动转录服务还无法普及的原因,除了因为应用自动语音辨识进行转录,需要计算密集的模型之外,还需要进行详尽的使用者研究以及付出高昂的访问成本,Google结合广泛的用户体体验,以及无缝且可持续连接提供服务的服务器,打造出Live Transcribe服务。

Google设计Live Transcribe其中一个重要的考量,是避免使用者消耗过多移动流量。为此,Google在移动设备上实作了类神经网络语音侦测器,并使用了大规模声音数据集AudioSet。Google提到,该网络是一个类似VGGish的图像模型,能够侦测语音,并且自动管理到云端自动语音辨识引擎的网络连接,在长时间使用的状况下,能最大程度减少移动用量。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具