Google Research近日发布了一项新的人工智能技术——InkSight,该系统能够通过模仿人类阅读过程中的学习方式来识别和提取手写字体的数字文本。与传统光学字符识别(OCR)技术相比,InkSight在处理复杂背景、模糊不清或低光照条件下的手写字体时表现更佳。
研究人员训练了AI模型以使其能够识别和模拟人类的手写字体风格,并发现当光线较暗、部分文字被遮挡或存在干扰背景时,InkSight仍能准确识别出手写字体。人类读者能正确理解由InkSight生成的描摹文本的概率高达87%,其中三分之二的描摹结果与真实手写几乎无法区分。
这项技术对喜欢用手写字的人来说具有重要意义。例如,只需将拍摄照片转换为可搜索的数字文本即可实现这一目标。对于难以辨认的手写字体而言,InkSight则将其转化为清晰准确的打印文本。
从更广泛的视角来看,这项技术对于破译以及将数个世纪以前的手写字体转换成数字形式具有重要意义。即使是那些数字化程度较低的语言,InkSight也能帮助保护手写遗产,并为这些语言的数字化提供额外资源。
值得注意的是,谷歌并非唯一一家致力于开发手写识别AI工具的公司。亚马逊Kindle Scribe电子阅读器也具备将手写字体转换为可读文本的功能。此外,Goodnotes等数字笔记应用也推出了手写识别和编辑功能,可将手写字体转换为可编辑的数字文本。
评论