Google I/O 大会：谷歌推出通用翻译器的配音和口型同步扬声器-中关村在线

Google I/O 大会：谷歌推出通用翻译器的配音和口型同步扬声器

牛饼干

原创

2023-05-11 • 优质手机领域创作者

关注

谷歌正在测试一种功能强大的新翻译服务，该服务可以将视频翻译成一种新语言，同时还可以将说话者的嘴唇与他们从未说过的话同步。但谷歌强调了对滥用的可能性以及为防止滥用而采取的措施。

“通用翻译器”在谷歌 I/O 大会上由 James Manyika 展示，他负责公司新的“技术与社会”部门。它被作为一个例子，说明最近才因人工智能的进步而成为可能，但同时也带来了必须从一开始就必须考虑的严重风险。

“实验”服务采用输入视频，在这种情况下是最初用英语录制的在线课程的讲座，转录语音，翻译它，以该语言重新生成语音（匹配风格和语气），然后编辑视频，使说话者的嘴唇更接近新音频。

所以它基本上是一个 deepfake 生成器，对吧？是的，但在其他地方用于恶意目的的技术具有真正的实用性。实际上，现在媒体界有一些公司在做这种事情，出于十几个原因在后期制作中重新配音。（演示令人印象深刻，但必须说技术还有很长的路要走。）

但这些工具是在严格的媒体工作流程中提供的专业工具，而不是 YouTube 上传页面上的复选框。Universal Translator 也不是——但如果真的如此，谷歌需要考虑它被用来制造虚假信息或其他不可预见的危险的可能性。

Manyika 称这是“大胆与安全之间的紧张关系”，要取得平衡可能很困难。但很明显，它不能只是广泛发布，让任何人都可以不受限制地使用。然而好处是，例如提供 20 种语言的在线课程，没有字幕或重新录制——是不可否认的。

“这是学习理解的巨大进步，我们在课程完成率方面看到了可喜的成果，”Manyika 说。“但这里存在一种内在的紧张关系：一些相同的底层技术可能会被不良行为者滥用来制造深度造假。因此，我们构建了带有护栏的服务以防止滥用，并且我们只允许授权合作伙伴访问它。很快我们将把水印方面的新创新整合到我们最新的生成模型中，以帮助应对错误信息的挑战。”

展开全文