微软在 Beta 频道中向 Windows 11 用户推出了 Microsoft Edge 浏览器 141.0.3537.13 版本,其中新增了一项 AI 视频实时音频翻译功能。该功能可在观看视频时对音频进行即时翻译,目标语言包括西班牙语、韩语和英语,但使用该功能需满足一定硬件条件,即至少 12GB 内存和四核 CPU。
这项功能目前仍为预览版,部分用户即使已更新至 Beta 频道的最新版本,也可能无法立即启用该功能。其对系统资源的消耗较大,启用时会持续占用大量内存,可能对其他应用程序的运行造成影响。测试显示,即便设备拥有 16GB 内存,Edge 在运行翻译功能时仍会占用近 12GB 的可用内存。
在实际测试中,该功能已能在 YouTube 视频中使用。启用后,Edge 会自动下载 AI 模型,并对原视频音频进行静音处理,同时生成翻译后的音轨。整体翻译延迟较低,但翻译内容的准确性仍有待进一步验证。
此外,测试还发现,即使视频中仅有一位发言者,AI 也可能在某些片段中生成不同性别的音轨。推测原因可能是 AI 将原声中的音调变化识别为不同人物的语音特征。

评论
更多评论