视频能“配乐” AI新作可无限生成背景音乐

散落的星星沙

原创

2024-06-19

据谷歌DeepMind最新公布的技术，其推出了一项名为“video-to-audio”的AI模型，用于为无声视频生成背景音乐。这项技术在目前仍存在局限性，需要开发者提供提示词来预先介绍可能的声音背景，而无法直接根据视频画面添加具体音效。

DeepMind的这款AI模型能够将用户输入的视频进行分解，并结合文字提示，通过扩散运算不断迭代，最终生成与视频画面协调的背景声音。例如，在输入一条描述为“黑暗中行走”的无声视频时，可以添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示，相关的模型就能够生成出具有恐怖风格的背景音效。

此外，DeepMind还表示该“video-to-audio”模型可以为任何视频生成无限数量的音轨，并且能够根据提示词的内容判断生成音频是正向还是反向的，从而使得生成出来的声音更贴近特定场景。

展望未来，研究人员正在进一步优化这款“video-to-audio”模型，并计划在未来实现让模型直接根据视频内容生成背景音乐，无需通过提示词。同时，他们还计划改善模型在视频中人物对白口型同步的能力。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



HUAWEI Mate 80(12GB/256GB)

HUAWEI Mate 80(12GB/256GB)

209人评分

80%好评

iQOO 15 Ultra（16GB/256GB）

iQOO 15 Ultra（16GB/256GB）

43人评分

98%好评

OPPO Find X9 Pro(12GB/256GB)

OPPO Find X9 Pro(12GB/256GB)

423人评分

99%好评

vivo X300 Pro（12GB+256GB）

vivo X300 Pro（12GB+256GB）

360人评分

100%好评

荣耀X70(8GB/128GB)

荣耀X70(8GB/128GB)

19人评分

78%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具