中关村在线

热点资讯

AI公司"偷窃"超10万个视频:只为训练模型

据404 Media的报道,人工智能驱动的工具和应用程序所生成的内容给人留下了深刻印象。然而,这些人工智能公司是如何获得数据来训练他们的模型呢?

据报道,一家名为Runway的人工智能视频生成公司,在未得到创作者或YouTube许可的情况下,使用了大量的视频进行训练,同时还利用盗版内容来训练他们的AI模型。他们收到一份电子表格,列出了视频的来源以及数量,这些视频来自各大新闻媒体以及频道,总数超过10万个。

一位不愿透露姓名的前员工向404 Media透露:“该电子表格中的频道是全公司范围为寻找高质量视频用于训练模型而做出的努力。之后,这些视频会被爬虫下载下来,并且我们还使用了代理以避免被谷歌阻止。”

根据最新调查结果显示,由AI驱动的工具和应用程序所生成的内容无疑给人留下了深刻的印象。但人们不禁要问:这些人工智能公司从何处获得数据来训练它们的模型呢

据了解,有一家名为Runway的人工智能视频生成公司在未经创作者或YouTube许可的情况下,利用大量视频进行了训练,并且还利用盗版内容来培训其AI模型。据悉,他们收到了一个包含视频来源和数量等详细信息的电子表格,这些视频来自于不同新闻机构和频道共计超过十万个。

一位不愿透露姓名的前员工向我们揭示了更多细节:“这个电子表格包含了所有我们公司寻找高质量视频以便进行模型训练所做出的努力。之后,这些视频被通过爬虫技术下载到服务器中,并且我们还采取了各种措施以确保不会被谷歌或其他平台屏蔽。”

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具