近日,谷歌旗下的 DeepMind 团队推出了一款名为 Genie 的全新 AI 模型。这款模型具有 110 亿个参数,能够根据用户输入的一张图片和提示词来生成较为完整的 2D 平台游戏。
Genie 是通过网络上超过 20 万小时的 2D 游戏视频进行训练的,目前仍处于研究预览阶段。这些游戏更像是 2D 平台游戏,而不是完全的 VR 游戏。
据团队评论称,Genie 由一个时空视频标记器、一个自回归动力学模型和一个简单且可扩展的潜在行动模型组成。值得一提的是,在无监督和无标签视频情况下进行训练时,Genie 能够学习各种角色的动作、控制和行动,并以一致的方式进行学习。
对于用户来说,基本上只需提供一张纸上的草图、一幅完美的数字艺术作品,甚至是人工智能对二维世界的描述,Genie 就能完成剩下的工作并生成 2D 游戏。它不仅能生成图像和其他资产,还能将用户的草图变成一个完全实现的开放世界,并根据玩家提供的操作预测下一个像素帧。
推文中提到了负责人 Tim Rockt?schel 和 Generative Interactive Environments(互动生成环境)这个项目。
评论