Meta公司近日研发了一款名为“SceneScript”的视觉模型。这款模型采用可编程语言,能够快速建立场景,并实时推断房间的几何形状。同时,该模型还能够将相关数据转换为建筑学层面的近似值。
据Meta公司官方新闻稿介绍,SceneScript方法高效且轻量,在室内3D模型生成方面具有出色表现。只需占用数KB内存即可生成清晰完整的几何形状,并且这些数据表示具有“可解释性”,用户可以轻松阅读和编辑这些数据。
开发人员在设计SceneScript时借鉴了大语言模型“预测单词”的原理。以Llama模型为例,它可以根据前面的单词来预测句子的下一个单词。同样地,SceneScript也采用了类似概念,通过前序输入内容推出后文,并使用这些建筑学层面的描述重建出复杂的室内3D环境。
这一创新性的视觉模型有望为建筑行业带来全新的设计理念和工具,帮助设计师更加高效地创建室内空间。同时,这也将促进数字化技术在建筑领域中的应用,使得建筑过程更加智能化、可持续化。
评论