苹果发布了深度感知专业版(Depth Pro)这一全新的人工智能模型,这一突破性的模型能够在不到一秒的时间内,根据单张2D图像生成详细的3D深度图。
该论文以《Sharp Monocular Metric Depth in Less Than a Second》为标题,在单目深度估计领域引发了重大关注。整个过程仅需使用一幅图像即可推断出深度信息。与Marigold、Depth Anything v2和Metric3D v2等其他模型相比,Depth Pro在细节捕捉方面表现出色,并且只需0.3秒即可生成清晰、高分辨率的深度图,在准确性和细节上超过了其他模型。
据论文介绍,该模型由Aleksei Bochkovskii和Vladlen Koltun团队领导,声称Depth Pro是同类型中生成速度最快、最准确的系统之一。
Depth Pro在传统GPU上可以在0.3秒内生成高分辨率的深度图,创建的图片共有225万像素,并具有卓越的清晰度,能够捕捉到头发和植物等其他方法常常忽略的细节。更特别的是,它能够估测相对深度和绝对深度的能力被称为“度量深度”(Metric depth)。这意味着即使没有特定领域数据集上的广泛训练,该模型也可以做出准确预测。这对增强现实(AR)等应用来说至关重要。
目前,Depth Pro已经在GitHub平台上开源,并鼓励开发者在机器人技术、制造业和医疗保健等领域进一步探索它的潜力。
参考地址:[链接]
Hugging Face平台
补充说明:
[链接]
评论