OpenAI近日公布了一款名为sCM的新型AI文生图方案。与传统扩散模型相比,sCM只需要两个步骤就能生成高质量样本,并且其生成的样本质量能与业界较为强劲的扩散模型相媲美,为AI文生图提供了一种新的方案。
目前,业界通常使用扩散模型来生成图片和音视频。然而,传统扩散模型的取样过程通常缓慢,需要数十到数百个逐步降噪的过程才能生成高质量样本(例如小伙伴们在SD“炼丹”绘图时就需要等待很长的降噪时间)。这使得相应模型效率低下,不适合商业化应用。
虽然现在已经有一些技术通过复杂训练过程来提高扩散模型的速度,但无非就是利用更复杂的训练方式来提纯模型或降低输出样本的质量以提升效率。
而OpenAI的研究团队则提出了一种名为sCM的文生图方案。该方案绕开了传统扩散模型范畴,并声称只需两个取样步骤即可生成与扩散模型质量相当的高分辨率样本,大大缩短了生成时间。
根据报道,sCM训练方法主要利用预训练扩散模型蒸馏出来的知识直接构建模型,宣称能够在保持高质量样本生成的同时缩短取样时间。
研究人员使用ImageNet 512x512数据集对sCM进行了实验,并取得了令人满意的成果。他们声称能够使用sCM方法来训练出细节丰富且高质量的图像,在高分辨率生成方面具备出色能力。
尽管sCM只需要两个取样步骤,但生成的样本质量仍然接近业界最佳的扩散模型,并且其差异不到10%。这表明sCM是一种非常具有潜力和实用性的文生图方案。
(注:本文内容由OpenAI官方发布)
评论