腾讯今日发布了针对其混元DiT模型的加速库,该库能够显著提高推理效率,并将生成图像的时间缩短了75%。同时,使用门槛也得到了大幅降低,用户可以通过ComfyUI的图形化界面来使用混元DiT模型的能力,而无需下载原始代码库。此外,混元DiT模型已经部署到了Hugging Face Diffusers通用模型库中,用户仅需三行代码即可调用混元DiT模型。
ComfyUI是一款文生图领域的WebUI界面设计工具,它将文生图领域的扩散算法模块化与图形化相结合,提高了生成效率和资源利用率,并降低了开发者的使用门槛。通过图像化工作流,用户可以使用混元DiT文生图模型,并实现与官方模型一样的效果。
为了支持ComfyUI的使用生态,还衍生出了强大的开源社区。混元DiT对ComfyUI的支持让社区成员能够体验到基于最新DiT架构的文生图模型。
值得一提的是,在Hugging Face Diffusers中已经存在了一个支持各种主流文生图大模型的通用库,而现在混元DiT也加入了其中。这使得混元DiT成为第一个完全中文原生的DiT架构文生图开源模型。
另外,腾讯旗下的混元文生图大模型已经全面升级并对外开源,可供企业与个人开发者免费商用。该模型支持中英文双语输入及理解,并采用了与 sora 一致的 DiT 架构。
评论