最近,一个新的SD加速模型——PCM已经可以使用了。这个模型不仅解决了原来LCM模型的各种问题,还对AnimateLCM进行了优化,使得直接使用PCM生成动画也能保证质量。
以下是PCM针对LCM原有问题的改进点:
CFG规模接受度:LCM模型在处理CFG(Controlled Fusion Guidance,控制融合引导)规模时存在限制,仅能接受小于2的值,超过这个值可能导致图像过度曝光。PCM改进了这一点,允许更大的CFG值,从而扩展了模型的应用范围并可能提高了图像的动态范围。
推理步骤一致性:LCM在不同推理步骤下可能产生不一致的结果,这在推理步骤设置不当时尤为明显,可能导致输出图像模糊。PCM通过改进算法,使得在不同推理步骤下都能产生一致且清晰的结果。
分布一致性:LCM的损失项在低推理步骤下可能无法实现良好的分布一致性,影响最终图像的质量。PCM通过优化损失函数和训练过程,提高了在低推理步骤下生成图像的质量。
此外,PCM还对AnimateLCM进行了优化,使得直接使用PCM生成动画能够保证质量。这对于动画制作者来说是一个巨大的进步,因为它可以减少后期处理的需要,加快动画制作的流程。
总体而言,PCM的出现代表了在扩散模型领域的一个进步,它通过解决LCM模型的一些关键问题,为高质量的图像和动画生成提供了新的可能性。随着技术的不断进步,我们可以期待未来在这一领域会有更多创新和突破。
项目地址:https://g-u-n.github.io/projects/pcm/