低延迟场景部署#
在低延迟的场景,我们会追求更快的速度,忽略显存和内存开销等问题。我们提供两套方案:
💡 方案一:步数蒸馏模型的推理#
该方案可以参考步数蒸馏文档
🧠 步数蒸馏是非常直接的视频生成模型的加速推理方案。从50步蒸馏到4步,耗时将缩短到原来的4/50。同时,该方案下,仍然可以和以下方案结合使用:
💡 方案二:非步数蒸馏模型的推理#
步数蒸馏需要比较大的训练资源,以及步数蒸馏后的模型,可能会出现视频动态范围变差的问题。
对于非步数蒸馏的原始模型,我们可以使用以下方案或者多种方案结合的方式进行加速:
💡 使用Tiny VAE#
在某些情况下,VAE部分耗时会比较大,可以使用轻量级VAE进行加速,同时也可以降低一部分显存。
{
"use_tae": true,
"tae_path": "/path to taew2_1.pth"
}
taew2_1.pth 权重可以从这里下载
⚠️ 注意#
有一部分的加速方案之间目前无法结合使用,我们目前正在致力于解决这一问题。
如有问题,欢迎在 🐛 GitHub Issues 中进行错误报告或者功能请求