低延迟场景部署#

在低延迟的场景，我们会追求更快的速度，忽略显存和内存开销等问题。我们提供两套方案：

💡 方案一：步数蒸馏模型的推理#

该方案可以参考步数蒸馏文档

🧠 步数蒸馏是非常直接的视频生成模型的加速推理方案。从50步蒸馏到4步，耗时将缩短到原来的4/50。同时，该方案下，仍然可以和以下方案结合使用：

步数蒸馏需要比较大的训练资源，以及步数蒸馏后的模型，可能会出现视频动态范围变差的问题。

对于非步数蒸馏的原始模型，我们可以使用以下方案或者多种方案结合的方式进行加速：

在某些情况下，VAE部分耗时会比较大，可以使用轻量级VAE进行加速，同时也可以降低一部分显存。

{
    "use_tae": true,
    "tae_path": "/path to taew2_1.pth"
}

taew2_1.pth 权重可以从这里下载

有一部分的加速方案之间目前无法结合使用，我们目前正在致力于解决这一问题。

如有问题，欢迎在 🐛 GitHub Issues 中进行错误报告或者功能请求