并行推理#

LightX2V 支持分布式并行推理,能够利用多个 GPU 进行推理。DiT部分支持两种并行注意力机制:UlyssesRing,同时还支持 Cfg 并行推理。并行推理,显著降低推理耗时和减轻每个GPU的显存开销。

DiT 并行配置#

1. Ulysses 并行#

配置方式:

    "parallel": {
        "seq_p_size": 4,
        "seq_p_attn_type": "ulysses"
    }

2. Ring 并行#

配置方式:

    "parallel": {
        "seq_p_size": 4,
        "seq_p_attn_type": "ring"
    }

Cfg 并行配置#

配置方式:

    "parallel": {
        "cfg_p_size": 2
    }

混合并行配置#

配置方式:

    "parallel": {
        "seq_p_size": 4,
        "seq_p_attn_type": "ulysses",
        "cfg_p_size": 2
    }

使用方式#

并行推理的config文件在这里

通过指定–config_json到具体的config文件,即可以测试并行推理

这里有一些运行脚本供使用。