fix w4afp8_gemm_scale_permute import error on A100 (#3611)

2025-10-05 16:48:03 +08:00 · 2025-08-28 11:42:23 +08:00
parent ad9b95e6dd
commit d37331fc71
1 changed files with 5 additions and 1 deletions
--- a/fastdeploy/model_executor/layers/moe/fused_moe_cutlass_backend.py
+++ b/fastdeploy/model_executor/layers/moe/fused_moe_cutlass_backend.py
@@ -31,8 +31,12 @@ if current_platform.is_cuda():
        moe_expert_dispatch,
        moe_expert_reduce,
        noaux_tc,
        w4afp8_gemm_scale_permute,
    )
    try:
        from fastdeploy.model_executor.ops.gpu import w4afp8_gemm_scale_permute
    except:
        logger.warning("import w4afp8_gemm_scale_permute Failed!")
 elif current_platform.is_iluvatar():
    from fastdeploy.model_executor.ops.iluvatar import (
        moe_expert_dispatch,