dcu adapter ernie45t (#2756)

Co-authored-by: lifu <lifu@sugon.com> Co-authored-by: yongqiangma <xing.wo@163.com>
2025-10-05 16:48:03 +08:00 · 2025-07-09 18:56:27 +08:00
parent 03a74995b8
commit 1f28bdf994
30 changed files with 1133 additions and 41 deletions
--- a/fastdeploy/model_executor/layers/attention/mla_attention_backend.py
+++ b/fastdeploy/model_executor/layers/attention/mla_attention_backend.py
@@ -29,7 +29,7 @@ from fastdeploy.model_executor.layers.attention.ops import (
    open_shm_and_get_meta_signal)
 from fastdeploy.platforms import current_platform

-if current_platform.is_cuda():
+if current_platform.is_cuda() and not current_platform.is_dcu():
    from fastdeploy.model_executor.ops.gpu import (decode_mla_write_cache,
                                                   multi_head_latent_attention,
                                                   prefill_mla_write_cache)