Adapt for iluvatar gpu (#2684)

2025-10-31 03:46:40 +08:00 · 2025-07-07 16:53:14 +08:00
parent 2579e8fea8
commit 1b54a2831e
50 changed files with 4485 additions and 80 deletions
--- a/fastdeploy/model_executor/layers/attention/init.py
+++ b/fastdeploy/model_executor/layers/attention/init.py
@@ -19,9 +19,10 @@ from .flash_attn_backend import FlashAttentionBackend
 from .mla_attention_backend import MLAAttentionBackend
 from .native_paddle_backend import PaddleNativeAttnBackend
 from .xpu_attn_backend import XPUAttentionBackend
+from .iluvatar_attn_backend import IluvatarAttnBackend

 __all__ = [
    "AttentionBackend", "PaddleNativeAttnBackend",
    "get_attention_backend", "AppendAttentionBackend", "XPUAttentionBackend",
-    "MLAAttentionBackend", "FlashAttentionBackend"
+    "MLAAttentionBackend", "FlashAttentionBackend", "IluvatarAttnBackend"
 ]