【FIX】Change the name of sparse attn from moba to plas (#3845)

* 更新文档 * 更新文档 * 更新文档 * 更新文档 * 修改moba为plas * code style * update ci * code style * update ci
2025-10-05 08:37:06 +08:00 · 2025-09-09 10:56:50 +08:00
parent de34222842
commit e31c8f7336
13 changed files with 150 additions and 150 deletions
--- a/fastdeploy/worker/worker_process.py
+++ b/fastdeploy/worker/worker_process.py
@@ -34,9 +34,9 @@ from fastdeploy.config import (
    FDConfig,
    GraphOptimizationConfig,
    LoadConfig,
-    MobaAttentionConfig,
    ModelConfig,
    ParallelConfig,
+    PlasAttentionConfig,
    SpeculativeConfig,
 )
 from fastdeploy.input.ernie4_5_tokenizer import Ernie4_5Tokenizer
@@ -561,10 +561,10 @@ def parse_args():
        help="Configuration of Graph optimization backend.",
    )
    parser.add_argument(
-        "--moba_attention_config",
+        "--plas_attention_config",
        type=json.loads,
        default=None,
-        help="Configation of moba attention.",
+        help="Configation of plas attention.",
    )
    parser.add_argument(
        "--guided_decoding_backend",
@@ -677,7 +677,7 @@ def initialize_fd_config(args, ranks: int = 1, local_rank: int = 0) -> FDConfig:

    graph_opt_config = GraphOptimizationConfig(args.graph_optimization_config)

-    moba_attention_config = MobaAttentionConfig(args.moba_attention_config)
+    plas_attention_config = PlasAttentionConfig(args.plas_attention_config)

    early_stop_config = EarlyStopConfig(args.early_stop_config)

@@ -777,7 +777,7 @@ def initialize_fd_config(args, ranks: int = 1, local_rank: int = 0) -> FDConfig:
        cache_config=cache_config,
        engine_worker_queue_port=args.engine_worker_queue_port,
        ips=args.ips,
-        moba_attention_config=moba_attention_config,
+        plas_attention_config=plas_attention_config,
    )
    update_fd_config_for_mm(fd_config)