[Bug Fix] fix ep config bug (#2920)

2025-10-06 00:57:33 +08:00 · 2025-07-18 19:12:56 +08:00
parent a42fc3f40b
commit 5328daa333
2 changed files with 37 additions and 22 deletions
--- a/fastdeploy/model_executor/load_weight_utils.py
+++ b/fastdeploy/model_executor/load_weight_utils.py
@@ -25,14 +25,14 @@ from paddleformers.transformers.model_utils import load_tp_checkpoint
 from safetensors import safe_open
 from tqdm import tqdm

-from fastdeploy.config import FDConfig, ModelConfig
+from fastdeploy.config import FDConfig
 from fastdeploy.model_executor.models.tp_utils import \
    check_tensor_parallel_prerequisites
 from fastdeploy.platforms import current_platform


 def load_ep_checkpoint(model_path: str,
-                       config: ModelConfig,
+                       fd_config: FDConfig,
                       return_numpy: bool = False):
    """
    load ep checkpoint
@@ -44,17 +44,17 @@ def load_ep_checkpoint(model_path: str,
    num_local_ffn_keys = []

    from itertools import chain
-    def get_expert_ranges(config):
+    def get_expert_ranges(fd_config):
        """
        Generate expert index ranges based on configuration parameters
    
        This function is primarily used in Mixture-of-Experts (MoE) models to generate
        expert index ranges according to configuration parameters. When moe_num_experts
-        is a list in the config, it returns a chained combination of two ranges, otherwise
+        is a list in the fd_config, it returns a chained combination of two ranges, otherwise
        returns a single range.
        
        Args:
-            config: Configuration object
+            fd_config: FastDeploy Configuration object
        
        Returns:
            If moe_num_experts is a list:
@@ -65,16 +65,16 @@ def load_ep_checkpoint(model_path: str,
                Returns single range: [num_experts_start_offset, num_experts_start_offset + num_experts_per_rank)
        """
        base_range = range(
-            config.num_experts_start_offset,
-            config.num_experts_start_offset + config.num_experts_per_rank
+            fd_config.parallel_config.num_experts_start_offset,
+            fd_config.parallel_config.num_experts_start_offset + fd_config.parallel_config.num_experts_per_rank
        )
-        if isinstance(config.moe_num_experts, list):
+        if isinstance(fd_config.model_config.moe_num_experts, list):
            return chain(base_range,
-                        range(base_range.start + config.moe_num_experts[0], base_range.stop + config.moe_num_experts[0]))
+                        range(base_range.start + fd_config.model_config.moe_num_experts[0], base_range.stop + fd_config.model_config.moe_num_experts[0]))
        return base_range

-    for i in range(config.moe_layer_start_index, config.num_hidden_layers):
-        for j in get_expert_ranges(config):
+    for i in range(fd_config.model_config.moe_layer_start_index, fd_config.model_config.num_hidden_layers):
+        for j in get_expert_ranges(fd_config):
            up_gate_proj_key = f"ernie.layers.{i}.mlp.experts.{j}.up_gate_proj.weight"
            down_proj_key = (f"ernie.layers.{i}.mlp.experts.{j}.down_proj.weight")

@@ -280,7 +280,7 @@ def load_composite_checkpoint(
    if fd_config.parallel_config.use_ep and \
        fd_config.speculative_config.model_type != "mtp":
        state_dict = load_ep_checkpoint(model_path,
-                                        fd_config.model_config,
+                                        fd_config,
                                        return_numpy=True)
    else:
        rank_dirs = [