fix mtp in rl (#4234)

2025-10-06 09:07:10 +08:00 · 2025-09-24 16:59:24 +08:00
parent 8a506500f3
commit e2b68b33c9
2 changed files with 7 additions and 1 deletions
--- a/fastdeploy/engine/args_utils.py
+++ b/fastdeploy/engine/args_utils.py
@@ -1028,7 +1028,10 @@ class EngineArgs:
                if paddle.is_compiled_with_xpu():
                    self.max_num_batched_tokens = self.max_model_len
                else:
-                    self.max_num_batched_tokens = 8192  # if set to max_model_len, it's easy to be OOM
+                    if speculative_cfg is not None and speculative_cfg.method is not None:
+                        self.max_num_batched_tokens = self.max_model_len
+                    else:
+                        self.max_num_batched_tokens = 8192  # if set to max_model_len, it's easy to be OOM
            else:
                if self.enable_chunked_prefill:
                    self.max_num_batched_tokens = 2048