[Feature] Pass through the chat_template_kwargs to the data processing module (#3421)

* fix chat_template_args * fix args * add offline * add offline * fix * fix * fix default enable_thinking value * fix default enable_thinking value * modify condition * Revert "modify condition" This reverts commit 26430bdeb1. * fix unit test
2025-10-04 08:16:42 +08:00 · 2025-08-19 10:50:01 +08:00
parent a053ab889b
commit 3a7a20d191
6 changed files with 50 additions and 13 deletions
--- a/fastdeploy/engine/engine.py
+++ b/fastdeploy/engine/engine.py
@@ -465,10 +465,7 @@ class LLMEngine:
            request.sampling_params = sampling_params
        request.preprocess_start_time = time.time()

-        enable_thinking = None
-        if kwargs is not None:
-            enable_thinking = kwargs.get("enable_thinking", None)
-        request = self.data_processor.process_request(request, self.cfg.max_model_len, enable_thinking=enable_thinking)
+        request = self.data_processor.process_request(request, self.cfg.max_model_len, **kwargs)
        request.prompt_token_ids_len = len(request.prompt_token_ids)
        request.need_prefill_tokens = request.prompt_token_ids_len
        input_ids_len = request.prompt_token_ids_len