[fix]Modify follow-up push parameters and Modify the verification method for thinking length (#4086)

* 续推参数 generated_token_ids 修改成 completion_token_ids;修改思考长度校验方式 * 续推参数 generated_token_ids 修改成 completion_token_ids;修改思考长度校验方式 * 续推参数 generated_token_ids 修改成 completion_token_ids;修改思考长度校验方式 * 续推参数 generated_token_ids 修改成 completion_token_ids;修改思考长度校验方式 * add completion_token_ids * add logger * fix reasoning_max_tokens ParameterError * add unittest * add unittest * add unittest * add unittest * add unittest * add unit test
2025-12-24 13:28:13 +08:00 · 2025-09-19 14:26:01 +08:00
parent 66a98b44ed
commit ee9d8a840a
6 changed files with 75 additions and 24 deletions
--- a/tests/input/test_qwen_vl_processor.py
+++ b/tests/input/test_qwen_vl_processor.py
@@ -176,12 +176,10 @@ class TestQwenVLProcessor(unittest.TestCase):
        3. Video processing produces expected output dimensions
        4. Correct counts for images (1) and videos (1)
        """
-        num_generated_token_ids = 10
+        num_completion_token_ids = 10
        request = {
            "request_id": "12345",
-            "metadata": {
-                "generated_token_ids": [1] * num_generated_token_ids,
-            },
+            "completion_token_ids": [1] * num_completion_token_ids,
            "stop": ["stop", "eof"],
            "messages": [
                {