[Doc] Update parameters of serving

2025-10-05 08:37:06 +08:00 · 2025-07-30 22:35:01 +08:00
parent fe0e3f508b
commit 998968f1e8
2 changed files with 2 additions and 0 deletions
--- a/docs/zh/online_serving/README.md
+++ b/docs/zh/online_serving/README.md
@@ -93,6 +93,7 @@ FastDeploy 与 OpenAI 协议的请求参数差异如下，其余请求参数会
  - `enable_thinking`: Optional[bool] = True 支持深度思考的模型是否打开思考
  - `repetition_penalty`: Optional[float] = None: 直接对重复生成的token进行惩罚的系数（>1时惩罚重复，<1时鼓励重复）
  - `return_token_ids`: Optional[bool] = False: 是否返回 token id 列表
+  - `include_stop_str_in_output`: Optional[bool] = False: 是否返回结束符

 > 注: 若为多模态模型 由于思考链默认打开导致输出过长，max tokens 可以设置为模型最长输出，或使用默认值。