参数说明

服务启动参数

字段名	字段类型	说明	是否必填	默认值
`n`	int	需要返回的生成序列数量（当前仅支持1）	是	-
`presence_penalty`	float	话题新鲜度	否	-
`frequency_penalty`	float	频率惩罚度	否	-
`repetition_penalty`	float	重复词或短语的惩罚系数	否	-
`temperature`	float	表示输出的确定性	否	-
`top_p`	float	仅考虑累积概率超过此值的候选词	否	1
`seed`	int	控制生成随机性的种子	否	-
`stop`	list[str]	生成遇到这些字符串时停止（结果不包含它们）	否	-
`stop_token_ids`	list[int]	生成遇到这些token时停止（结果包含token，除非是特殊token）	否	-
`bad_words`	list[int]	禁止生成的token id	否	None
`max_tokens`	int	每个序列生成的最大token数	是	-
`min_tokens`	int	生成的最少token数（遇到停止条件前必须生成）	否	1
`logprobs`	int	返回每个token的前N个概率（None表示不返回）（目前暂不支持）	否	`None`

字段名	字段类型	说明	是否必填	默认值
`model`	str	模型名称	否	default
`prompt`	Union[List[int], List[List[int]], str, List[str]]	输入prompt	是	-
`best_of`	int	生成多个序列，返回最好的一个（当前仅支持1）	否	1
`echo`	bool	是否返回输入prompt	否	False
`frequency_penalty`	float	话题新鲜度	否	-
`logprobs`	int	返回每个token的前N个概率（None表示不返回）（目前暂不支持）	否	`None`
`max_tokens`	int	每个序列生成的最大token数	是	-
`n`	int	需要返回的生成序列数量（当前仅支持1）	是	-
`presence_penalty`	float	话题新鲜度	否	-
`repetition_penalty`	float	频率惩罚度	否	-
`seed`	int	控制生成随机性的种子	否	-
`stop`	Union[str, List[str]]	生成遇到这些字符串时停止（结果不包含它们）	否	-
`stream`	bool	是否流式返回结果	否	False
`stream_options`	StreamOptions	流式返回的选项，包含输入输出token 数目的统计	否	None
`suffix`	str	生成序列后添加的后缀（当前不支持）	否	None
`temperature`	float	表示输出的确定性	否	-
`top_p`	float	仅考虑累积概率超过此值的候选词	否	1
`user`	str	用户信息（当前不支持）	否	None
`stop_token_ids`	list[int]	生成遇到这些token时停止（结果包含token，除非是特殊token）	否	-

字段名	字段类型	说明	是否必填	默认值
`model`	str	模型名称	否	default
`messages`	List[Dict[str, Union[str, List[int], List[List[int]]]]]	输入prompt	是	-
`best_of`	int	生成多个序列，返回最好的一个（当前仅支持1）	否	1
`echo`	bool	是否返回输入prompt	否	False
`frequency_penalty`	float	话题新鲜度	否	-
`logprobs`	int	返回每个token的前N个概率（None表示不返回）（目前暂不支持）	否	`None`
`max_tokens`	int	每个序列生成的最大token数	是	-
`n`	int	需要返回的生成序列数量（当前仅支持1）	是	-
`presence_penalty`	float	话题新鲜度	否	-
`repetition_penalty`	float	频率惩罚度	否	-
`seed`	int	控制生成随机性的种子	否	-
`stop`	Union[str, List[str]]	生成遇到这些字符串时停止（结果不包含它们）	否	-
`stream`	bool	是否流式返回结果	否	False
`stream_options`	StreamOptions	流式返回的选项，包含输入输出token 数目的统计	否	None
`suffix`	str	生成序列后添加的后缀（当前不支持）	否	None
`temperature`	float	表示输出的确定性	否	-
`top_p`	float	仅考虑累积概率超过此值的候选词	否	1
`user`	str	用户信息（当前不支持）	否	None