mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced 2025-12-24 13:28:13 +08:00
[Docx] add language (en/cn) switch links (#4470)
* add install docs * 修改文档 * 修改文档
This commit is contained in:
@@ -1,3 +1,5 @@
|
||||
[English](../../usage/code_overview.md)
|
||||
|
||||
# 代码说明
|
||||
下边按照目录结构来介绍一下每个 FastDeploy 的代码结构及代码功能。
|
||||
|
||||
|
||||
@@ -1,3 +1,5 @@
|
||||
[English](../../usage/environment_variables.md)
|
||||
|
||||
# FastDeploy 环境变量说明
|
||||
|
||||
FastDeploy 的环境变量保存在了代码库根目录下 fastdeploy/envs.py 文件中,以下是其对应的中文版说明:
|
||||
|
||||
@@ -1,3 +1,5 @@
|
||||
[English](../../usage/faq.md)
|
||||
|
||||
1. 服务可以支持多大并发?
|
||||
- 服务部署时推荐配置环境变量export ENABLE_V1_KVCACHE_SCHEDULER=1
|
||||
- 服务在启动时需要配置```max-num-seqs```,此参数用于表示Decode阶段的最大Batch数,如果并发超过此值,则超出的请求会排队等待处理, 常规情况下你可以将```max-num-seqs```配置为128,保持在较高的范围,实际并发由发压客户端来决定。
|
||||
|
||||
@@ -1,3 +1,5 @@
|
||||
[English](../../usage/fastdeploy_unit_test_guide.md)
|
||||
|
||||
# Fastdeploy 单测规范
|
||||
1. 测试命名规范
|
||||
- 测试文件以 test_ 开头;
|
||||
|
||||
@@ -1,3 +1,5 @@
|
||||
[English](../../usage/kunlunxin_xpu_deployment.md)
|
||||
|
||||
## 支持的模型
|
||||
|模型名|上下文长度|量化|所需卡数|部署命令|最低版本要求|
|
||||
|-|-|-|-|-|-|
|
||||
|
||||
@@ -1,3 +1,5 @@
|
||||
[English](../../usage/log.md)
|
||||
|
||||
# 日志说明
|
||||
|
||||
FastDeploy 在部署过程中,会产生如下日志文件,各日志含义说明
|
||||
|
||||
Reference in New Issue
Block a user