mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced 2025-12-24 13:28:13 +08:00
Update kunlunxin_xpu.md (#2662)
This commit is contained in:
@@ -128,7 +128,7 @@ P800 支持 ```ERNIE-4.5-300B-A47B-Paddle``` 模型采用以下配置部署(
|
||||
|
||||
#### 启动服务
|
||||
|
||||
**ERNIE-4.5-300B-A47B-Paddle 模型采用 32K WINT4 8 卡配置部署(推荐)**
|
||||
**基于 WINT4 精度和 32K 上下文部署 ERNIE-4.5-300B-A47B-Paddle 模型到 8 卡 P800 服务器(推荐)**
|
||||
|
||||
```bash
|
||||
python -m fastdeploy.entrypoints.openai.api_server \
|
||||
@@ -141,7 +141,7 @@ python -m fastdeploy.entrypoints.openai.api_server \
|
||||
--gpu-memory-utilization 0.9
|
||||
```
|
||||
|
||||
**ERNIE-4.5-300B-A47B-Paddle 模型采用 128K WINT4 8 卡配置部署**
|
||||
**基于 WINT4 精度和 128K 上下文部署 ERNIE-4.5-300B-A47B-Paddle 模型到 8 卡 P800 服务器**
|
||||
|
||||
```bash
|
||||
python -m fastdeploy.entrypoints.openai.api_server \
|
||||
@@ -154,7 +154,7 @@ python -m fastdeploy.entrypoints.openai.api_server \
|
||||
--gpu-memory-utilization 0.9
|
||||
```
|
||||
|
||||
**ERNIE-4.5-300B-A47B-Paddle 模型采用 32K WINT4 4 卡配置部署**
|
||||
**基于 WINT4 精度和 32K 上下文部署 ERNIE-4.5-300B-A47B-Paddle 模型到 4 卡 P800 服务器**
|
||||
|
||||
```bash
|
||||
export XPU_VISIBLE_DEVICES="0,1,2,3"
|
||||
|
||||
Reference in New Issue
Block a user