mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced 2025-10-06 00:57:33 +08:00
Update README.md
This commit is contained in:
@@ -20,7 +20,7 @@ FastDeploy升级2.0版本支持多种大模型推理(当前仅支持Qwen2,
|
|||||||
- 提供 Weight only int8/int4 无损压缩方案
|
- 提供 Weight only int8/int4 无损压缩方案
|
||||||
- 支持 Prometheus Metrics 指标
|
- 支持 Prometheus Metrics 指标
|
||||||
|
|
||||||
> 注意: 老版本FastDeploy对于小模型的支持,请checkout [release/1.1.0分支](https://github.com/PaddlePaddle/FastDeploy/tree/release/1.1.0)。
|
> 注意: 如果你还在使用FastDeploy部署小模型(如PaddleClas/PaddleOCR等CV套件模型),请checkout [release/1.1.0分支](https://github.com/PaddlePaddle/FastDeploy/tree/release/1.1.0)。
|
||||||
|
|
||||||
## 环境依赖
|
## 环境依赖
|
||||||
- A800/H800/H100
|
- A800/H800/H100
|
||||||
|
Reference in New Issue
Block a user