mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced 2025-10-05 16:48:03 +08:00
Update README.md
This commit is contained in:
@@ -20,7 +20,7 @@ FastDeploy升级2.0版本支持多种大模型推理(当前仅支持Qwen2,
|
||||
- 提供 Weight only int8/int4 无损压缩方案
|
||||
- 支持 Prometheus Metrics 指标
|
||||
|
||||
> 注意: 老版本FastDeploy对于小模型的支持,请checkout [release/1.1.0分支](https://github.com/PaddlePaddle/FastDeploy/tree/release/1.1.0)。
|
||||
> 注意: 如果你还在使用FastDeploy部署小模型(如PaddleClas/PaddleOCR等CV套件模型),请checkout [release/1.1.0分支](https://github.com/PaddlePaddle/FastDeploy/tree/release/1.1.0)。
|
||||
|
||||
## 环境依赖
|
||||
- A800/H800/H100
|
||||
|
Reference in New Issue
Block a user