mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-09-26 20:41:53 +08:00

Files

yangjianfengo1 f556561584 【docs】 update readme (#4000 )

* 更新文档

* update readme

* update docs

2025-09-09 11:04:08 +08:00

English | 简体中文

安装指导 | 快速入门 | 支持模型列表

FastDeploy ：基于飞桨的大语言模型与视觉语言模型推理部署工具包

关于

FastDeploy 是基于飞桨（PaddlePaddle）的大语言模型（LLM）与视觉语言模型（VLM）推理部署工具包，提供开箱即用的生产级部署方案，核心技术特性包括：

FastDeploy 支持在英伟达（NVIDIA）GPU、昆仑芯（Kunlunxin）XPU、天数（Iluvatar）GPU、燧原（Enflame）GCU、海光（Hygon）DCU 以及其他硬件上进行推理部署。详细安装说明如下：

注意: 我们正在积极拓展硬件支持范围。目前，包括昇腾（Ascend）NPU 等其他硬件平台正在开发测试中。敬请关注更新！

通过我们的文档了解如何使用 FastDeploy：

通过我们的文档了解如何下载模型，如何支持torch格式等：

FastDeploy 依据 Apache-2.0 开源许可证. 进行授权。在开发过程中，我们参考并借鉴了 vLLM 的部分代码，以保持接口兼容性，在此表示衷心感谢。