mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-10-16 05:30:58 +08:00

Files

DefTruth 5b8a3b498d [Bug Fix] fixed fd server use_paddle parameter parse policy (#2044 )

* [Server] Support GPU encrypt & auth for FD Triton Server

* fix dockerfile proxy env error

* update build scrpits

* remove some logs

* [Bug Fix] fixed fd server use_paddle parameter parse policy

* optimize paddle-trt policy

* optimize paddle-trt policy

---------

Co-authored-by: root <root@yq02-sys-rpm1206692e6.yq02.baidu.com>
Co-authored-by: qiuyanjun <qiuyanjun@baidu.com>

2023-06-21 15:44:32 +08:00

docs

[XPU] Update XPU L3 Cache setting docs (#2001 )

2023-05-30 11:21:04 +08:00

scripts

[Server] Support encrypt & auth for FD Server (#2018 )

2023-06-13 20:44:25 +08:00

src

[Bug Fix] fixed fd server use_paddle parameter parse policy (#2044 )

2023-06-21 15:44:32 +08:00

CMakeLists.txt

support build cpu images (#341 )

2022-10-11 14:17:27 +08:00

Dockerfile

[Server] Support encrypt & auth for FD Server (#2018 )

2023-06-13 20:44:25 +08:00

Dockerfile_cpu

[Serving]modify docker images name (#992 )

2022-12-27 21:29:27 +08:00

Dockerfile_CUDA_11_2

[Serving] add fastdeployserver dockerfile for cuda11.2 (#1169 )

2023-01-30 15:31:20 +08:00

Dockerfile_CUDA_11_2_TRT_8_5_PADDLE_2_4_2

[Server] Support encrypt & auth for FD Server (#2018 )

2023-06-13 20:44:25 +08:00

Dockerfile_CUDA_11_4_TRT_8_4

[Server] Support encrypt & auth for FD Server (#2018 )

2023-06-13 20:44:25 +08:00

Dockerfile_ipu

[Serving]: add ipu support for serving. (#10 ) (#470 )

2022-11-02 09:50:58 +08:00

Dockerfile_xpu

[Serving] Support FastDeploy XPU Triton Server (#1994 )

2023-05-29 14:38:25 +08:00

Dockerfile_xpu_encrypt_auth

[Serving] Support XPU encrypt & auth server (#2007 )

2023-06-01 21:36:44 +08:00

README_CN.md

Update README_CN.md

2023-02-27 21:36:12 +08:00

README.md

Update README.md

2023-02-27 21:34:54 +08:00

README.md

简体中文 | English

FastDeploy Serving Deployment

Introduction

FastDeploy builds an end-to-end serving deployment based on Triton Inference Server. The underlying backend uses the FastDeploy high-performance Runtime module and integrates the FastDeploy pre- and post-processing modules to achieve end-to-end serving deployment. It can achieve fast deployment with easy-to-use process and excellent performance.

FastDeploy also provides an easy-to-use Python service deployment method, refer PaddleSeg deployment example for its usage.

Prepare the environment

Environment requirements

Linux
If using a GPU image, NVIDIA Driver >= 470 is required (for older Tesla architecture GPUs, such as T4, the NVIDIA Driver can be 418.40+, 440.33+, 450.51+, 460.27+)

Obtain Image

CPU Image

CPU images only support Paddle/ONNX models for serving deployment on CPUs, and supported inference backends include OpenVINO, Paddle Inference, and ONNX Runtime

docker pull registry.baidubce.com/paddlepaddle/fastdeploy:1.0.4-cpu-only-21.10

GPU Image

GPU images support Paddle/ONNX models for serving deployment on GPU and CPU, and supported inference backends including OpenVINO, TensorRT, Paddle Inference, and ONNX Runtime

docker pull registry.baidubce.com/paddlepaddle/fastdeploy:1.0.4-gpu-cuda11.4-trt8.5-21.10

Users can also compile the image by themselves according to their own needs, referring to the following documents:

FastDeploy Serving Deployment Image Compilation

Task	Model
Classification	PaddleClas
Detection	PaddleDetection
Detection	ultralytics/YOLOv5
NLP	PaddleNLP/ERNIE-3.0
NLP	PaddleNLP/UIE
Speech	PaddleSpeech/PP-TTS
OCR	PaddleOCR/PP-OCRv3

README.md

FastDeploy Serving Deployment

Introduction

Prepare the environment

Environment requirements

Obtain Image

CPU Image

GPU Image

Other Tutorials

Serving Deployment Demo