mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-10-04 16:22:57 +08:00

Files

yunyaoXYY ff5e798b7f Add Initialize function to PP-OCR (#326 )

* Imporve OCR Readme

* Improve OCR Readme

* Improve OCR Readme

* Improve OCR Readme

* Improve OCR Readme

* Add Initialize function to PP-OCR

* Add Initialize function to PP-OCR

* Add Initialize function to PP-OCR

Co-authored-by: Jason <jiangjiajun@baidu.com>

2022-10-09 17:31:37 +08:00

PP-OCRv2

Add Initialize function to PP-OCR (#326 )

2022-10-09 17:31:37 +08:00

PP-OCRv3

Add Initialize function to PP-OCR (#326 )

2022-10-09 17:31:37 +08:00

README.md

Add Initialize function to PP-OCR (#326 )

2022-10-09 17:31:37 +08:00

README.md

PaddleOCR 模型部署

PaddleOCR为多个模型组合串联任务，包含

文本检测 DBDetector
[可选]方向分类 Classifer 用于调整进入文字识别前的图像方向
文字识别 Recognizer 用于从图像中识别出文字

根据不同场景, FastDeploy汇总提供如下OCR任务部署, 用户需同时下载3个模型与字典文件（或2个，分类器可选), 完成OCR整个预测流程

OCR 中英文系列模型

OCR版本	文本框检测	方向分类模型	文字识别	字典文件	说明
ch_PP-OCRv3[推荐]	ch_PP-OCRv3_det	ch_ppocr_mobile_v2.0_cls	ch_PP-OCRv3_rec	ppocr_keys_v1.txt	OCRv3系列原始超轻量模型，支持中英文、多语种文本检测
en_PP-OCRv3[推荐]	en_PP-OCRv3_det	ch_ppocr_mobile_v2.0_cls	en_PP-OCRv3_rec	en_dict.txt	OCRv3系列原始超轻量模型，支持英文与数字识别，除检测模型和识别模型的训练数据与中文模型不同以外，无其他区别
ch_PP-OCRv2	ch_PP-OCRv2_det	ch_ppocr_mobile_v2.0_cls	ch_PP-OCRv2_rec	ppocr_keys_v1.txt	OCRv2系列原始超轻量模型，支持中英文、多语种文本检测
ch_PP-OCRv2_mobile	ch_ppocr_mobile_v2.0_det	ch_ppocr_mobile_v2.0_cls	ch_ppocr_mobile_v2.0_rec	ppocr_keys_v1.txt	OCRv2系列原始超轻量模型，支持中英文、多语种文本检测,比PPOCRv2更加轻量
ch_PP-OCRv2_server	ch_ppocr_server_v2.0_det	ch_ppocr_mobile_v2.0_cls	ch_ppocr_server_v2.0_rec	ppocr_keys_v1.txt	OCRv2服务器系列模型, 支持中英文、多语种文本检测，比超轻量模型更大，但效果更好

OCR 模型的处理说明

为了让OCR系列模型在FastDeploy多个推理后端上正确推理，以上表格中的部分模型的输入shape，和PaddleOCR套件提供的模型有差异. 例如，由PaddleOCR套件库提供的英文版PP-OCRv3_det模型,输入的shape是[-1,3,960,960], 而FastDeploy提供的此模型输入shape为[-1,3,-1,-1].

差异存在的原因: 当我们在ORT和OpenVINO上部署输入shape固定的模型时(指定了高和宽),由于OCR的输入图片尺寸是变化的，会报例如下面所示的错误，导致无法推理:

Failed to Infer: Got invalid dimensions for input: x for the following indices
index: 3 Got: 608 Expected: 960

解决办法:除了直接下载FastDeploy提供的模型外，用户还可以使用如下工具仓库, 修改模型的输入shape.

仓库链接: https://github.com/jiangjiajun/PaddleUtils

使用示例如下：

#该用例将en_PP-OCRv3_det_infer模型的输入shape, 改为[-1,3,-1,-1], 并将新模型存放至output文件夹下
git clone git@github.com:jiangjiajun/PaddleUtils.git
cd paddle
python paddle_infer_shape.py --model_dir en_PP-OCRv3_det_infer/ \
                             --model_filename inference.pdmodel \
                             --params_filename inference.pdiparams \
                             --save_dir output  \
                             --input_shape_dict="{'x':[-1,3,-1,-1]}"

OCR模型输入shape更改记录

以下表格记录了FastDeploy修改过的OCR模型的输入('输入名':[shape]), 供用户参考.

OCR版本	模型	修改前	修改后
PPOCRv3	en_PP-OCRv3_det	'x':[-1,3,960,960]	'x':[-1,3,-1,-1]
PPOCRv2	ch_PP-OCRv2_det	'x':[-1,3,960,960]	'x':[-1,3,-1,-1]
PPOCRv2	ch_PP-OCRv2_rec	'x':[-1,3,32,100]	'x':[-1,3,-1,-1]
PPOCRv2_mobile	ch_ppocr_mobile_v2.0_det	'x':[-1,3,640,640]	'x':[-1,3,-1,-1]
PPOCRv2_mobile	ch_ppocr_mobile_v2.0_rec	'x':[-1,3,32,100]	'x':[-1,3,-1,-1]
PPOCRv2_server	ch_ppocr_server_v2.0_det	'x':[-1,3,640,640]	'x':[-1,3,-1,-1]
PPOCRv2_server	ch_ppocr_server_v2.0_rec	'x':[-1,3,32,100]	'x':[-1,3,-1,-1]

README.md Unescape Escape

PaddleOCR 模型部署

PaddleOCR为多个模型组合串联任务，包含

OCR 中英文系列模型

OCR 模型的处理说明

OCR模型输入shape更改记录

README.md