mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced 2025-10-12 20:11:20 +08:00

* 第一次提交 * 补充一处漏翻译 * deleted: docs/en/quantize.md * Update one translation * Update en version * Update one translation in code * Standardize one writing * Standardize one writing * Update some en version * Fix a grammer problem * Update en version for api/vision result * Merge branch 'develop' of https://github.com/charl-u/FastDeploy into develop * Checkout the link in README in vision_results/ to the en documents * Modify a title * Add link to serving/docs/ * Finish translation of demo.md
2.9 KiB
2.9 KiB
中文 | English
模型仓库(Model Repository)
FastDeploy启动服务时指定模型仓库中一个或多个模型部署服务。当服务运行时,可以用Model Management中描述的方式修改服务中的模型。 从服务器启动时指定的一个或多个模型存储库中为模型提供服务
仓库结构
模型仓库路径通过FastDeploy启动时的*--model-repository选项指定,可以多次指定--model-repository*选项来加载多个仓库。例如:
$ fastdeploy --model-repository=<model-repository-path>
模型仓库的结构必须按以下的格式创建:
<model-repository-path>/
<model-name>/
[config.pbtxt]
[<output-labels-file> ...]
<version>/
<model-definition-file>
<version>/
<model-definition-file>
...
<model-name>/
[config.pbtxt]
[<output-labels-file> ...]
<version>/
<model-definition-file>
<version>/
<model-definition-file>
...
...
在最顶层<model-repository-path>
模型仓库目录下,必须有0个或多个<model-name>
模型名字的子目录。每个<model-name>
模型名字子目录包含部署模型相应的信息,多个表示模型版本的数字子目录和一个描述模型配置的config.pbtxt文件。
Paddle模型存在版本号子目录中,必须为model.pdmodel
文件和model.pdiparams
文件。
模型版本
每个模型在仓库中可以有一个或多个可用的版本,模型目录中以数字命名的子目录就是对应的版本,数字即版本号。没有以数字命名的子目录,或以0开头的子目录都会被忽略。模型配置文件中可以指定版本策略,控制Triton启动模型目录中的哪个版本。
模型仓库示例
部署Paddle模型时需要的模型必须是2.0版本以上导出的推理模型,模型包含model.pdmodel
和model.pdiparams
两个文件放在版本目录中。
部署Paddle模型的最小模型仓库目录示例:
<model-repository-path>/
<model-name>/
config.pbtxt
1/
model.pdmodel
model.pdiparams
# 真实例子:
models
└── ResNet50
├── 1
│ ├── model.pdiparams
│ └── model.pdmodel
└── config.pbtxt
部署ONNX模型,必须要在版本目录中包含model.onnx
名字的模型。
部署ONNX模型的最小模型仓库目录示例:
<model-repository-path>/
<model-name>/
config.pbtxt
1/
model.onnx
# 真实例子:
models
└── ResNet50
├── 1
│ ├── model.onnx
└── config.pbtxt