[LLM] First commit the llm deployment code

This commit is contained in:
jiangjiajun
2025-06-09 19:20:15 +08:00
committed by XieYunshen
parent 8513414112
commit 149c79699d
11814 changed files with 127294 additions and 1293102 deletions

22
docs/code_guide.md Normal file
View File

@@ -0,0 +1,22 @@
# 代码说明
下边按照目录结构来介绍一下每个FastDeploy的代码结构及代码功能。
- custom_ops存放FastDeploy运行大模型所使用到的C++算子不同硬件下的算子放置到对应的目录下cpu_ops/gpu_ops根目录下的setup_*.py文件用来编译上述C++代码的算子。
- dockerfiles存放运行FastDeploy的环境镜像dockerfile。
- docsFastDeploy代码库有关的说明文档。
- fastdeploy
- agent大模型服务启动使用到的脚本
- engine管理大模型整体执行引擎类有关代码
- entrypoints用户入口调用接口
- input用户输入处理模块包括预处理多模态输入处理tokenize等功能
- metrics:监控系统的一些指标 耗时之类等功能
- model_executor
-
- layers大模型组网需要用到的layer模块
- model_runner模型推理执行模块
- modelsFastDeploy内置的大模型类模块
- ops由custom_ops编译后可供python调用的算子模块不同硬件平台的算子放置到对应的目录里
- output大模型输出有关处理
- platforms与底层硬件功能支持有关的平台模块
- scheduler大模型请求调度模块
- scriptsFastDeploy用于执行功能的辅助脚本比如编译单测执行代码风格纠正等
- test项目单测验证使用到的代码