Files
FastDeploy/docs/code_guide.md
2025-06-16 00:04:48 +08:00

1.4 KiB
Raw Blame History

代码说明

下边按照目录结构来介绍一下每个FastDeploy的代码结构及代码功能。

  • custom_ops存放FastDeploy运行大模型所使用到的C++算子不同硬件下的算子放置到对应的目录下cpu_ops/gpu_ops根目录下的setup_*.py文件用来编译上述C++代码的算子。
  • dockerfiles存放运行FastDeploy的环境镜像dockerfile。
  • docsFastDeploy代码库有关的说明文档。
  • fastdeploy
    • agent大模型服务启动使用到的脚本
    • engine管理大模型整体执行引擎类有关代码
    • entrypoints用户入口调用接口
    • input用户输入处理模块包括预处理多模态输入处理tokenize等功能
    • metrics:监控系统的一些指标 耗时之类等功能
    • model_executor

      • layers大模型组网需要用到的layer模块
      • model_runner模型推理执行模块
      • modelsFastDeploy内置的大模型类模块
      • ops由custom_ops编译后可供python调用的算子模块不同硬件平台的算子放置到对应的目录里
    • output大模型输出有关处理
    • platforms与底层硬件功能支持有关的平台模块
    • scheduler大模型请求调度模块
  • scriptsFastDeploy用于执行功能的辅助脚本比如编译单测执行代码风格纠正等
  • test项目单测验证使用到的代码