[Backend] cuda normalize and permute, cuda concat, optimized ppcls, ppdet & ppseg (#546)

* cuda normalize and permute, cuda concat * add use cuda option for preprocessor * ppyoloe use cuda normalize * ppseg use cuda normalize * add proclib cuda in processor base * ppcls add use cuda preprocess api * ppcls preprocessor set gpu id * fix pybind * refine ppcls preprocessing use gpu logic * fdtensor device id is -1 by default * refine assert message Co-authored-by: heliqi <1101791222@qq.com>
2025-10-08 10:00:29 +08:00 · 2022-11-14 18:44:00 +08:00
parent 8dec2115d5
commit a36f5d3396
20 changed files with 204 additions and 26 deletions
--- a/fastdeploy/vision/classification/ppcls/preprocessor.h
+++ b/fastdeploy/vision/classification/ppcls/preprocessor.h
@@ -38,11 +38,19 @@ class FASTDEPLOY_DECL PaddleClasPreprocessor {
   */
  bool Run(std::vector<FDMat>* images, std::vector<FDTensor>* outputs);

+  /** \brief Use GPU to run preprocessing
+   *
+   * \param[in] gpu_id GPU device id
+   */
+  void UseGpu(int gpu_id = -1);

 private:
  bool BuildPreprocessPipelineFromConfig(const std::string& config_file);
  std::vector<std::shared_ptr<Processor>> processors_;
  bool initialized_ = false;
+  bool use_cuda_ = false;
+  // GPU device id
+  int device_id_ = -1;
 };

 }  // namespace classification