FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-12-24 13:28:13 +08:00

Files

Sunny-bot1 930f7b781c [Optimization] Put get_block_shape_and_split_kv_block in cuda graph for append attention backend (#4443 )

* get block in cuda graph

* fix sot

2025-10-17 10:59:56 +08:00

fix typos (#3951 )

2025-09-08 15:22:41 +08:00

2025-10-17 10:59:56 +08:00

2025-09-22 21:13:59 +08:00

2025-09-29 11:22:43 +08:00

2025-09-11 17:41:16 +08:00

2025-09-02 19:17:01 +08:00

2025-10-16 19:04:07 +08:00

0001-DeepGEMM-95e81b3.patch

2025-07-03 22:33:27 +08:00

MANIFEST.in

2025-06-09 19:20:15 +08:00

setup_ops_cpu.py

2025-07-19 23:19:27 +08:00

setup_ops.py

2025-10-16 17:08:19 +08:00