FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-12-24 13:28:13 +08:00

Files

lizhenyun01 aba4fc657f [Feature] support flash_mask_attention backend (#5134 )

* [Feature] suppert flash_mask_attention backend

* fix unittest

* clean code

2025-11-28 10:12:16 +08:00

__init__.py

2025-11-28 10:12:16 +08:00

append_attention.py

2025-10-20 14:44:58 +08:00

flash_mask_attention.py

2025-11-28 10:12:16 +08:00

get_block_shape_and_split_kv_block.py

2025-11-20 16:40:04 +08:00

gqa_rope_write_cache.py

2025-11-28 10:12:16 +08:00

init_kv_signal_per_query.py

2025-11-21 14:09:01 +08:00

init_signal_layerwise.py

2025-11-21 14:09:01 +08:00

open_shm_and_get_meta_signal.py

2025-11-21 14:09:01 +08:00

pre_cache_len_concat.py

2025-07-19 23:19:27 +08:00