FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-10-07 09:31:35 +08:00

Files

History

Yuan Xiaolan 7ce00e597c support qk norm (#3145 )

2025-08-05 16:46:14 +08:00

support qk norm (#3145 )

2025-08-05 16:46:14 +08:00

__init__.py

2025-07-22 00:23:52 -07:00

append_attn_backend.py

support qk norm (#3145 )

2025-08-05 16:46:14 +08:00

attention_selecter.py

2025-07-19 23:19:27 +08:00

attention.py

support qk norm (#3145 )

2025-08-05 16:46:14 +08:00

base_attention_backend.py

2025-07-19 23:19:27 +08:00

block_multihead_attn_backend.py

2025-07-31 00:09:31 +08:00

flash_attn_backend.py

集中式支持fa3 (#3112 )

2025-08-01 18:03:36 +08:00

iluvatar_attn_backend.py

2025-07-28 10:51:52 +08:00

mla_attention_backend.py

2025-07-31 00:09:31 +08:00

native_paddle_backend.py

2025-07-19 23:19:27 +08:00

utils.py

2025-07-19 23:19:27 +08:00

xpu_attn_backend.py

2025-07-31 00:09:31 +08:00