FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-10-06 00:57:33 +08:00

Files

周周周 ddb10ac509 [Inference, rename] remove padding_offsets from atten use batch_id_per_token (#2880 )

* remove padding_offsets from atten

2025-07-17 18:41:31 +08:00

__init__.py

2025-07-17 17:58:08 +08:00

append_attention.py

2025-07-17 18:41:31 +08:00

get_block_shape_and_split_kv_block.py

2025-07-10 11:26:00 +08:00

gqa_rope_write_cache.py

2025-07-03 22:33:27 +08:00

init_kv_signal_per_query.py

2025-07-17 17:58:08 +08:00

init_signal_layerwise.py

2025-06-29 23:29:37 +00:00

open_shm_and_get_meta_signal.py

2025-06-29 23:29:37 +00:00

pre_cache_len_concat.py

2025-07-03 22:33:27 +08:00