FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-12-24 13:28:13 +08:00

Files

AIbin a7392a0ff9 【Inference Optimize】DeepSeek-V3-model MLA Optimize (#3886 )

* support MLA chunk_size auto search & cuda_graph

2025-09-11 10:46:09 +08:00

2025-09-11 10:46:09 +08:00

fix typos (#3684 )

2025-09-01 17:50:17 +08:00

2025-09-09 20:05:54 -07:00

2025-09-10 10:21:33 +08:00

2025-09-02 16:21:09 +08:00

__init__.py

…

activation.py

2025-08-14 14:04:52 +08:00

embeddings.py

2025-09-03 02:58:59 -07:00

linear.py

2025-09-04 21:16:05 -07:00

lm_head.py

2025-08-27 11:34:53 +08:00

mtp_linear.py

support tmp (#3675 )

2025-08-28 19:42:32 +08:00

normalization.py

2025-08-26 15:29:15 +08:00

rotary_embedding.py

2025-09-10 19:36:10 +08:00

utils.py

fix mem boom in ep (#3854 )

2025-09-05 11:48:21 +08:00