FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-12-24 13:28:13 +08:00

Files

History

Sunny-bot1 40f3897a4e support w4afp8 moe offline permute & load (#5613 )

2025-12-22 15:12:57 +08:00

2025-11-10 20:57:35 +08:00

__init__.py

2025-12-02 18:56:16 +08:00

block_wise_fp8.py

2025-12-18 14:31:54 +08:00

kv_cache.py

2025-12-17 16:45:03 +08:00

mix_quant.py

2025-12-22 15:12:57 +08:00

quant_base.py

2025-07-19 23:19:27 +08:00

tensor_wise_fp8.py

2025-12-17 16:45:03 +08:00

w4a8.py

2025-12-18 14:14:05 +08:00

w4afp8.py

2025-12-09 17:39:35 +08:00

w8a8.py

fix w8a8.py (#3733 )

2025-09-03 10:57:26 +08:00

weight_only.py

2025-12-18 14:14:05 +08:00

wfp8afp8.py

2025-11-11 21:30:39 +08:00

wint2.py

fix wint2 config (#4721 )

2025-10-31 15:44:14 +08:00