FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-12-24 13:28:13 +08:00

Files

History

zhupengyang 26ff2f8683 [XPU] refine fused moe (#4219 )

2025-10-16 19:04:07 +08:00

2025-09-15 12:01:34 +08:00

__init__.py

2025-09-24 14:12:05 +08:00

block_wise_fp8.py

2025-09-15 13:44:11 +08:00

kv_cache.py

2025-10-10 15:41:32 +08:00

mix_quant.py

2025-09-15 13:44:11 +08:00

quant_base.py

…

tensor_wise_fp8.py

…

w4a8.py

2025-10-10 15:41:32 +08:00

w4afp8.py

2025-09-05 17:07:58 +08:00

w8a8.py

fix w8a8.py (#3733 )

2025-09-03 10:57:26 +08:00

weight_only.py

2025-10-16 19:04:07 +08:00

wfp8afp8.py

2025-09-24 16:39:51 +08:00

wint2.py

…