FastDeploy

mirror of https://github.com/PaddlePaddle/FastDeploy.git synced 2025-12-24 13:28:13 +08:00

Files

ddchenhao66 b87384aa70 [XPU] xpu currently disable prefix cache for VL model (#4695 )

Co-authored-by: ddchenhao66 <dhaochen163.com>

2025-10-31 10:36:39 +08:00

2025-10-29 00:08:53 +08:00

__init__.py

2025-07-19 23:19:27 +08:00

args_utils.py

2025-10-31 10:36:39 +08:00

async_llm.py

2025-10-30 19:53:09 +08:00

common_engine.py

Update common_engine.py

2025-10-30 14:05:04 +08:00

engine.py

2025-10-28 20:42:12 -07:00

expert_service.py

2025-10-30 09:50:49 +08:00

kv_cache_interface.py

2025-07-19 23:19:27 +08:00

pooling_params.py

2025-10-29 00:20:28 +08:00

request.py

2025-10-30 19:45:41 +08:00

resource_manager.py

2025-10-15 11:49:24 +08:00

sampling_params.py

2025-10-29 00:08:53 +08:00

tasks.py

2025-10-29 00:20:28 +08:00