This website requires JavaScript.
Explore
Help
Sign In
apps
/
FastDeploy
Watch
1
Star
0
Fork
0
You've already forked FastDeploy
mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced
2025-12-24 13:28:13 +08:00
Code
Issues
Actions
2
Packages
Projects
Releases
Wiki
Activity
Files
39ed715b5e05e89b5f9cc485f8a684bc71b18f3c
FastDeploy
/
custom_ops
/
gpu_ops
History
…
..
append_attn
…
common
…
cutlass_extensions
…
cutlass_kernels
…
fp8_gemm_with_cutlass
…
glog
…
int8_gemm_with_cutlass
…
moe
…
quantization
…
sample_kernels
…
speculate_decoding
…
append_attention.cu
…
beam_search_softmax.cu
…
cpp_extensions.cc
…
cuda_multiprocess.h
…
dequant_int8.cu
…
enforce_generation.cu
…
extract_text_token_output.cu
…
fused_get_rope.cu
…
gather_idx.cu
…
get_data_ptr_ipc.cu
…
get_mm_split_fuse.cc
…
get_output_ep.cc
…
get_output_msg_with_topk.cc
…
get_output.cc
…
get_padding_offset_system.cu
…
get_padding_offset.cu
…
helper.cu
…
helper.h
…
init_signal_layerwise.cc
…
ipc_sent_key_value_cache_by_remote_ptr.cu
…
msg_utils.h
…
ngram_mask.cu
…
open_shm_and_get_meta_signal.cc
…
per_token_quant_fp8.cu
…
read_data_ipc.cu
…
read_ids.py
…
read_temp_ids.py
…
rebuild_padding.cu
…
remote_cache_kv_ipc.cc
…
remote_cache_kv_ipc.h
…
save_output_msg_with_topk.cc
…
save_with_output_msg.cc
…
save_with_output_msg.h
…
save_with_output.cc
…
scaled_gemm_f8_i4_f16_gemm.cu
…
scaled_gemm_f8_i4_f16_weight_quantize.cu
…
seqs2seqs.cu
…
set_data_ipc.cu
…
set_flags.cu
…
set_mask_value.cu
…
set_value_by_flags.cu
…
share_external_data.cu
…
step_reschedule.cu
…
step_system_cache.cu
…
step.cu
…
stop_generation_multi_ends.cu
…
stop_generation_multi_stop_seqs.cu
…
stop_generation.cu
…
swap_cache_batch.cu
…
swap_cache.cu
…
system2group.cu
…
text_image_gather_scatter.cu
…
text_image_index_out.cu
…
token_penalty_multi_scores.cu
…
token_penalty_only_once.cu
…
token_transfer.hpp
…
transfer_output.cc
…
tune_cublaslt_gemm.cu
…
update_inputs_beam.cu
…
update_inputs.cu
…
update_split_fuse_input.cu
…