This website requires JavaScript.
Explore
Help
Sign In
apps
/
FastDeploy
Watch
1
Star
0
Fork
0
You've already forked FastDeploy
mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced
2025-10-06 09:07:10 +08:00
Code
Issues
Actions
2
Packages
Projects
Releases
Wiki
Activity
Files
4f460db5568d3a70e8255183df5dcfc709b0ac12
FastDeploy
/
custom_ops
/
gpu_ops
History
…
..
append_attn
…
common
…
custom_all_reduce
…
cutlass_extensions
…
cutlass_kernels
…
flash_mask_attn
…
fp8_gemm_with_cutlass
…
glog
…
int8_gemm_with_cutlass
…
machete
…
mla_attn
…
moba_attn
…
moe
…
quantization
…
sample_kernels
…
speculate_decoding
…
w4afp8_gemm
…
wfp8afp8_sparse_gemm
…
append_attention.cu
…
beam_search_softmax.cu
…
cpp_extensions.cc
…
cuda_multiprocess.h
…
dequant_int8.cu
…
enforce_generation.cu
…
env.h
…
extract_text_token_output.cu
…
fused_get_rope.cu
…
fused_hadamard_quant_fp8.cu
…
fused_rotary_position_encoding.cu
…
gather_idx.cu
…
get_data_ptr_ipc.cu
…
get_img_boundaries.cc
…
get_mm_split_fuse.cc
…
get_output_ep.cc
…
get_output_msg_with_topk.cc
…
get_output.cc
…
get_padding_offset_system.cu
…
get_padding_offset.cu
…
get_position_ids_and_mask_encoder_batch.cu
…
helper.cu
…
helper.h
…
init_signal_layerwise.cc
…
ipc_sent_key_value_cache_by_remote_ptr.cu
…
merge_prefill_decode_output.cu
…
msg_utils.h
…
multi_head_latent_attention.cu
…
ngram_mask.cu
…
noaux_tc.cu
…
noauxtc_kernel.h
…
open_shm_and_get_meta_signal.cc
…
per_token_quant_fp8.cu
…
read_data_ipc.cu
…
read_ids.py
…
read_temp_ids.py
…
rebuild_padding.cu
…
recover_decode_task.cu
…
remote_cache_kv_ipc.cc
…
remote_cache_kv_ipc.h
…
save_output_msg_with_topk.cc
…
save_with_output_msg.cc
…
save_with_output_msg.h
…
save_with_output.cc
…
scaled_gemm_f8_i4_f16_gemm.cu
…
scaled_gemm_f8_i4_f16_weight_quantize.cu
…
seqs2seqs.cu
…
set_data_ipc.cu
…
set_flags.cu
…
set_mask_value.cu
…
set_value_by_flags.cu
…
share_external_data.cu
…
step_reschedule.cu
…
step_system_cache.cu
…
step.cu
…
stop_generation_multi_ends.cu
…
stop_generation.cu
…
swap_cache_batch.cu
…
swap_cache.cu
…
system2group.cu
…
text_image_gather_scatter.cu
…
text_image_index_out.cu
…
token_penalty_multi_scores.cu
…
token_penalty_only_once.cu
…
token_transfer.hpp
…
transfer_output.cc
…
tune_cublaslt_gemm.cu
…
unset_data_ipc.cu
…
update_inputs_beam.cu
…
update_inputs_v1.cu
…
update_inputs.cu
…
update_split_fuse_input.cu
…