This website requires JavaScript.
Explore
Help
Sign In
apps
/
FastDeploy
Watch
1
Star
0
Fork
0
You've already forked FastDeploy
mirror of
https://github.com/PaddlePaddle/FastDeploy.git
synced
2025-12-24 13:28:13 +08:00
Code
Issues
Actions
2
Packages
Projects
Releases
Wiki
Activity
Files
af03da512748c5098a5c005be30c47d2c73c378a
FastDeploy
/
custom_ops
/
gpu_ops
/
speculate_decoding
History
…
..
draft_model
…
ngram_match.cc
…
speculate_calcu_accept_ratio.cu
…
speculate_clear_accept_nums.cu
…
speculate_get_output_padding_offset.cu
…
speculate_get_output_with_topk.cc
…
speculate_get_output.cc
…
speculate_get_padding_offset.cu
…
speculate_get_seq_lens_output.cu
…
speculate_get_token_penalty_multi_scores.cu
…
speculate_limit_thinking_content_length_v1.cu
…
speculate_limit_thinking_content_length_v2.cu
…
speculate_logprob_utils.cu
…
speculate_msg.h
…
speculate_save_output_with_topk.cc
…
speculate_save_output.cc
…
speculate_schedule_cache.cu
…
speculate_set_stop_value_multi_seqs.cu
…
speculate_set_value_by_flags_and_idx.cu
…
speculate_step_reschedule.cu
…
speculate_step_system_cache.cu
…
speculate_step.cu
…
speculate_update_input_ids_cpu.cc
…
speculate_update.cu
…
speculate_verify.cu
…
top_p_candidates.cu
…