[Others] add PADDLE_ENFORCE (#5288)

2025-12-24 13:28:13 +08:00 · 2025-11-28 14:23:35 +08:00
parent 1539fd6056
commit 95243f012c
2 changed files with 9 additions and 4 deletions
--- a/custom_ops/gpu_ops/per_token_quant_fp8.cu
+++ b/custom_ops/gpu_ops/per_token_quant_fp8.cu
@@ -232,6 +232,11 @@ std::vector<paddle::Tensor> PerTokenQuantPadding(paddle::Tensor &input,
  auto input_dim = input.dims();
  const int token_num = input_dim[0];
  const int hidden_size = input_dim[1];
+
+  PADDLE_ENFORCE(block_size == 128, "now only support block_size = 128");
+  PADDLE_ENFORCE(hidden_size % 128 == 0,
+                 "hidden_size must be divisible by 128");
+
  const int hidden_size_scale = hidden_size / block_size;
  auto quanted_x = GetEmptyTensor(
      {token_num, hidden_size}, paddle::DataType::FLOAT8_E4M3FN, input.place());