fix mask_offset in append_attn (#3745)

* fix mask_offset in append_attn * fix test
2025-10-05 16:48:03 +08:00 · 2025-08-31 15:03:16 +08:00
parent 753772ace8
commit bed09ae8f8
8 changed files with 46 additions and 44 deletions
--- a/fastdeploy/model_executor/layers/attention/attention.py
+++ b/fastdeploy/model_executor/layers/attention/attention.py
@@ -163,14 +163,14 @@ class Attention(nn.Layer):
    def init_weight(self):
        self.q_norm_weight = self.create_parameter(
            shape=[self.qk_head_dim],
-            dtype=self._dtype,
+            dtype="float32",
            is_bias=False,
            default_initializer=paddle.nn.initializer.Constant(0),
        )

        self.k_norm_weight = self.create_parameter(
            shape=[self.qk_head_dim],
-            dtype=self._dtype,
+            dtype="float32",
            is_bias=False,
            default_initializer=paddle.nn.initializer.Constant(0),
        )
@@ -184,8 +184,8 @@ class Attention(nn.Layer):
        if self.use_qk_norm:
            q_norm_weight_tensor = paddle.to_tensor(get_tensor(state_dict.pop(self.q_norm_key + ".weight")))
            k_norm_weight_tensor = paddle.to_tensor(get_tensor(state_dict.pop(self.k_norm_key + ".weight")))
-            self.q_norm_weight.set_value(q_norm_weight_tensor)
-            self.k_norm_weight.set_value(k_norm_weight_tensor)
+            self.q_norm_weight.set_value(q_norm_weight_tensor.astype("float32"))
+            self.k_norm_weight.set_value(k_norm_weight_tensor.astype("float32"))

    def forward(
        self,