polish code with new pre-commit rule (#2923)

2025-10-05 08:37:06 +08:00 · 2025-07-19 23:19:27 +08:00
parent b8676d71a8
commit 25698d56d1
424 changed files with 14307 additions and 13518 deletions
--- a/fastdeploy/model_executor/layers/lm_head.py
+++ b/fastdeploy/model_executor/layers/lm_head.py
@@ -77,11 +77,9 @@ class ParallelLMHead(nn.Layer):
                self.linear = ColumnParallelLinear(
                    embedding_dim,
                    num_embeddings,
-                    mp_group=fleet.get_hybrid_communicate_group().
-                    get_model_parallel_group(),
+                    mp_group=fleet.get_hybrid_communicate_group().get_model_parallel_group(),
                    weight_attr=None,
-                    has_bias=True
-                    if self.bias_key is not None else False,
+                    has_bias=True if self.bias_key is not None else False,
                    gather_output=need_gather,
                    fuse_matmul_bias=False,  # False diff更小
                )
@@ -89,17 +87,14 @@ class ParallelLMHead(nn.Layer):
                self.linear = RowParallelLinear(
                    embedding_dim,
                    num_embeddings,
-                    mp_group=fleet.get_hybrid_communicate_group().
-                    get_model_parallel_group(),
+                    mp_group=fleet.get_hybrid_communicate_group().get_model_parallel_group(),
                    weight_attr=None,
-                    has_bias=True
-                    if self.bias_key is not None else False,
+                    has_bias=True if self.bias_key is not None else False,
                    input_is_parallel=False,
                    fuse_matmul_bias=False,  # False diff更小
                )

-    def load_state_dict(self, state_dict: Dict[str,
-                                               paddle.Tensor | np.ndarray]):
+    def load_state_dict(self, state_dict: Dict[str, paddle.Tensor | np.ndarray]):
        """
        Load the checkpoint state dictionary into the layer.

@@ -108,25 +103,20 @@ class ParallelLMHead(nn.Layer):
        """

        if self.use_ep:
-            self.weight.set_value(
-                get_tensor(state_dict.pop(self.weight_key)).astype(
-                    paddle.get_default_dtype()))
+            self.weight.set_value(get_tensor(state_dict.pop(self.weight_key)).astype(paddle.get_default_dtype()))
        else:
            if self.tie_word_embeddings:
                self.linear.weight.set_value(
-                    get_tensor(state_dict.pop(self.weight_key)).astype(
-                        paddle.get_default_dtype()).transpose([1, 0]))
+                    get_tensor(state_dict.pop(self.weight_key)).astype(paddle.get_default_dtype()).transpose([1, 0])
+                )
            else:
-                weight_tensor = get_tensor(
-                    state_dict.pop(self.weight_key)).astype(
-                        paddle.get_default_dtype())
+                weight_tensor = get_tensor(state_dict.pop(self.weight_key)).astype(paddle.get_default_dtype())
                if self.linear.weight.shape != weight_tensor.shape:
                    weight_tensor = weight_tensor.transpose([1, 0])
                self.linear.weight.set_value(weight_tensor)

            if self.bias_key is not None:
-                bias = get_tensor(state_dict.pop(self.bias_key)).astype(
-                    paddle.get_default_dtype())
+                bias = get_tensor(state_dict.pop(self.bias_key)).astype(paddle.get_default_dtype())
                self.linear.bias.set_value(bias)

    def forward(self, input: paddle.Tensor) -> paddle.Tensor: