From 283da92bfadde22fc68bf9c6cddaeef91c56b16d Mon Sep 17 00:00:00 2001
From: RichardWooSJTU <37864677+RichardWooSJTU@users.noreply.github.com>
Date: Tue, 12 Aug 2025 15:38:28 +0800
Subject: [PATCH] fix ep lm head (#3244)

Co-authored-by: yuanxiaolan <yuanxiaolan01@baidu.com>
---
 fastdeploy/model_executor/layers/lm_head.py | 6 ++----
 1 file changed, 2 insertions(+), 4 deletions(-)

diff --git a/fastdeploy/model_executor/layers/lm_head.py b/fastdeploy/model_executor/layers/lm_head.py
index 6a76a72f7..dce0ccbc4 100644
--- a/fastdeploy/model_executor/layers/lm_head.py
+++ b/fastdeploy/model_executor/layers/lm_head.py
@@ -118,9 +118,7 @@ class ParallelLMHead(nn.Layer):
         if self.use_ep:
             self.weight.set_value(get_tensor(state_dict.pop(self.weight_key)).astype(paddle.get_default_dtype()))
             if self.bias_key is not None:
-                self.bias.set_value(
-                    get_tensor(state_dict.pop(self.linear_bias_key)).astype(paddle.get_default_dtype())
-                )
+                self.bias.set_value(get_tensor(state_dict.pop(self.bias_key)).astype(paddle.get_default_dtype()))
         else:
             if self.tie_word_embeddings:
                 self.linear.weight.set_value(
@@ -148,7 +146,7 @@ class ParallelLMHead(nn.Layer):
         """
         logits = input
         if self.use_ep:
-            if self.linear_bias_key is None:
+            if self.bias_key is None:
                 logits = paddle.matmul(logits, self.weight)
             else:
                 logits = paddle.incubate.nn.functional.fused_linear(logits, self.weight, self.bias)