Add stable ci (#3460)

* add stable ci * fix * update * fix * rename tests dir;fix stable ci bug * add timeout limit * update
2025-10-12 20:11:20 +08:00 · 2025-08-20 08:57:17 +08:00
parent 67298cf4c0
commit 3a6058e445
87 changed files with 453 additions and 111 deletions
--- a/tests/utils/test_custom_chat_template.py
+++ b/tests/utils/test_custom_chat_template.py
@@ -0,0 +1,205 @@
+import os
+import unittest
+from pathlib import Path
+from unittest.mock import AsyncMock, MagicMock, mock_open, patch
+
+from fastdeploy.engine.request import Request
+from fastdeploy.engine.sampling_params import SamplingParams
+from fastdeploy.entrypoints.chat_utils import load_chat_template
+from fastdeploy.entrypoints.llm import LLM
+from fastdeploy.entrypoints.openai.protocol import ChatCompletionRequest
+from fastdeploy.entrypoints.openai.serving_chat import OpenAIServingChat
+from fastdeploy.input.ernie_processor import ErnieProcessor
+from fastdeploy.input.ernie_vl_processor import ErnieMoEVLProcessor
+from fastdeploy.input.text_processor import DataProcessor
+
+
+class TestLodChatTemplate(unittest.IsolatedAsyncioTestCase):
+
+    def setUp(self):
+        """
+        Set up the test environment by creating an instance of the LLM class using Mock.
+        """
+        self.input_chat_template = "unit test \n"
+        self.mock_engine = MagicMock()
+        self.tokenizer = MagicMock()
+
+    def test_load_chat_template_non(self):
+        result = load_chat_template(None)
+        self.assertEqual(None, result)
+
+    def test_load_chat_template_str(self):
+        result = load_chat_template(self.input_chat_template)
+        self.assertEqual(self.input_chat_template, result)
+
+    def test_load_chat_template_path(self):
+        with open("chat_template", "w", encoding="utf-8") as file:
+            file.write(self.input_chat_template)
+        file_path = os.path.join(os.getcwd(), "chat_template")
+        result = load_chat_template(file_path)
+        os.remove(file_path)
+        self.assertEqual(self.input_chat_template, result)
+
+    def test_load_chat_template_non_str_and_path(self):
+        with self.assertRaises(ValueError):
+            load_chat_template("unit test")
+
+    def test_path_with_literal_true(self):
+        with self.assertRaises(TypeError):
+            load_chat_template(Path("./chat_template"), is_literal=True)
+
+    def test_path_object_file_error(self):
+        with patch("builtins.open", mock_open()) as mock_file:
+            mock_file.side_effect = OSError("File error")
+            with self.assertRaises(OSError):
+                load_chat_template(Path("./chat_template"))
+
+    async def test_serving_chat(self):
+        request = ChatCompletionRequest(messages=[{"role": "user", "content": "你好"}])
+        self.chat_completion_handler = OpenAIServingChat(
+            self.mock_engine, pid=123, ips=None, max_waiting_time=-1, chat_template=self.input_chat_template
+        )
+
+        async def mock_chat_completion_full_generator(
+            request, request_id, model_name, prompt_token_ids, text_after_process
+        ):
+            return prompt_token_ids
+
+        def mock_format_and_add_data(current_req_dict):
+            return current_req_dict
+
+        self.chat_completion_handler.chat_completion_full_generator = mock_chat_completion_full_generator
+        self.chat_completion_handler.engine_client.format_and_add_data = mock_format_and_add_data
+        self.chat_completion_handler.engine_client.semaphore = AsyncMock()
+        self.chat_completion_handler.engine_client.semaphore.acquire = AsyncMock(return_value=None)
+        self.chat_completion_handler.engine_client.semaphore.status = MagicMock(return_value="mock_status")
+        chat_completiom = await self.chat_completion_handler.create_chat_completion(request)
+        self.assertEqual(self.input_chat_template, chat_completiom["chat_template"])
+
+    async def test_serving_chat_cus(self):
+        request = ChatCompletionRequest(messages=[{"role": "user", "content": "hi"}], chat_template="hello")
+        self.chat_completion_handler = OpenAIServingChat(
+            self.mock_engine, pid=123, ips=None, max_waiting_time=10, chat_template=self.input_chat_template
+        )
+
+        async def mock_chat_completion_full_generator(
+            request, request_id, model_name, prompt_token_ids, text_after_process
+        ):
+            return prompt_token_ids
+
+        def mock_format_and_add_data(current_req_dict):
+            return current_req_dict
+
+        self.chat_completion_handler.chat_completion_full_generator = mock_chat_completion_full_generator
+        self.chat_completion_handler.engine_client.format_and_add_data = mock_format_and_add_data
+        self.chat_completion_handler.engine_client.semaphore = AsyncMock()
+        self.chat_completion_handler.engine_client.semaphore.acquire = AsyncMock(return_value=None)
+        self.chat_completion_handler.engine_client.semaphore.status = MagicMock(return_value="mock_status")
+        chat_completion = await self.chat_completion_handler.create_chat_completion(request)
+        self.assertEqual("hello", chat_completion["chat_template"])
+
+    @patch("fastdeploy.input.ernie_vl_processor.ErnieMoEVLProcessor.__init__")
+    def test_vl_processor(self, mock_class):
+        mock_class.return_value = None
+        vl_processor = ErnieMoEVLProcessor()
+        mock_request = Request.from_dict({"request_id": "123"})
+
+        def mock_apply_default_parameters(request):
+            return request
+
+        def mock_process_request(request, max_model_len):
+            return request
+
+        vl_processor._apply_default_parameters = mock_apply_default_parameters
+        vl_processor.process_request_dict = mock_process_request
+        result = vl_processor.process_request(mock_request, chat_template="hello")
+        self.assertEqual("hello", result.chat_template)
+
+    @patch("fastdeploy.input.text_processor.DataProcessor.__init__")
+    def test_text_processor_process_request(self, mock_class):
+        mock_class.return_value = None
+        text_processor = DataProcessor()
+        mock_request = Request.from_dict(
+            {"request_id": "123", "prompt": "hi", "max_tokens": 128, "temperature": 1, "top_p": 1}
+        )
+
+        def mock_apply_default_parameters(request):
+            return request
+
+        def mock_process_request(request, max_model_len):
+            return request
+
+        def mock_text2ids(text, max_model_len):
+            return [1]
+
+        text_processor._apply_default_parameters = mock_apply_default_parameters
+        text_processor.process_request_dict = mock_process_request
+        text_processor.text2ids = mock_text2ids
+        text_processor.eos_token_ids = [1]
+        result = text_processor.process_request(mock_request, chat_template="hello")
+        self.assertEqual("hello", result.chat_template)
+
+    @patch("fastdeploy.input.ernie_processor.ErnieProcessor.__init__")
+    def test_ernie_processor_process(self, mock_class):
+        mock_class.return_value = None
+        ernie_processor = ErnieProcessor()
+        mock_request = Request.from_dict(
+            {"request_id": "123", "messages": ["hi"], "max_tokens": 128, "temperature": 1, "top_p": 1}
+        )
+
+        def mock_apply_default_parameters(request):
+            return request
+
+        def mock_process_request(request, max_model_len):
+            return request
+
+        def mock_messages2ids(text):
+            return [1]
+
+        ernie_processor._apply_default_parameters = mock_apply_default_parameters
+        ernie_processor.process_request_dict = mock_process_request
+        ernie_processor.messages2ids = mock_messages2ids
+        ernie_processor.eos_token_ids = [1]
+        result = ernie_processor.process_request(mock_request, chat_template="hello")
+        self.assertEqual("hello", result.chat_template)
+
+    @patch("fastdeploy.entrypoints.llm.LLM.__init__")
+    def test_llm_load(self, mock_class):
+        mock_class.return_value = None
+        llm = LLM()
+        llm.llm_engine = MagicMock()
+        llm.default_sampling_params = MagicMock()
+        llm.chat_template = "hello"
+
+        def mock_run_engine(req_ids, **kwargs):
+            return req_ids
+
+        def mock_add_request(**kwargs):
+            return kwargs.get("chat_template")
+
+        llm._run_engine = mock_run_engine
+        llm._add_request = mock_add_request
+        result = llm.chat(["hello"], sampling_params=SamplingParams(1))
+        self.assertEqual("hello", result)
+
+    @patch("fastdeploy.entrypoints.llm.LLM.__init__")
+    def test_llm(self, mock_class):
+        mock_class.return_value = None
+        llm = LLM()
+        llm.llm_engine = MagicMock()
+        llm.default_sampling_params = MagicMock()
+
+        def mock_run_engine(req_ids, **kwargs):
+            return req_ids
+
+        def mock_add_request(**kwargs):
+            return kwargs.get("chat_template")
+
+        llm._run_engine = mock_run_engine
+        llm._add_request = mock_add_request
+        result = llm.chat(["hello"], sampling_params=SamplingParams(1), chat_template="hello")
+        self.assertEqual("hello", result)
+
+
+if __name__ == "__main__":
+    unittest.main()