[CUDAGraph]Switch the scope so that output buffer of CUDAGraph can automatically release (#3612)

* fix typo * fix typo * add print dot files * fix bug * Switch the scope so that output buffer of cudagraph can automatically release * Revert "add print dot files" This reverts commit dc21809eb5.
2025-10-06 00:57:33 +08:00 · 2025-08-26 21:28:19 +08:00
parent 82e64b13e1
commit f0a362af18
3 changed files with 34 additions and 17 deletions
--- a/tests/graph_optimization/test_cuda_graph_dynamic_subgraph.py
+++ b/tests/graph_optimization/test_cuda_graph_dynamic_subgraph.py
@@ -153,7 +153,7 @@ class TestCUDAGrpahSubgraph(unittest.TestCase):
        graph_opt_config = GraphOptimizationConfig(args={})
        graph_opt_config.use_cudagraph = True
        parallel_config = ParallelConfig(args={})
-        parallel_config.max_num_seqs = 1
+        parallel_config.max_num_seqs = 8
        cache_config = CacheConfig({})
        # Initialize cuda graph capture list
        graph_opt_config._set_cudagraph_sizes(max_num_seqs=parallel_config.max_num_seqs)
@@ -167,7 +167,7 @@ class TestCUDAGrpahSubgraph(unittest.TestCase):

        # Run Test Case1
        test_model1 = TestModel1(fd_config=fd_config)
-        input_tensor1 = paddle.ones([32768])
+        input_tensor1 = paddle.ones([8])
        forward_meta1 = ForwardMeta(input_ids=input_tensor1, ids_remove_padding=input_tensor1, step_use_cudagraph=True)

        # Triger Capture
@@ -180,7 +180,7 @@ class TestCUDAGrpahSubgraph(unittest.TestCase):
        # Corrent output
        output1_correct = test_model1.forward_correct(ids_remove_padding=input_tensor1, forward_meta=forward_meta1)

-        assert sum(output1 - output1_correct) == 0
+        assert (output1 == output1_correct).all()


 if __name__ == "__main__":