magail4autodrive: first commit

2025-09-28 18:57:04 +08:00
commit 947871a720
90 changed files with 1037 additions and 0 deletions
--- a/Env/exp_converted/dataset_mapping.pkl
+++ b/Env/exp_converted/dataset_mapping.pkl
--- a/Env/exp_converted/dataset_summary.pkl
+++ b/Env/exp_converted/dataset_summary.pkl
--- a/Env/exp_converted/exp_converted_0/dataset_mapping.pkl
+++ b/Env/exp_converted/exp_converted_0/dataset_mapping.pkl
--- a/Env/exp_converted/exp_converted_0/dataset_summary.pkl
+++ b/Env/exp_converted/exp_converted_0/dataset_summary.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_104202f4f2590dff.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_104202f4f2590dff.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_11e688db089d222.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_11e688db089d222.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_197433a84d86f4b6.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_197433a84d86f4b6.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_21f584ad2dd5d7b8.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_21f584ad2dd5d7b8.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2364a51095c69102.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2364a51095c69102.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_25f57f7ef66cdfe6.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_25f57f7ef66cdfe6.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_27e52c5f34743a32.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_27e52c5f34743a32.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2aa43fad083efbf3.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2aa43fad083efbf3.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2bc07893b2abbb07.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2bc07893b2abbb07.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2e0e37f5efeb70af.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_2e0e37f5efeb70af.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_3114f7fbaa8cc086.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_3114f7fbaa8cc086.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_32f0ee473bcb2854.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_32f0ee473bcb2854.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_3946229358696c01.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_3946229358696c01.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_3ec9f6dfb2b48d65.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_3ec9f6dfb2b48d65.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_41600af30ab8cc55.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_41600af30ab8cc55.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_430a2693b92ba127.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_430a2693b92ba127.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_44dc56e65fc65a82.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_44dc56e65fc65a82.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_4a116dacc9ccc4df.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_4a116dacc9ccc4df.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_4bf1d627f1771287.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_4bf1d627f1771287.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_546259711161a341.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_546259711161a341.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_5510d6a966ccc52f.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_5510d6a966ccc52f.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_568458c3148c034.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_568458c3148c034.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_5915f8cd44872858.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_5915f8cd44872858.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_5cac897a524d2f40.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_5cac897a524d2f40.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_66854d30a65d1216.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_66854d30a65d1216.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_671dec7d5e2fa9fb.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_671dec7d5e2fa9fb.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_6ecd6ab6d573b137.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_6ecd6ab6d573b137.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_707f27ea3927b4f5.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_707f27ea3927b4f5.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_715dfdaa4cf40df5.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_715dfdaa4cf40df5.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_79776dd1931a3d26.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_79776dd1931a3d26.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7ac22c9e42d05c79.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7ac22c9e42d05c79.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7c003f7b2af6419e.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7c003f7b2af6419e.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7ce76dd8013b8b9e.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7ce76dd8013b8b9e.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7f94d7eac202a8f6.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_7f94d7eac202a8f6.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_852bf8201e701c22.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_852bf8201e701c22.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8998493f69081ab0.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8998493f69081ab0.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8a720808ec3c0864.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8a720808ec3c0864.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8bd2c7c34e2a7e91.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8bd2c7c34e2a7e91.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8c4eaec3edd72d1b.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_8c4eaec3edd72d1b.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_90cdf8a7cb0e097f.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_90cdf8a7cb0e097f.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_90f674b6f7dad649.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_90f674b6f7dad649.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_914a764cef3668a2.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_914a764cef3668a2.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9570610abd87b982.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9570610abd87b982.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_96d0ccbfef0829e5.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_96d0ccbfef0829e5.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9859cd1b4315b7de.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9859cd1b4315b7de.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_98cd28f72a641e8f.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_98cd28f72a641e8f.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9d7563e9b6486022.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9d7563e9b6486022.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9ec70bf90d6fe529.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_9ec70bf90d6fe529.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_a7a3a82d61f0e91e.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_a7a3a82d61f0e91e.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_a7eb07f173d68ce5.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_a7eb07f173d68ce5.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_a88f67a4ee877e62.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_a88f67a4ee877e62.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_ab06fe2bdd70dee8.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_ab06fe2bdd70dee8.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_b29b20e997b76ea3.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_b29b20e997b76ea3.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_b35779bf7e37ece9.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_b35779bf7e37ece9.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_b6152ff56baf6817.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_b6152ff56baf6817.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_beeee363eeb3f708.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_beeee363eeb3f708.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_bffa6dd429936879.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_bffa6dd429936879.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c354985f8a63a390.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c354985f8a63a390.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c453b2059c68c41c.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c453b2059c68c41c.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c692808f8d63a7ec.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c692808f8d63a7ec.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c93b188ee1c507d5.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_c93b188ee1c507d5.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_cb3413b9e69ae5ab.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_cb3413b9e69ae5ab.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_cbcf4099dfd4f9fb.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_cbcf4099dfd4f9fb.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_cebdf28156152fd6.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_cebdf28156152fd6.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_d5327587f925c58e.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_d5327587f925c58e.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_d6d0e0ed8c763a8a.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_d6d0e0ed8c763a8a.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_d8036e6d7e2a86a2.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_d8036e6d7e2a86a2.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_df74ad0cc6823304.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_df74ad0cc6823304.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_dfbfcbfc1b6f7f7a.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_dfbfcbfc1b6f7f7a.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_e12f0928016d6956.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_e12f0928016d6956.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_e2030d66ebfe7b6b.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_e2030d66ebfe7b6b.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_eb073968f66914c7.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_eb073968f66914c7.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_f346701fdc8818d1.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_f346701fdc8818d1.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_f6e89ee29a5f20b2.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_f6e89ee29a5f20b2.pkl
--- a/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_f84a2c81fec0b16.pkl
+++ b/Env/exp_converted/exp_converted_0/sd_waymo_v1.2_f84a2c81fec0b16.pkl
--- a/Env/run_multiagent_env.py
+++ b/Env/run_multiagent_env.py
@@ -0,0 +1,41 @@
+from scenario_env import MultiAgentScenarioEnv
+from Env.simple_idm_policy import ConstantVelocityPolicy
+from metadrive.engine.asset_loader import AssetLoader
+
+WAYMO_DATA_DIR = r"/home/zhy/桌面/MAGAIL_TR/Env"
+
+def main():
+    env = MultiAgentScenarioEnv(
+        config={
+            # "data_directory": AssetLoader.file_path(AssetLoader.asset_path, "waymo", unix_style=False),
+            "data_directory": AssetLoader.file_path(WAYMO_DATA_DIR, "exp_converted", unix_style=False),
+            "is_multi_agent": True,
+            "num_controlled_agents": 3,
+            "horizon": 300,
+            "use_render": True,
+            "sequential_seed": True,
+            "reactive_traffic": True,
+            "manual_control": True,
+        },
+        agent2policy=ConstantVelocityPolicy(target_speed=50)
+    )
+
+    obs = env.reset(0
+                    )
+    for step in range(10000):
+        actions = {
+            aid: env.controlled_agents[aid].policy.act()
+            for aid in env.controlled_agents
+        }
+
+        obs, rewards, dones, infos = env.step(actions)
+        env.render(mode="topdown")
+
+        if dones["__all__"]:
+            break
+
+    env.close()
+
+
+if __name__ == "__main__":
+    main()
--- a/Env/scenario_env.py
+++ b/Env/scenario_env.py
@@ -0,0 +1,204 @@
+import numpy as np
+from metadrive.component.navigation_module.node_network_navigation import NodeNetworkNavigation
+from metadrive.envs.scenario_env import ScenarioEnv
+from metadrive.component.vehicle.vehicle_type import DefaultVehicle, vehicle_class_to_type
+import math
+import logging
+from collections import defaultdict
+from typing import Union, Dict, AnyStr
+from metadrive.engine.logger import get_logger, set_log_level
+from metadrive.type import MetaDriveType
+
+
+class PolicyVehicle(DefaultVehicle):
+    def __init__(self, *args, **kwargs):
+        super().__init__(*args, **kwargs)
+        self.policy = None
+        self.destination = None
+
+    def set_policy(self, policy):
+        self.policy = policy
+
+    def set_destination(self, des):
+        self.destination = des
+
+    def act(self, observation, policy=None):
+        if self.policy is not None:
+            return self.policy.act(observation)
+        else:
+            return self.action_space.sample()
+
+    def before_step(self, action):
+        self.last_position = self.position  # 2D vector
+        self.last_velocity = self.velocity  # 2D vector
+        self.last_speed = self.speed  # Scalar
+        self.last_heading_dir = self.heading
+        if action is not None:
+            self.last_current_action.append(action)
+        self._set_action(action)
+
+    def is_done(self):
+        # arrive or crash
+        pass
+
+
+vehicle_class_to_type[PolicyVehicle] = "default"
+
+
+class MultiAgentScenarioEnv(ScenarioEnv):
+    @classmethod
+    def default_config(cls):
+        config = super().default_config()
+        config.update(dict(
+            data_directory=None,
+            num_controlled_agents=3,
+            horizon=1000,
+        ))
+        return config
+
+    def __init__(self, config, agent2policy):
+        self.policy = agent2policy
+        self.controlled_agents = {}
+        self.controlled_agent_ids = []
+        self.obs_list = []
+        self.round = 0
+        super().__init__(config)
+
+    def reset(self, seed: Union[None, int] = None):
+        self.round = 0
+        if self.logger is None:
+            self.logger = get_logger()
+            log_level = self.config.get("log_level", logging.DEBUG if self.config.get("debug", False) else logging.INFO)
+            set_log_level(log_level)
+
+        self.lazy_init()
+        self._reset_global_seed(seed)
+        if self.engine is None:
+            raise ValueError("Broken MetaDrive instance.")
+
+        # 记录专家数据中每辆车的位置，接着全部清除，只保留位置等信息，用于后续生成
+        _obj_to_clean_this_frame = []
+        self.car_birth_info_list = []
+        for scenario_id, track in self.engine.traffic_manager.current_traffic_data.items():
+            if scenario_id == self.engine.traffic_manager.sdc_scenario_id:
+                continue
+            else:
+                if track["type"] == MetaDriveType.VEHICLE:
+                    _obj_to_clean_this_frame.append(scenario_id)
+                    valid = track['state']['valid']
+                    first_show = np.argmax(valid) if valid.any() else -1
+                    last_show = len(valid) - 1 - np.argmax(valid[::-1]) if valid.any() else -1
+                    # id，出现时间，出生点坐标，出生朝向，目的地
+                    self.car_birth_info_list.append({
+                        'id': track['metadata']['object_id'],
+                        'show_time': first_show,
+                        'begin': (track['state']['position'][first_show, 0], track['state']['position'][first_show, 1]),
+                        'heading': track['state']['heading'][first_show],
+                        'end': (track['state']['position'][last_show, 0], track['state']['position'][last_show, 1])
+                    })
+
+        for scenario_id in _obj_to_clean_this_frame:
+            self.engine.traffic_manager.current_traffic_data.pop(scenario_id)
+
+        self.engine.reset()
+        self.reset_sensors()
+        self.engine.taskMgr.step()
+
+        self.lanes = self.engine.map_manager.current_map.road_network.graph
+
+        if self.top_down_renderer is not None:
+            self.top_down_renderer.clear()
+            self.engine.top_down_renderer = None
+
+        self.dones = {}
+        self.episode_rewards = defaultdict(float)
+        self.episode_lengths = defaultdict(int)
+
+        self.controlled_agents.clear()
+        self.controlled_agent_ids.clear()
+
+        super().reset(seed)  # 初始化场景
+        self._spawn_controlled_agents()
+
+        return self._get_all_obs()
+
+    def _spawn_controlled_agents(self):
+        # ego_vehicle = self.engine.agent_manager.active_agents.get("default_agent")
+        # ego_position = ego_vehicle.position if ego_vehicle else np.array([0, 0])
+        for car in self.car_birth_info_list:
+            if car['show_time'] == self.round:
+                agent_id = f"controlled_{car['id']}"
+
+                vehicle = self.engine.spawn_object(
+                    PolicyVehicle,
+                    vehicle_config={},
+                    position=car['begin'],
+                    heading=car['heading']
+                )
+                vehicle.reset(position=car['begin'], heading=car['heading'])
+
+                vehicle.set_policy(self.policy)
+                vehicle.set_destination(car['end'])
+
+                self.controlled_agents[agent_id] = vehicle
+                self.controlled_agent_ids.append(agent_id)
+
+                # ✅ 关键：注册到引擎的 active_agents，才能参与物理更新
+                self.engine.agent_manager.active_agents[agent_id] = vehicle
+
+    def _get_all_obs(self):
+        # position, velocity, heading, lidar, navigation, TODO: trafficlight -> list
+        self.obs_list = []
+        for agent_id, vehicle in self.controlled_agents.items():
+            state = vehicle.get_state()
+
+            traffic_light = 0
+            for lane in self.lanes.values():
+                if lane.lane.point_on_lane(state['position'][:2]):
+                    if self.engine.light_manager.has_traffic_light(lane.lane.index):
+                        traffic_light = self.engine.light_manager._lane_index_to_obj[lane.lane.index].status
+                        if traffic_light == 'TRAFFIC_LIGHT_GREEN':
+                            traffic_light = 1
+                        elif traffic_light == 'TRAFFIC_LIGHT_YELLOW':
+                            traffic_light = 2
+                        elif traffic_light == 'TRAFFIC_LIGHT_RED':
+                            traffic_light = 3
+                        else:
+                            traffic_light = 0
+                    break
+
+            lidar = self.engine.get_sensor("lidar").perceive(num_lasers=80, distance=30, base_vehicle=vehicle,
+                                                             physics_world=self.engine.physics_world.dynamic_world)
+            side_lidar = self.engine.get_sensor("side_detector").perceive(num_lasers=10, distance=8,
+                                                                          base_vehicle=vehicle,
+                                                                          physics_world=self.engine.physics_world.static_world)
+            lane_line_lidar = self.engine.get_sensor("lane_line_detector").perceive(num_lasers=10, distance=3,
+                                                                                    base_vehicle=vehicle,
+                                                                                    physics_world=self.engine.physics_world.static_world)
+
+            obs = (state['position'][:2] + list(state['velocity']) + [state['heading_theta']]
+                   + lidar[0] + side_lidar[0] + lane_line_lidar[0] + [traffic_light]
+                   + list(vehicle.destination))
+            self.obs_list.append(obs)
+        return self.obs_list
+
+    def step(self, action_dict: Dict[AnyStr, Union[list, np.ndarray]]):
+        self.round += 1
+
+        for agent_id, action in action_dict.items():
+            if agent_id in self.controlled_agents:
+                self.controlled_agents[agent_id].before_step(action)
+
+        self.engine.step()
+
+        for agent_id in action_dict:
+            if agent_id in self.controlled_agents:
+                self.controlled_agents[agent_id].after_step()
+
+        self._spawn_controlled_agents()
+        obs = self._get_all_obs()
+        rewards = {aid: 0.0 for aid in self.controlled_agents}
+        dones = {aid: False for aid in self.controlled_agents}
+        dones["__all__"] = self.episode_step >= self.config["horizon"]
+        infos = {aid: {} for aid in self.controlled_agents}
+        return obs, rewards, dones, infos
--- a/Env/simple_idm_policy.py
+++ b/Env/simple_idm_policy.py
@@ -0,0 +1,18 @@
+import numpy as np
+
+class ConstantVelocityPolicy:
+    def __init__(self, target_speed=50):
+        self.step_num = 0
+
+    def act(self):
+        self.step_num += 1
+        if self.step_num % 30 < 15:
+            throttle = 1.0
+        else:
+            throttle = 1.0
+
+        steering = 0.1
+
+        # return [steering, throttle]
+
+        return [0.0,0.05]
--- a/Env/utils.py
+++ b/Env/utils.py
@@ -0,0 +1,14 @@
+import numpy as np
+import torch
+import random
+
+def set_seed(seed):
+    if seed == -1:
+        seed = np.random.randint(0, 10000)
+    print('Random seed: {}'.format(seed))
+
+    random.seed(seed)
+    np.random.seed(seed)
+    torch.manual_seed(seed)
+    torch.cuda.manual_seed(seed)
+    torch.cuda.manual_seed_all(seed)