change summary file to json

2023-05-06 17:41:25 +01:00
parent 311932c986
commit 13749b6522
5 changed files with 3 additions and 2 deletions
--- a/scenarionet/examples/init.py
+++ b/scenarionet/examples/init.py
--- a/scenarionet/examples/convert_nuplan.py
+++ b/scenarionet/examples/convert_nuplan.py
@@ -0,0 +1,104 @@
+"""
+This script aims to convert nuplan scenarios to ScenarioDescription, so that we can load any nuplan scenarios into
+MetaDrive.
+"""
+import copy
+import os
+import pickle
+import shutil
+
+import tqdm
+from metadrive.scenario.scenario_description import ScenarioDescription
+
+from scenarionet.converter.nuplan.utils import get_nuplan_scenarios, convert_nuplan_scenario
+from scenarionet.converter.utils import dict_recursive_remove_array
+
+
+def convert_nuplan(dataset_params, output_path, worker_index=None, force_overwrite=False):
+    save_path = copy.deepcopy(output_path)
+    output_path = output_path + "_tmp"
+    # meta recorder and data summary
+    if os.path.exists(output_path):
+        shutil.rmtree(output_path)
+    os.makedirs(output_path, exist_ok=False)
+
+    # make real save dir
+    delay_remove = None
+    if os.path.exists(save_path):
+        if force_overwrite:
+            delay_remove = save_path
+        else:
+            raise ValueError("Directory already exists! Abort")
+
+    metadata_recorder = {}
+    total_scenarios = 0
+    desc = ""
+    summary_file = "dataset_summary.pkl"
+    if worker_index is not None:
+        desc += "Worker {} ".format(worker_index)
+        summary_file = "dataset_summary_worker{}.pkl".format(worker_index)
+
+    # Init.
+    scenarios = get_nuplan_scenarios(dataset_params)
+    for scenario in tqdm.tqdm(scenarios):
+        sd_scenario = convert_nuplan_scenario(scenario)
+        sd_scenario = sd_scenario.to_dict()
+        ScenarioDescription.sanity_check(sd_scenario, check_self_type=True)
+        export_file_name = "sd_{}_{}.pkl".format("nuplan", scenario.scenario_name)
+        p = os.path.join(output_path, export_file_name)
+        with open(p, "wb") as f:
+            pickle.dump(sd_scenario, f)
+        metadata_recorder[export_file_name] = copy.deepcopy(sd_scenario[ScenarioDescription.METADATA])
+    # rename and save
+    if delay_remove is not None:
+        shutil.rmtree(delay_remove)
+    os.rename(output_path, save_path)
+    summary_file = os.path.join(save_path, summary_file)
+    with open(summary_file, "wb") as file:
+        pickle.dump(dict_recursive_remove_array(metadata_recorder), file)
+    print("Summary is saved at: {}".format(summary_file))
+    if delay_remove is not None:
+        assert delay_remove == save_path, delay_remove + " vs. " + save_path
+
+
+if __name__ == "__main__":
+    # 14 types
+    all_scenario_types = "[behind_pedestrian_on_pickup_dropoff,  \
+                            near_multiple_vehicles, \
+                            high_magnitude_jerk, \
+                            crossed_by_vehicle, \
+                            following_lane_with_lead, \
+                            changing_lane_to_left, \
+                            accelerating_at_traffic_light_without_lead, \
+                            stopping_at_stop_sign_with_lead, \
+                            traversing_narrow_lane, \
+                            waiting_for_pedestrian_to_cross, \
+                            starting_left_turn, \
+                            starting_high_speed_turn, \
+                            starting_unprotected_cross_turn, \
+                            starting_protected_noncross_turn, \
+                            on_pickup_dropoff]"
+
+    dataset_params = [
+        # builder setting
+        "scenario_builder=nuplan_mini",
+        "scenario_builder.scenario_mapping.subsample_ratio_override=0.5",  # 10 hz
+
+        # filter
+        "scenario_filter=all_scenarios",  # simulate only one log
+        "scenario_filter.remove_invalid_goals=true",
+        "scenario_filter.shuffle=true",
+        "scenario_filter.log_names=['2021.07.16.20.45.29_veh-35_01095_01486']",
+        # "scenario_filter.scenario_types={}".format(all_scenario_types),
+        # "scenario_filter.scenario_tokens=[]",
+        # "scenario_filter.map_names=[]",
+        # "scenario_filter.num_scenarios_per_type=1",
+        # "scenario_filter.limit_total_scenarios=1000",
+        # "scenario_filter.expand_scenarios=true",
+        # "scenario_filter.limit_scenarios_per_type=10",  # use 10 scenarios per scenario type
+        "scenario_filter.timestamp_threshold_s=20",  # minial scenario duration (s)
+    ]
+    output_path = AssetLoader.file_path("nuplan", return_raw_style=False)
+    worker_index = None
+    force_overwrite = True
+    convert_nuplan(output_path, dataset_params, worker_index=worker_index, force_overwrite=force_overwrite)
--- a/scenarionet/examples/convert_nuscenes.py
+++ b/scenarionet/examples/convert_nuscenes.py
@@ -0,0 +1,29 @@
+"""
+This script aims to convert nuscenes scenarios to ScenarioDescription, so that we can load any nuscenes scenarios into
+MetaDrive.
+"""
+import os.path
+
+try:
+    from nuscenes import NuScenes
+except ImportError:
+    raise ImportError("nuscenes-devkit has to be set up before running data conversion")
+from scenarionet import SCENARIONET_DATASET_PATH
+from scenarionet.converter.nuscenes.utils import convert_nuscenes_scenario
+from scenarionet.converter.utils import write_to_directory
+
+if __name__ == "__main__":
+    output_path = os.path.join(SCENARIONET_DATASET_PATH, "nuscenes")
+    version = 'v1.0-mini'
+    dataroot = '/home/shady/data/nuscenes'
+    force_overwrite = True
+    nusc = NuScenes(version=version, dataroot=dataroot)
+    scenarios = nusc.scene
+
+    write_to_directory(convert_func=convert_nuscenes_scenario,
+                       scenarios=scenarios,
+                       output_path=output_path,
+                       dataset_version=version,
+                       dataset_name="nuscenes",
+                       force_overwrite=force_overwrite,
+                       nuscenes=nusc)
--- a/scenarionet/examples/convert_waymo.py
+++ b/scenarionet/examples/convert_waymo.py
@@ -0,0 +1,182 @@
+"""
+This script takes --folder as input. It is the folder storing a batch of tfrecord file.
+This script will create the output folder "processed_data" sharing the same level as `--folder`.
+
+-- folder
+-- processed_data
+
+"""
+import argparse
+import copy
+import os
+import pickle
+
+import numpy as np
+
+from scenarionet.converter.utils import dict_recursive_remove_array, get_agent_summary, get_number_summary
+
+try:
+    import tensorflow as tf
+except ImportError:
+    pass
+
+try:
+    from waymo_open_dataset.protos import scenario_pb2
+except ImportError:
+    try:
+        from metadrive.utils.waymo.protos import scenario_pb2  # Local files that only in PZH's computer.
+    except ImportError:
+        print(
+            "Please install waymo_open_dataset package through metadrive dependencies: "
+            "pip install waymo-open-dataset-tf-2-11-0==1.5.0"
+        )
+
+from metadrive.scenario import ScenarioDescription as SD
+from metadrive.type import MetaDriveType
+from scenarionet.converter.waymo.utils import extract_tracks, extract_dynamic_map_states, extract_map_features, \
+    compute_width
+import sys
+
+
+def convert_waymo(file_list, input_path, output_path, worker_index=None):
+    scenario = scenario_pb2.Scenario()
+
+    metadata_recorder = {}
+
+    total_scenarios = 0
+
+    desc = ""
+    summary_file = "dataset_summary.pkl"
+    if worker_index is not None:
+        desc += "Worker {} ".format(worker_index)
+        summary_file = "dataset_summary_worker{}.pkl".format(worker_index)
+
+    for file_count, file in enumerate(file_list):
+        file_path = os.path.join(input_path, file)
+        if ("tfrecord" not in file_path) or (not os.path.isfile(file_path)):
+            continue
+        dataset = tf.data.TFRecordDataset(file_path, compression_type="")
+
+        total = sum(1 for _ in dataset.as_numpy_iterator())
+
+        for j, data in enumerate(dataset.as_numpy_iterator()):
+            scenario.ParseFromString(data)
+
+            md_scenario = SD()
+
+            md_scenario[SD.ID] = scenario.scenario_id
+            # TODO LQY, get version from original files
+            md_scenario[SD.VERSION] = "1.2"
+
+            # Please note that SDC track index is not identical to sdc_id.
+            # sdc_id is a unique indicator to a track, while sdc_track_index is only the index of the sdc track
+            # in the tracks datastructure.
+
+            track_length = len(list(scenario.timestamps_seconds))
+
+            tracks, sdc_id = extract_tracks(scenario.tracks, scenario.sdc_track_index, track_length)
+
+            md_scenario[SD.LENGTH] = track_length
+
+            md_scenario[SD.TRACKS] = tracks
+
+            dynamic_states = extract_dynamic_map_states(scenario.dynamic_map_states, track_length)
+
+            md_scenario[SD.DYNAMIC_MAP_STATES] = dynamic_states
+
+            map_features = extract_map_features(scenario.map_features)
+            md_scenario[SD.MAP_FEATURES] = map_features
+
+            compute_width(md_scenario[SD.MAP_FEATURES])
+
+            md_scenario[SD.METADATA] = {}
+            md_scenario[SD.METADATA][SD.COORDINATE] = MetaDriveType.COORDINATE_WAYMO
+            md_scenario[SD.METADATA][SD.TIMESTEP] = np.asarray(list(scenario.timestamps_seconds), dtype=np.float32)
+            md_scenario[SD.METADATA][SD.METADRIVE_PROCESSED] = False
+            md_scenario[SD.METADATA][SD.SDC_ID] = str(sdc_id)
+            md_scenario[SD.METADATA]["dataset"] = "waymo"
+            md_scenario[SD.METADATA]["scenario_id"] = scenario.scenario_id
+            md_scenario[SD.METADATA]["source_file"] = str(file)
+            md_scenario[SD.METADATA]["track_length"] = track_length
+
+            # === Waymo specific data. Storing them here ===
+            md_scenario[SD.METADATA]["current_time_index"] = scenario.current_time_index
+            md_scenario[SD.METADATA]["sdc_track_index"] = scenario.sdc_track_index
+
+            # obj id
+            md_scenario[SD.METADATA]["objects_of_interest"] = [str(obj) for obj in scenario.objects_of_interest]
+
+            track_index = [obj.track_index for obj in scenario.tracks_to_predict]
+            track_id = [str(scenario.tracks[ind].id) for ind in track_index]
+            track_difficulty = [obj.difficulty for obj in scenario.tracks_to_predict]
+            track_obj_type = [tracks[id]["type"] for id in track_id]
+            md_scenario[SD.METADATA]["tracks_to_predict"] = {
+                id: {
+                    "track_index": track_index[count],
+                    "track_id": id,
+                    "difficulty": track_difficulty[count],
+                    "object_type": track_obj_type[count]
+                }
+                for count, id in enumerate(track_id)
+            }
+
+            export_file_name = "sd_{}_{}.pkl".format(file, scenario.scenario_id)
+
+            summary_dict = {}
+            summary_dict["sdc"] = get_agent_summary(
+                state_dict=md_scenario.get_sdc_track()["state"], id=sdc_id, type=md_scenario.get_sdc_track()["type"]
+            )
+            for track_id, track in md_scenario[SD.TRACKS].items():
+                summary_dict[track_id] = get_agent_summary(state_dict=track["state"], id=track_id, type=track["type"])
+            md_scenario[SD.METADATA]["object_summary"] = summary_dict
+
+            # Count some objects occurrence
+            md_scenario[SD.METADATA]["number_summary"] = get_number_summary(md_scenario)
+
+            metadata_recorder[export_file_name] = copy.deepcopy(md_scenario[SD.METADATA])
+
+            md_scenario = md_scenario.to_dict()
+
+            SD.sanity_check(md_scenario, check_self_type=True)
+
+            p = os.path.join(output_path, export_file_name)
+            with open(p, "wb") as f:
+                pickle.dump(md_scenario, f)
+
+            total_scenarios += 1
+            if j == total - 1:
+                print(
+                    f"{desc}Collected {total_scenarios} scenarios. File {file_count + 1}/{len(file_list)} has "
+                    f"{total} Scenarios. The last one is saved at: {p}"
+                )
+
+    summary_file = os.path.join(output_path, summary_file)
+    with open(summary_file, "wb") as file:
+        pickle.dump(dict_recursive_remove_array(metadata_recorder), file)
+    print("Summary is saved at: {}".format(summary_file))
+
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--input", required=True, help="The data folder storing raw tfrecord from Waymo dataset.")
+    parser.add_argument(
+        "--output", default="processed_data", type=str, help="The data folder storing raw tfrecord from Waymo dataset."
+    )
+    args = parser.parse_args()
+
+    scenario_data_path = args.input
+
+    output_path: str = os.path.dirname(scenario_data_path)
+    output_path = os.path.join(output_path, args.output)
+    os.makedirs(output_path, exist_ok=True)
+
+    raw_data_path = scenario_data_path
+
+    # parse raw data from input path to output path,
+    # there is 1000 raw data in google cloud, each of them produce about 500 pkl file
+    file_list = os.listdir(raw_data_path)
+    convert_waymo(file_list, raw_data_path, output_path)
+    sys.exit()
+    # file_path = AssetLoader.file_path("waymo", "processed", "0.pkl", return_raw_style=False)
+    # data = read_waymo_data(file_path)
+    # draw_waymo_map(data)