Heim >Technologie-Peripheriegeräte >KI >Berkeley hat den ersten hochauflösenden Datensatz und das erste Vorhersagemodell für Parkszenarien als Open-Source-Lösung bereitgestellt, die die Zielerkennung und Flugbahnvorhersage unterstützen.

Berkeley hat den ersten hochauflösenden Datensatz und das erste Vorhersagemodell für Parkszenarien als Open-Source-Lösung bereitgestellt, die die Zielerkennung und Flugbahnvorhersage unterstützen.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBnach vorne: 2023-04-12 23:40:011851Durchsuche

Da sich die Technologie des autonomen Fahrens immer weiter entwickelt, sind Fahrzeugverhalten und Flugbahnvorhersage von äußerst wichtiger Bedeutung für effizientes und sicheres Fahren. Obwohl herkömmliche Trajektorienvorhersagemethoden wie die dynamische Modellableitung und die Zugänglichkeitsanalyse die Vorteile einer klaren Form und einer guten Interpretierbarkeit bieten, ist ihre Fähigkeit, die Interaktion zwischen der Umgebung und Objekten zu modellieren, in komplexen Verkehrsumgebungen relativ begrenzt. Daher basierten in den letzten Jahren zahlreiche Forschungen und Anwendungen auf verschiedenen Deep-Learning-Methoden (wie LSTM, CNN, Transformer, GNN usw.) und verschiedenen Datensätzen wie BDD100K, nuScenes, Stanford Drone, ETH /UCY, INTERACTION, ApolloScape usw. sind ebenfalls entstanden und bieten starke Unterstützung für das Training und die Bewertung tiefer neuronaler Netzwerkmodelle. Viele SOTA-Modelle wie GroupNet, Trajectron++, MultiPath usw. haben eine gute Leistung gezeigt.

Die oben genannten Modelle und Datensätze konzentrieren sich auf normale Straßenfahrszenarien und nutzen die Infrastruktur und Funktionen wie Fahrspurlinien und Ampeln vollständig aus, um den Vorhersageprozess aufgrund von Einschränkungen durch Verkehrsvorschriften und Bewegungsmuster zu unterstützen der meisten Fahrzeuge sind ebenfalls begrenzt. Auf der „letzten Meile“ des autonomen Fahrens – autonomen Parkszenarien – werden wir jedoch mit vielen neuen Schwierigkeiten konfrontiert:

Die Verkehrsregeln und Spurlinienanforderungen auf dem Parkplatz sind nicht streng, und die Fahrzeuge sind nicht streng. Häufig nach Belieben fahren und „Abkürzungen nehmen“
Um die Parkaufgabe zu erfüllen, muss das Fahrzeug komplexere Parkaktionen ausführen, einschließlich häufigem Rückwärtsfahren, Parken, Lenken usw. Wenn der Fahrer unerfahren ist, kann das Parken zu einem langwierigen Prozess werden
Auf dem Parkplatz gibt es viele Hindernisse und Unordnung, und der Abstand zwischen den Fahrzeugen ist gering. Eine kleine Unachtsamkeit kann zu Kollisionen und Kratzern führen.
Einparkende Fußgänger Laufen Sie oft nach Belieben durch den Veranstaltungsort und Fahrzeuge benötigen mehr Ausweichmaßnahmen
In einem solchen Szenario ist es schwierig, den gewünschten Effekt durch einfache Anwendung des vorhandenen Flugbahnvorhersagemodells zu erzielen, und dem Umschulungsmodell fehlt die Unterstützung entsprechender Daten. Aktuelle Parkszenen-basierte Datensätze wie CNRPark+EXT und CARPK sind nur für die Erkennung freier Parkplätze konzipiert. Die Bilder stammen aus der Ich-Perspektive von Überwachungskameras, weisen niedrige Abtastraten auf und weisen viele Verdeckungen auf, sodass sie nicht in der Lage sind zur Flugbahnvorhersage verwendet werden.

Auf der gerade zu Ende gegangenen 25. IEEE International Conference on Intelligent Transportation Systems (IEEE ITSC 2022) im Oktober 2022 veröffentlichten Forscher der University of California, Berkeley, das erste hochauflösende Video einer Parkszene &. Trajektoriendatensatz, und basierend auf diesem Datensatz wurde ein Trajektorienvorhersagemodell namens „ParkPredict+“ unter Verwendung der CNN- und Transformer-Architektur vorgeschlagen. 🔜 /berkeley.edu/dlp-dataset (Wenn Sie nicht darauf zugreifen können, können Sie die alternative Seite https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 ausprobieren)

Berkeley hat den ersten hochauflösenden Datensatz und das erste Vorhersagemodell für Parkszenarien als Open-Source-Lösung bereitgestellt, die die Zielerkennung und Flugbahnvorhersage unterstützen.

Dataset Python API: https://github .com/ MPC-Berkeley/dlp-dataset Berkeley hat den ersten hochauflösenden Datensatz und das erste Vorhersagemodell für Parkszenarien als Open-Source-Lösung bereitgestellt, die die Zielerkennung und Flugbahnvorhersage unterstützen.

Informationen zum DatensatzDer Datensatz wurde von einer Drohne mit einer Gesamtdauer von 3,5 Stunden, einer Videoauflösung von 4K und einer Abtastrate von 25 Hz erfasst. Die Ansicht umfasst eine Parkplatzfläche von ca. 140m x 80m, mit insgesamt ca. 400 Stellplätzen. Der Datensatz ist genau kommentiert und es wurden insgesamt 1216 Kraftfahrzeuge, 3904 Fahrräder und 3904 Fußgängerwege erfasst.
Nach der erneuten Verarbeitung können Trajektoriendaten in Form von JSON gelesen werden
und in die Datenstruktur des Verbindungsdiagramms (Graph) geladen werden:
- Individuell (Agent): Jeder Agent (Agent) ist ein Objekt, das sich in der aktuellen Szene (Szene) bewegt. Es verfügt über Attribute wie geometrische Form und Typ. Seine Bewegungsbahn wird als verknüpfte Liste mit Instanzen gespeichert. (Verknüpfte Liste)
- Instanz: Jede Instanz ist der Zustand einer Person (Agent) in einem Frame (Frame), einschließlich ihrer Position, ihres Drehwinkels, ihrer Geschwindigkeit und Beschleunigung. Jede Instanz enthält Zeiger auf die Instanz der Person im vorherigen Frame und im nächsten Frame
- Frame (Frame): Jeder Frame (Frame) ist ein Abtastpunkt, der alle zum aktuellen Zeitpunkt sichtbaren Instanzen (Instanz) enthält. und Zeiger, die auf das vorherige und das nächste Bild zeigen
- Hindernis (Hindernis): Hindernisse sind Objekte, die sich in dieser Aufzeichnung überhaupt nicht bewegt haben, einschließlich der Position, Ecke und geometrischen Größe jedes Objekts
- Szene ( Szene): Jede Szene (Szene) entspricht einer aufgezeichneten Videodatei, die Zeiger enthält, die auf das erste und letzte Bild der Aufnahme, alle Personen (Agenten) und alle Hindernisse (Obstacles) zeigen.
Die Daten set ist in zwei Downloadformaten verfügbar:

Nur JSON (empfohlen) : JSON-Dateien enthalten den Typ, die Form, die Flugbahn und andere Informationen aller Personen und können über das Open-Source-Programm Python The heruntergeladen werden Die API liest semantische Bilder (Semantic Images) direkt, zeigt eine Vorschau an und generiert sie. Wenn das Forschungsziel nur die Flugbahn- und Verhaltensvorhersage ist, kann das JSON-Format alle Anforderungen erfüllen.

Originalvideo und Anmerkung: Wenn die Forschung auf maschinellen Sichtfeldthemen wie Zielerkennung, -trennung und -verfolgung basierend auf dem Rohbild der Kamera (Rohbild) basiert, Dann müssen Sie möglicherweise das Originalvideo und das Originallabel herunterladen. Wenn dies erforderlich ist, muss der Forschungsbedarf im Datensatzantrag klar beschrieben werden. Darüber hinaus muss die Anmerkungsdatei selbst analysiert werden.

Verhaltens- und Flugbahnvorhersagemodell: ParkPredict+

Als Anwendungsbeispiel verwendete das Forschungsteam diese Daten im Artikel „ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer“ auf der IEEE ITSC 2022 eingestellt, Basierend auf der CNN- und Transformer-Architektur werden die Absicht (Intent) und die Flugbahn (Trajectory) des Fahrzeugs in der Parkplatzszene vorhergesagt.

Das Team nutzte das CNN-Modell, um die Verteilungswahrscheinlichkeit der Fahrzeugabsicht (Intent) durch die Konstruktion semantischer Bilder vorherzusagen. Dieses Modell muss nur lokale Umgebungsinformationen des Fahrzeugs erstellen und kann die Anzahl der verfügbaren Absichten kontinuierlich entsprechend der aktuellen Umgebung ändern.

Das Team erreichte eine multimodale Absichts- und Verhaltensvorhersage, indem es das Transformer-Modell verbesserte und die Ergebnisse der Absichtsvorhersage, den Bewegungsverlauf des Fahrzeugs und die semantische Karte der Umgebung als Eingabe bereitstellte.

Zusammenfassung
- Als erster hochpräziser Datensatz für Parkszenarien kann der Dragon Lake Parking (DLP)-Datensatz dabei eine groß angelegte Zielerkennung und -verfolgung, die Erkennung freier Parkplätze sowie das Verhalten und die Trajektorien von Fahrzeugen und Fußgängern ermöglichen Szenariodaten und API-Unterstützung werden für Vorhersagen, Nachahmungslernen und andere Forschung bereitgestellt. Durch die Verwendung von CNN und Transformer-Architektur zeigt das ParkPredict+-Modell gute Fähigkeiten bei der Verhaltens- und Flugbahnvorhersage in Parkszenarien. Dragon Lake Parking (DLP) Der Datensatz kann getestet und angewendet werden. Weitere Informationen finden Sie auf der Datensatz-Homepage https://sites.google.com/berkeley.edu/dlp-dataset (falls Sie nicht darauf zugreifen können, können Sie die alternative Seite ausprobieren ).
- https://www.php.cn/link/966eaa9527eb956f0dc8788132986707
- )

Das obige ist der detaillierte Inhalt vonBerkeley hat den ersten hochauflösenden Datensatz und das erste Vorhersagemodell für Parkszenarien als Open-Source-Lösung bereitgestellt, die die Zielerkennung und Flugbahnvorhersage unterstützen.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Python php 架构 json for 指针数据结构 github cnn lstm transformer https

Stellungnahme：

Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Wenden Sie 40 Modelle für maschinelles Lernen in zwei Zeilen Python-Code anNächster Artikel：Wenden Sie 40 Modelle für maschinelles Lernen in zwei Zeilen Python-Code an

In Verbindung stehende Artikel

Mehr sehen

Berkeley hat den ersten hochauflösenden Datensatz und das erste Vorhersagemodell für Parkszenarien als Open-Source-Lösung bereitgestellt, die die Zielerkennung und Flugbahnvorhersage unterstützen.

Verhaltens- und Flugbahnvorhersagemodell: ParkPredict+

Zusammenfassung

In Verbindung stehende Artikel