Heim >Technologie-Peripheriegeräte >KI >Dieser Artikel vermittelt Ihnen ein leicht verständliches Verständnis des autonomen Fahrens
Die Prinzipien des autonomen Fahrens lassen sich oft am besten anhand der Architektur des autonomen Fahrens verstehen. Das verständlichste Verständnis der Öffentlichkeit für autonomes Fahren ist Wahrnehmung, Entscheidungsfindung und Ausführung. Alle Roboter haben diese Struktur.
Als nächstes gehen wir tiefer und das Problem wird etwas komplizierter.
Wir denken vielleicht intuitiv, dass ich in unserem täglichen Leben immer das sehe, was ich mit meinen Augen sehe Informationen bestimmen meine nächste Entscheidung, aber das ist oft nicht der Fall. Es gibt immer eine Zeitverzögerung von den Augen über den Kopf bis zu den Händen und Füßen, und das gilt auch für das autonome Fahren. Aber wir spüren die Auswirkungen nicht, weil unser Gehirn automatisch mit Vorhersagen umgeht. Selbst wenn es nur wenige Millisekunden sind, basieren unsere Entscheidungen auf Vorhersagen darüber, was wir sehen, um die Funktion unserer Hände und Füße zu steuern. Dies ist die Grundlage für die Aufrechterhaltung normaler Funktionen. Daher werden wir vor autonomen Fahrentscheidungen ein Vorhersagemodul hinzufügen.
Der Wahrnehmungsprozess beinhaltet auch das Universum und kann bei sorgfältiger Betrachtung in zwei Phasen unterteilt werden: „Wahrnehmen“ und „Wahrnehmen“. „Sensing“ erhält Rohdaten von Sensoren, beispielsweise Bilder, während „Perception“ nützliche Informationen aus Bildern verarbeitet (z. B. wie viele Personen sich auf dem Bild befinden). Wie das alte Sprichwort sagt: „Sehen ist Glauben, Hören ist Glauben.“ Die nützlichen Informationen der „Wahrnehmung“ lassen sich weiter in die Wahrnehmung des eigenen Fahrzeugs und die Wahrnehmung von außen unterteilen. Menschen oder selbstfahrende Autos verfolgen bei der Verarbeitung dieser beiden Arten von Informationen häufig unterschiedliche Strategien.
Darüber hinaus werden die Informationen über Hindernisse, Fahrspuren und andere Informationen von verschiedenen Sensoren durch Algorithmen verarbeitet ist oft widersprüchlich. Wenn das Radar vor Ihnen ein Hindernis erkennt, die Kamera Ihnen jedoch mitteilt, dass dies nicht der Fall ist, müssen Sie ein „Fusions“-Modul hinzufügen. Stellen Sie weitere Zusammenhänge her und urteilen Sie über inkonsistente Informationen.
Hier fassen wir „Fusion und Vorhersage“ oft als „Weltmodell“ zusammen. Dieses Wort ist sehr anschaulich, egal ob Sie Materialist oder Idealist sind. Es ist unmöglich, die ganze „Welt“ in Ihr Gehirn zu stopfen, aber was unsere Arbeit und unser Leben leitet, ist das „Modell“ der „Welt“, das heißt, indem wir verarbeiten, was wir nach unserer Geburt sehen, und nach und nach ein Modell konstruieren In unserem Kopf wird das taoistische Weltverständnis „innere Sicht“ genannt. Die Hauptaufgabe des Weltmodells besteht darin, die Eigenschaften und Beziehungen der aktuellen Umweltelemente durch „Fusion“ zu verstehen und „Vorhersagen“ in Verbindung mit „A-priori-Gesetzen“ zu treffen, um dieses Mal ein gemächlicheres Urteil für die Entscheidungsausführung zu liefern Die Zeitspanne kann zwischen einigen Millisekunden und einigen Sekunden liegen.
Durch die Hinzufügung des Weltmodells ist die gesamte Architektur reicher geworden, aber es gibt noch ein weiteres Detail, das oft übersehen wird. Das ist der Informationsfluss. Ein einfaches Verständnis besteht darin, dass Menschen Dinge mit ihren Augen wahrnehmen, sie im Gehirn verarbeiten und sie dann zur Ausführung an ihre Hände und Füße übergeben. Die tatsächliche Situation ist jedoch oft komplizierter. Hier gibt es zwei typische Verhaltensweisen, die einen völlig gegensätzlichen Informationsfluss darstellen, nämlich „Zielerreichung planen“ und „Aufmerksamkeitsverlagerung“.
Wie verstehst du „planen, um Ziele zu erreichen“? Tatsächlich ist der Beginn des Denkens nicht die Wahrnehmung, sondern das „Ziel“. Erst wenn Sie ein Ziel haben, können Sie einen sinnvollen „Wahrnehmung-Entscheidung-Ausführung“-Prozess auslösen. Wenn Sie beispielsweise zu einem Ziel fahren möchten, kennen Sie möglicherweise mehrere Routen und werden sich schließlich für eine der Routen entscheiden Stausituation. Der Stau gehört zum Weltmodell, das „Ankommen“ zur Entscheidung. Dies ist der Prozess, durch den Entscheidungen an das Weltmodell weitergeleitet werden.
Wie ist „Verlagerung der Aufmerksamkeit“ zu verstehen? Selbst wenn es sich um ein Bild handelt, können weder Menschen noch Maschinen alle darin verborgenen Informationen erhalten. Ausgehend von einem Bedarf und Kontext neigen wir dazu, uns auf einen begrenzten Umfang und begrenzte Kategorien zu konzentrieren. Diese Informationen können nicht aus dem Bild selbst gewonnen werden, sondern stammen aus dem „Weltmodell“ und dem „Ziel“. Es ist ein Prozess von der Entscheidungsfindung zum Weltmodell und dann zur Wahrnehmung.
Wir fügen einige notwendige Informationen hinzu und ordnen die gesamte Struktur neu. Sieht es wie folgt aus? Es ist noch nicht vorbei, schauen wir weiter.
Autopilot-Algorithmen benötigen wie das Gehirn Verarbeitungszeit. Der allgemeine Zyklus liegt zwischen 10 ms und 100 ms, wodurch die Reaktionsanforderungen auf Umgebungsänderungen erfüllt werden können. Aber die Umgebung ist manchmal einfach und manchmal sehr komplex. Viele Algorithmusmodule können diesen Zeitbedarf nicht erfüllen. Beispielsweise ist das Nachdenken über den Sinn des Lebens möglicherweise nicht in 100 ms möglich. Wenn man bei jedem Schritt über das Leben nachdenken muss, muss dies eine Art Zerstörung für das Gehirn bedeuten. Das Gleiche gilt für Computer. Es gibt physikalische Grenzen der Rechenleistung und -geschwindigkeit. Die Lösung besteht darin, ein mehrschichtiges Framework einzuführen.
Dieser Schichtungsmechanismus verkürzt den Verarbeitungszyklus im Allgemeinen um das 3-10-fache, wenn er nach oben geht. Natürlich muss er nicht unbedingt vollständig im tatsächlichen Rahmen erscheinen Im Engineering basiert es auf der Platine. Die Ressourcen- und Algorithmusnutzung kann flexibel angepasst werden. Im Grunde handelt es sich bei der Wahrnehmung um einen Aufwärtsprozess, der bestimmte Elemente basierend auf der Aufmerksamkeit kontinuierlich verfeinert und Wahrnehmungsinformationen mit „Tiefe und Richtung“ liefert. Die Entscheidungsfindung ist ein nach unten gerichteter Prozess, bei dem Aktionen vom Ziel bis zu jeder Ausführungseinheit Schicht für Schicht entsprechend verschiedenen Ebenen des Weltmodells zerlegt werden. Weltmodelle haben im Allgemeinen keine spezifische Flussrichtung und werden verwendet, um Umweltinformationen auf verschiedenen Granularskalen zu konstruieren.
Entsprechend der Komplexität der Bearbeitungsaufgaben werden auch die Arbeitsteilung und das Kommunikationsumfeld entsprechend kastriert und zusammengeführt. Beispielsweise benötigen Low-Level-ADAS-Funktionen (ACC) weniger Rechenleistung und können mit nur einer Schicht entworfen werden. High-End-ADAS-Funktionen (AutoPilot) verfügen im Allgemeinen über zwei Konfigurationsebenen. Für die autonome Fahrfunktion gibt es viele komplexe Algorithmen, und manchmal ist ein dreischichtiger Aufbau erforderlich. Beim Entwurf von Softwarearchitekturen gibt es auch Situationen, in denen das Weltmodell und das Wahrnehmungs- oder Entscheidungsmodul auf derselben Ebene zusammengeführt werden.
Verschiedene Unternehmen oder Industriestandards für autonomes Fahren veröffentlichen ihre eigenen Software-Architekturentwürfe, die jedoch häufig auf dem basieren aktuelle Situation Die Ergebnisse nach der Kastration sind nicht universell, aber um das Verständnis für alle zu erleichtern, ersetze ich sie dennoch durch die aktuellen Mainstream-Funktionsmodule. Schauen wir uns die Vergleichsbeziehung an, die für das Verständnis des Prinzips hilfreicher ist.
Es muss im Voraus beachtet werden, dass dies zwar einige Auswirkungen auf die Softwarearchitektur hat, es aber immer noch eine ist Das eigentliche Design der Softwarearchitektur ist komplizierter als diese Beschreibung. Wir gehen hier nicht auf alle Details ein, sondern konzentrieren uns auf die Teile, die leicht verwechselt werden können. Konzentrieren wir uns weiter unten darauf.
Umweltbewusstsein – ALLES IN Deep Learning#🎜🎜 #
Um sicherzustellen, dass unbemannte Fahrzeuge die Umgebung verstehen und erfassen, muss der Umgebungswahrnehmungsteil des unbemannten Fahrsystems normalerweise eine große Menge an Informationen über die Umgebung erhalten, einschließlich der Position von Hindernissen. Geschwindigkeit und die genaue Form der Fahrspur vor Ihnen, Standorttyp des Schildes usw. Diese Informationen werden normalerweise durch die Fusion von Daten mehrerer Sensoren wie Lidar, Peripherie-/Umgebungskamera und Millimeterwellenradar gewonnen.
Die Entwicklung von Deep Learning hat es zu einem branchenweiten Konsens geführt, den Aufbau des autonomen Fahrens durch neuronale Netzwerkalgorithmen abzuschließen. Der Algorithmus des Wahrnehmungsmoduls ist der „Bauer“ des gesamten Deep-Learning-Prozesses und das erste Softwaremodul, das die Transformation abschließt.
Die Korrelation und der Unterschied zwischen Positionierungskarte und V2X-Eigenfahrzeugwahrnehmung und Außenwahrnehmung
# 🎜🎜#Im herkömmlichen Sinne basiert die Außenwahrnehmung auf GPS-Positionierungssignalen, die Informationen in absoluten Koordinatensystemen wie hochpräzisen Karten und Vehicle-to-Everything-Nachrichten (V2X) in das eigene Fahrzeugkoordinatensystem umwandeln für das verwendete Fahrzeug. Es ähnelt dem von Menschen verwendeten Amap-Navigator. Kombiniert mit den ursprünglich im Koordinatensystem des eigenen Fahrzeugs enthaltenen Informationen zur „Eigenfahrzeugwahrnehmung“ liefert es Umgebungsinformationen für autonomes Fahren.
Aufgrund der Unzuverlässigkeit von GPS muss die IMU kontinuierlich korrigiert werden. Bei der Positionierung im autonomen Fahren wird häufig eine Wahrnehmungskarte verwendet Abgleich, um eine genaue absolute Position zu erreichen, die Erfassungsergebnisse zur Korrektur der IMU verwenden, um die genaue relative Position zu erhalten, und Redundanz mit dem aus GPS-IMU bestehenden INS-System bilden. Daher basieren die für die „Außenwahrnehmung“ notwendigen Positionierungssignale häufig auf Informationen der „Eigenfahrzeugwahrnehmung“.
Obwohl die Karte aufgrund der Empfindlichkeit von GPS strikt Teil des „Weltmodells“ ist, wird es während des Implementierungsprozesses der inländischen Software eine Integration geben das Positionierungsmodul und das Kartenmodul und verzerren alle GPS-Daten, um sicherzustellen, dass keine sensiblen Positionierungsinformationen verloren gehen.
Fusion-Vorhersagemodul – Schwerpunkt auf dem Unterschied zwischen den beiden
#🎜 🎜# Der Kern der Fusion besteht darin, zwei Probleme zu lösen: Mithilfe des Koordinatensystemkonvertierungsalgorithmus und des Zeitsynchronisationsalgorithmus werden zunächst die Messergebnisse von Lidar, Kamera und Millimeterwellenradar erfasst sind auf einen räumlich-zeitlichen Punkt ausgerichtet. Sorgen Sie für die Einheitlichkeit der Rohdaten in der gesamten Umgebung. Die andere besteht darin, das Problem der Assoziation und Anomaliebeseitigung zu lösen, die Zuordnung verschiedener Sensoren zu handhaben, die demselben „Weltmodell“-Element (einer Person/einer Spur usw.) zugeordnet sind, und Anomalien zu beseitigen, die durch eine Fehlerkennung durch a verursacht werden können Einzelsensor. Der grundlegende Unterschied zwischen Fusion und Vorhersage besteht jedoch darin, dass nur Informationen aus der Vergangenheit und dem aktuellen Moment verarbeitet werden und keine externen Momente verarbeitet werden.Die Vorhersage beurteilt die zukünftige Zeit basierend auf dem Fusionsergebnis. Diese zukünftige Zeit reicht von 10 ms bis 5 Minuten. Dazu gehören die Vorhersage von Ampeln, die Vorhersage des Fahrweges umliegender Hindernisse oder die Vorhersage weiter entfernter Kurvenpositionen. Prognosen verschiedener Zeiträume ermöglichen eine Planung für entsprechende Zeiträume und Vorhersagen unterschiedlicher Granularität, wodurch mehr Raum für Planungsanpassungen geschaffen wird.
Planung, Steuerung und hierarchische Strategiezerlegung Der Prozess, bei dem Menschen und Fahrzeuge gezielte Entscheidungen für ein bestimmtes Ziel treffen, bezieht sich dieses Ziel normalerweise auf das Erreichen Erreichen Sie das Ziel vom Startpunkt aus, vermeiden Sie Hindernisse und optimieren Sie ständig die Fahrbahn und das Verhalten, um das Ziel zu erreichen. Gewährleistung der Sicherheit und des Komforts der Passagiere. Die strukturelle Zusammenfassung der Planung besteht darin, Informationen basierend auf unterschiedlichen Granularitäten der Umgebung zu integrieren, eine schichtweise Bewertung und Zerlegung ausgehend von externen Zielen durchzuführen und sie schließlich an den Ausführenden weiterzuleiten, um eine vollständige Entscheidung zu treffen. Das Planungsmodul ist im Allgemeinen in drei Ebenen unterteilt: Missionsplanung, Verhaltensplanung und Bewegungsplanung. Der Kern der Missionsplanung basiert auf der Straße Netzwerk- und diskrete Pfadsuchalgorithmen zum Erhalten des globalen Pfads, der einem großen Aufgabentyp zugewiesen wird, häufig mit einem langen Zyklus. Die Verhaltensplanung basiert auf der endlichen Zustandsmaschine, um die spezifischen Aktionen zu bestimmen, die das Fahrzeug in einem Medium ausführen soll Zyklusverhalten (Linksspurwechsel, Vermeidung, Not-Aus) und legen Sie einige Grenzparameter und die ungefähre Wegreichweite fest. Die Bewegungsplanungsebene basiert häufig auf Stichproben- oder Optimierungsmethoden, um letztendlich den einzigen Pfad zu erhalten, der den Komfort- und Sicherheitsanforderungen entspricht. Schließlich wird es an das Steuermodul übergeben, um den einzigartigen Weg durch Feedforward-Vorhersage und Rückkopplungssteuerungsalgorithmen zu verfolgen und die Bremse, Lenkung, Drosselklappe, Karosserie und andere Aktuatoren zu manipulieren, um schließlich den Befehl auszuführen.
Ich weiß nicht, welches Niveau Sie verstanden haben, aber das Obige ist nur eine Einführung in die Prinzipien des autonomen Fahrens. Die aktuellen Theorien, Algorithmen und die Architektur des autonomen Fahrens entwickeln sich sehr schnell Wissenspunkt, Es wird noch lange nicht veraltet sein. Aber die neuen Anforderungen haben viel neues Verständnis für die Architektur und Prinzipien des autonomen Fahrens gebracht.
Das obige ist der detaillierte Inhalt vonDieser Artikel vermittelt Ihnen ein leicht verständliches Verständnis des autonomen Fahrens. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!