Heim >Technologie-Peripheriegeräte >KI >Wissenschaftsforum der Greater Bay Area|Professor Huang Hui von der Universität Shenzhen: Intelligente Grafikwahrnehmung löst das Problem des „Hals stecken' bei Robotern

Wissenschaftsforum der Greater Bay Area|Professor Huang Hui von der Universität Shenzhen: Intelligente Grafikwahrnehmung löst das Problem des „Hals stecken' bei Robotern

WBOY
WBOYnach vorne
2023-05-27 15:27:151043Durchsuche

Southern Finance Omni-Media Trainee Reporter Ma Jialu berichtet aus Nansha

Die Weiterentwicklung der Roboterintelligenz wird durch das Fehlen realer dreidimensionaler dynamischer Umgebungsfähigkeiten eingeschränkt. „Am 20. Mai stellte Huang Hui, eine nationale Führungspersönlichkeit für wissenschaftliche und technologische Innovation und Dekanin der Fakultät für Computer und Software an der Universität Shenzhen, ihre Forschung zur intelligenten Grafikwahrnehmung im Unterforum für Wissenschaftlerinnen „Looking for Her in the Crowd“ vor " des Greater Bay Area Science Forum. Dadurch werden Drohnen zur vollautomatischen und autonomen Erkundung des dreidimensionalen Raums eingesetzt und ermöglichen eine präzisere Modellierung bei geringerem Datenvolumen. Derzeit nimmt diese Errungenschaft eine international führende Position ein und kann in Bereichen wie digitalen Zwillingen und intelligenter Roboterfertigung weit verbreitet sein

Wissenschaftsforum der Greater Bay Area|Professor Huang Hui von der Universität Shenzhen: Intelligente Grafikwahrnehmung löst das Problem des „Hals stecken bei Robotern

Kleinere Datengröße, höhere Genauigkeit

Das Institut für Physik der Chinesischen Akademie der Wissenschaften hat einst die Definition des digitalen Zwillings populär gemacht: digitaler Zwilling, der englische Name ist Digital Twin (digitaler Zwilling), auch bekannt als digitale Abbildung und digitale Spiegelung. Beim digitalen Zwilling geht es darum, eine digitale „Kopie“ auf der Grundlage eines bestimmten Geräts oder Systems zu erstellen. Vereinfacht gesagt geht es darum, physische Objekte in der realen Welt in digitale virtuelle Erlebnisse umzuwandeln.

Anfang 2023 stellte der von der China Academy of Information and Communications Technology veröffentlichte „Digital Twin City Industry Map Research Report (2022)“ fest, dass sich die Entwicklungsphase der digitalen Zwillingsindustrie meines Landes in einer Wachstumsphase befindet, dem Aufbau digitaler Zwillingsstädte Der Markt ist aktiv und die Markteinheiten expandieren ständig. Digitale Zwillinge können die Konstruktionseffizienz und den wahren Sinn des „Metaversums“ erheblich verbessern und sind ein wichtiger Bestandteil des „Metaversums“. Mit der Popularität des Konzepts des „Metaversums“ wird die Spitzentechnologie des digitalen Zwillings immer beliebter den Menschen vertrauter.

In der Vergangenheit erforderten Datenzwillinge viel Personal und materielle Ressourcen, um Daten zu sammeln, und verwendeten dann viele Berechnungen, um Modelle zu erstellen. Huang Hui wies darauf hin, dass die Kosten für die Datenerfassung hoch, die Aktualität niedrig und 3D-Modellierungsobjekte unstrukturiert und unkorreliert seien. Dies seien die Schwachstellen, die es den aktuellen digitalen Zwillingen erschweren, intelligent, modular, leichtgewichtig, strukturiert und universell zu sein.

Als Reaktion auf die oben genannten Probleme hat sich Huang Hui in den letzten zehn Jahren auf „intelligente Grafik und Wahrnehmungsberechnung“ konzentriert, um Schwierigkeiten zu überwinden, und hat die Führung übernommen, indem er die Usee-Präzisionsphotogrammetrie-Technologie vorgeschlagen hat, mit der vollautomatisch dreidimensionale Stadtfotos gesammelt werden können Millimetergenaue hochauflösende Auflösung durch tragbare Drohnen. Der gesamte Prozess wird von Anfang bis Ende kontinuierlich geplant und mit Crowdsourcing ausgestattet, um eine maximale Abdeckung bei geringsten Betrachtungswinkeln zu erreichen und so die Menge an großräumigen Stadtszenendaten um das 200-fache zu reduzieren dass der Verlust geometrischer Details weniger als 0,6 Meter beträgt, sodass die Ausrüstungsinvestitionen für die Datenerfassung um 70 % reduziert werden können. Erzielen Sie eine genaue Zuordnung mehrerer Informationen und einen reibungslosen Stoffwechsel. Diese Technologie wurde in einem einzigen Projekt zur hochpräzisen dreidimensionalen Luftaufnahme von Städten aus nächster Nähe umfassend eingesetzt, und das Abdeckungsgebiet nimmt eine international führende Position in der Welt ein.

Nehmen Sie als Beispiel die Modellierung von etwa 2.200 Quadratkilometern der Stadt Shenzhen. In der Praxis ist die Modellierung mit den Herausforderungen einer schwierigen Luftraumkoordination, zahlreichen Höhenbeschränkungen, häufigen Wettereffekten, schlechter Datenqualität und langer Erfassungszeit konfrontiert. Wenn die traditionelle Modellierungsmethode verwendet wird, wird es zwei Jahre dauern, Daten von 60 Millionen Bildern zu sammeln und ein 60-TB-Modell zu erstellen, was Gesamtkosten von 150 Millionen verursacht. Eine Echtzeitaktualisierung der dreidimensionalen Basis des Städtezwillings kann nicht erreicht werden, da die Erfassungsmethode einen langen Zyklus und eine geringe Häufigkeit aufweist. Nach der Optimierung der Präzisionsphotogrammetrie-Technologie von Ushi kann innerhalb von 8 Monaten ein kleines 6-TB-Modell mit 20 Millionen Fotodaten erstellt werden, ohne die Genauigkeit zu beeinträchtigen, und die Gesamtkosten werden auf 60 Millionen reduziert, was einer Reduzierung um 60 % entspricht.

Digitale Zwillinge haben einen wichtigen Wert und eine große Bedeutung in den Bereichen Schwarmintelligenz, fahrerloses Fahren, Smart Cities, Heimatschutz, industrielle Fertigung und anderen Bereichen. „Huang Hui sagte, dass die Präzisionsphotogrammetrie-Technologie von Youshi Drohnen verwendet, um eine vollautomatische und unabhängige Erkundung des dreidimensionalen Raums durchzuführen, und Cloud Computing realisiert, was die Kosten und den Schwellenwert der dreidimensionalen Stadtrekonstruktion erheblich senkt. Sie kann in großem Umfang in Hoch- eingesetzt werden. Präzise intelligente Fahrkarten in der Zukunft. Bauwesen, reale dreidimensionale Navigation, hochpräzise Stadtmanagement-Informationsplattform und andere Bereiche

Der Mangel an dreidimensionaler Wahrnehmung „bleibt dem Roboter im Nacken“

Der „Digital Twin City Industry Map Research Report (2022)“ schlägt vor, dass in den letzten Jahren die Technologie der künstlichen Intelligenz schrittweise im Bereich der Modellierung eingesetzt wurde und Bildmodellierung und Videomodellierung zu zukünftigen Entwicklungstrends geworden sind. Laut Huang Hui könnte der Einsatz künstlicher Intelligenz zur Unterstützung der Roboterforschung die Effizienz der Datenanalyse verbessern und dabei helfen, effizientere dreidimensionale Modellierungslösungen zu finden. Sie verriet, dass sie und ihr Team Methoden erforschen, um intelligente Grafiken und künstliche Intelligenz zu kombinieren, um die Forschung zu intelligenten Robotern weiter voranzutreiben.

Eine Herausforderung für die intelligente Wahrnehmung von Diagrammen ist im Vergleich zu ChatGPT der Mangel an Daten, die für groß angelegte Schulungen verfügbar sind. Huang Hui sagte, dass die von ChatGPT verwendeten Originaldaten grundsätzlich manuell überprüft und mit Anmerkungen versehen wurden und „sauber“ sind. Wenn dies jedoch auf den dreidimensionalen Raum ausgedehnt wird, wird die Schwierigkeit erheblich zunehmen. Ein Artikel kann 1.000 Mal fotografiert werden, aber alle 1.000 Fotos beschreiben den Artikel möglicherweise nicht vollständig und genau. Um es wie folgt auszudrücken: Dies bedeutet, dass beim Training eines Modells der künstlichen Intelligenz für die Verarbeitung kleiner dreidimensionaler räumlicher Daten eine große Datenmenge verarbeitet werden muss.

Der Grund, warum die Roboterintelligenz stecken bleibt, liegt darin, dass ihr die Fähigkeit einer echten dreidimensionalen dynamischen Umgebung fehlt. „Warum ist das so schwierig? Huang Hui nutzte die Analogie eines gewöhnlichen Kehrroboters, um zu erklären: Es ist jetzt nicht einfach, einen Kehrroboter dazu zu bringen, sich auf einer ebenen Fläche zu bewegen, Hindernisse zu erkennen und ihnen auszuweichen und zu verhindern, dass er stecken bleibt. Verglichen mit Das, intelligente Grafikwahrnehmung Es ist notwendig, die Form von Objekten im dreidimensionalen Raum beurteilen zu können und dann die Funktionen sowie die dynamischen und statischen Beziehungen von Objekten zu beurteilen Es ist notwendig, Robotern eine verkörperte Intelligenz zu verleihen, die ein höheres Niveau erreichen kann Wahrnehmung und die Fähigkeit, sich der realen dreidimensionalen komplexen dynamischen Umgebung wirklich zu stellen und sie wie Menschen zu „sehen“. Das bedeutet, zu verstehen, dass das, was man sieht, das ist, was man bekommt, um Entscheidungen und Handlungen zu treffen

Nach mehr als 20 Jahren Grundlagenforschung führte Huang Hui das Team zu dem Versuch, die gesamte Kette von Umweltwahrnehmung, geometrischer Modellierung, semantischem Verständnis und autonomer Entscheidungsfindung zu vereinheitlichen. Im Vergleich zu Technologien der künstlichen Intelligenz wie ChatGPT, die beim Verständnis natürlicher Sprache erhebliche Fortschritte gemacht haben, gibt es jedoch noch viele wichtige wissenschaftliche Probleme, die noch nicht gelöst sind, und „es liegt noch ein langer Weg vor uns“.

Für weitere Inhalte laden Sie bitte die 21 Finance APP herunter

Das obige ist der detaillierte Inhalt vonWissenschaftsforum der Greater Bay Area|Professor Huang Hui von der Universität Shenzhen: Intelligente Grafikwahrnehmung löst das Problem des „Hals stecken' bei Robotern. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:sohu.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen