Heim >Hardware-Tutorial >Hardware-Rezension >Nach 2 Monaten kann der humanoide Roboter Walker S Kleidung falten
Machine Power Report
Herausgeber: Wu
Mit der Enthüllung von Abbildung 01, die das multimodale Großmodell OpenAI beinhaltet, haben die damit verbundenen Fortschritte inländischer Kollegen Aufmerksamkeit erregt.
Erst gestern veröffentlichte UBTECH, Chinas „erster Bestand an humanoiden Robotern“, die erste Demo des humanoiden Roboters Walker S, nachdem dieser tief in das große Modell von Baidu Wenxin integriert wurde und einige interessante neue Funktionen zeigte.
Jetzt, mit dem Segen der Großmodellfähigkeiten von Baidu Wenxin, sieht Walker S so aus.
Wie Abbildung 01 bewegt sich Walker S nicht umher, sondern steht hinter einem Schreibtisch, um eine Reihe von Aufgaben zu erledigen. Es kann menschlichen Befehlen folgen und Kleidung falten.
Nachdem Sie die Aufgabe erledigt haben, können Sie auch mit ihr chatten. Was soll ich zum Beispiel zu diesem schwarzen Oberteil tragen? Der Roboter merkt sich immer noch, dass Sie auf Geschäftsreise sind, und es wird empfohlen, ihn mit dunklen Hosen zu kombinieren, die für formelle Anlässe besser geeignet sind.
Es werden auch verschiedene Schalter auf dem Tisch in der Platte platziert.
Selbst wenn es gestört wird, z. B. wenn der platzierte Schalter auf den Tisch zurückgeworfen wird oder die gerade erreichbare Steckdose entfernt wird, kann Walker S seinen Arbeitsstatus in Echtzeit anpassen und die Platzierungsaufgabe entsprechend abschließen neue Situation.
Im Februar demonstrierte Walker S bereits multimodale Wahrnehmungs- und Bewegungssteuerungsfähigkeiten während eines praktischen Trainings in einer Fabrik für neue Energiefahrzeuge.
Durch die umfassende Integration mit dem großen Wenxin-Modell haben die kognitiven und Kontrollfähigkeiten von Walker S nicht nur ein erweitertes Absichtsverständnis und feinkörnige Aufgabenplanungsfunktionen erreicht, sondern auch komplexe Flexibilität erreicht Falten von Kleidung zum ersten Mal.
Das große Wenxin-Modell ist das große Modell zur Wissenserweiterung auf industrieller Ebene von Wenxin, das über modal- und sprachübergreifende Funktionen für tiefes semantisches Verständnis und Generierung sowie Wissensbegründung, Aufgabenplanung und andere Funktionen verfügt. Durch die Übertragung dieser Fähigkeiten auf humanoide Roboter kann der Roboter wie Menschen das Material, die Form, Falten und andere Eigenschaften von Kleidung analysieren und verstehen und auf der Grundlage früherer Erfahrungen die beste Art und Reihenfolge zum Falten von Kleidung ableiten. Während des eigentlichen Prozesses des Faltens der Kleidung analysiert der Roboter in Echtzeit die Zustandsänderungen der Kleidung und passt seine Aktionsstrategie entsprechend an.
Bei der Aufgabe zur Sortierung von Objektinterferenzen nutzte Walker S auch die synergetischen Vorteile von „KI großes Modell + Roboter“ voll aus. Zunächst werden die räumlichen Positionierungs- und semantischen Informationen des Objekts über das multimodale Wahrnehmungsmodell auf dem Gerät ermittelt und dann zur intelligenten Verarbeitung an das große Modell übergeben. Letzteres baut Walker S mit seiner hervorragenden Aufgabenzerlegung schnell auf und logisches Denken. Finden Sie den optimalen Weg zur Aufgabenplanung und -ausführung. Walker S ordnet diese Lösung der tatsächlichen Steuerung des Roboterarms und der geschickten Hände zu und erledigt schließlich die gesamte Reihe komplexer Aufgaben erfolgreich.
Dies ist auch die erste Demonstration ähnlicher Fähigkeiten durch inländische Kollegen. Seine innovative Anwendung und Implementierungsschwierigkeit gehören ebenfalls zu den ersten in der Branche weltweit. „Bei vielen Demonstrationen, einschließlich der Zusammenarbeit von Figure mit OpenAI und unserer Zusammenarbeit mit Baidu, kann nun eine End-to-End-Lösung erreicht werden“, sagte das UBTECH-Management gestern Abend bei der Leistungsbeurteilung und dem Ausblick.
" Wir verwenden die großen Modelle von Baidu, um Aufgaben zu zerlegen, natürliche Sprache zu verstehen und logische Anordnungen zu sequenzieren. Zusätzlich zu dem multimodalen großen Modell, das auf dem Kunden basiert und letztes Jahr auf der Basis von Open-Source-Modellschulungen erstellt wurde, glauben wir, dass in der „Da der Wettbewerb auf dem Markt für humanoide Roboter immer härter wird, können wir 1+1>2 erreichen.“ Wir können sehen, dass die Zusammenarbeit eine starke technische Unterstützung für die Implementierung humanoider Roboter bieten kann. „Durch den Vergleich der Videos von OpenAI haben wir jedoch festgestellt, dass es immer noch eine Lücke zwischen dem befähigten Walker S und Abbildung 01 gibt.“
Das offensichtlichste ist die Geschwindigkeit der Aktion. Darüber hinaus sind die von Walker S erhaltenen Anweisungen in Bezug auf den Inhalt der Anweisungen normalerweise relativ klar und spezifisch, während Abbildung 01 abstraktere Anweisungen durch vernünftiges Denken in vernünftige und realisierbare spezifische Operationen umwandeln kann.
Darüber hinaus kann Abbildung 01 während der Arbeit chatten (insbesondere seine Vorgänge erklären), verfügt über ein Kurzzeitgedächtnis und kann aktuelle Aktionen basierend auf dem Inhalt früherer Gespräche vernünftig planen.
Da der Wettbewerb in der generativen KI immer härter wird und sich der Forschungsschwerpunkt von Langtext und Multimodalität bis hin zu verkörperter Intelligenz erstreckt, haben wir Grund zu der Annahme, dass zukünftige humanoide Roboter nicht mehr nur auf die Wahrnehmung statischer Daten beschränkt sein werden, sondern dies auch tun werden Sie können sich in der realen dreidimensionalen Welt frei bewegen und mit der Umgebung interagieren. Dies markiert auch einen großen Sprung in der KI vom einfachen maschinellen Lernen zur Ausführung komplexer menschenähnlicher Aufgaben.
Tatsächlich hat die Rennstrecke für humanoide Roboter in den letzten sechs Monaten eine äußerst starke Dynamik gezeigt, wobei häufig Prototypen im In- und Ausland vorgestellt wurden und Startups aktiv finanziert wurden. Im Februar veröffentlichte UBTECH ein Video, in dem Walker S in der neuen Energiefahrzeugfabrik von NIO getestet wird. Der Roboter kann die Sicherheitsgurtprüfung, das Anbringen von Fahrzeuglogos und andere Aufgaben problemlos erledigen. Auch der Aktienkurs von UBTECH stieg Anfang März innerhalb von zwei Tagen um 200 %.
Allerdings befinden sich humanoide Roboter auf der ganzen Welt noch im Pilotstadium und es wird noch einige Zeit dauern, sie zu skalieren. Schließlich gibt es einen großen Unterschied zwischen Demo und tatsächlicher Anwendung, und letztere muss eine Reihe von Faktoren wie Zuverlässigkeit, Stabilität und Kosten umfassend berücksichtigen. UBTECH gab an, dass die Kombination aus großen KI-Modellen und humanoiden Robotern deren Intelligenzniveau und Anpassungsfähigkeit an Multiszenario-Aufgaben erheblich verbessern und ihren Industrialisierungsprozess beschleunigen werde. Gründer Zhou Jian erklärte außerdem öffentlich, dass er hofft, bis Ende dieses Jahres die erste Charge humanoider Roboter in der Fabrik fertigzustellen, die Tests zu bestehen und sich auf den Massenausbruch humanoider Roboter im Jahr 2025 vorzubereiten. Darüber hinaus plant UBTECH, bis Ende dieses Jahres den humanoiden Roboter der ersten Generation für die häusliche emotionale Pflege auf den Markt zu bringen. Der Roboter wird mit einem großen Modell ausgestattet sein und mit Benutzern interagieren und Kurz- und Langzeitgedächtnisse bilden.
Referenzlink
https://www.stcn.com/article/detail/1164967.html
DAS ENDE
Bitte wenden Sie sich an dieses öffentliche Konto, um die Genehmigung zum Nachdruck zu erhalten.
Mitwirken oder Berichte anfordern: content@jiqizhixin.com
Das obige ist der detaillierte Inhalt vonNach 2 Monaten kann der humanoide Roboter Walker S Kleidung falten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!