Heim >Technologie-Peripheriegeräte >KI >Die beiden Giganten sind gleichzeitig optimistisch! Künstliche Intelligenz fügt einen neuen Begriff hinzu. Ist es die nächste Welle der KI?
Am 18. Mai lösten die Aktien des Roboterkonzepts einen Trend des Tageslimits aus. Bei Redaktionsschluss hatten Fengli Intelligent und Youde Precision ihr Tageslimit von 20 cm erreicht Mehr als 10 % haben Southern Seiko, Yuanda Intelligent, Huagong Technology usw. erreicht
In den Nachrichten sagte Huang Renxun auf der ITF World 2023 Semiconductor Conference, dass die nächste Welle der künstlichen Intelligenz verkörperte Intelligenz (verkörperte KI) sein wird, also intelligente Systeme, die verstehen, schlussfolgern und mit ihnen interagieren können physische Welt.
Darüber hinaus erklärte Musk auf der Tesla-Aktionärsversammlung am 16. Mai, dass humanoide Roboter künftig Teslas wichtigste langfristige Wertquelle sein werden. Er widmete viel Raum der Erklärung von Robotern und spekulierte, dass die Nachfrage nach dem humanoiden Roboter Optimus 10 Milliarden Einheiten erreichen wird, was die Nachfrage nach Automobilen bei weitem übersteigt, und dass sie sich auf mehrere zehn Milliarden Dollar belaufen könnte.
Da der Sektor der humanoiden Roboter gleichzeitig von den beiden Giganten Tesla und NVIDIA favorisiert wird, verdient er in der Tat einen hohen Stellenwert.
Darüber hinaus hat Peking mehrere Maßnahmen zur Förderung der Entwicklung allgemeiner künstlicher Intelligenz erlassen. Es gibt auch einen Ausdruck verkörperter Intelligenz: Förderung der Erforschung und Anwendung verkörperter Intelligenzsysteme und Durchbruch der Wahrnehmungs-, Erkenntnis- und Entscheidungstechnologien von Robotern unter komplexen Bedingungen wie offenen Umgebungen, verallgemeinerten Szenarien und kontinuierlichen Aufgaben.
Künstliche Intelligenz fügt einen neuen Begriff hinzu
„Embodied Intelligence“ geht ursprünglich auf das Jahr 1950 zurück, als Turing das Konzept erstmals in der Arbeit „Computing Machinery and Intelligence“ vorschlug. Es handelt sich um eine Art maschinelle Intelligenz mit autonomen Entscheidungs- und Handlungsfähigkeiten. Sie kann die Umgebung wie Menschen wahrnehmen und verstehen und Aufgaben durch autonomes Lernen und adaptives Verhalten erledigen.
Genauer gesagt handelt es sich um Roboter/Simulatoren (bezogen auf virtuelle Umgebungen), die wie Menschen mit der Umgebung interagieren und diese wahrnehmen können und über autonome Planungs-, Entscheidungs-, Handlungs- und Ausführungsfähigkeiten (bezogen auf virtuelle Umgebungen) verfügen die ultimative Form der KI. Wir nennen sie vorübergehend „Intelligenter Roboter“. Seine Implementierung umfasst eine Vielzahl von Technologien der künstlichen Intelligenz, wie z. B. Computer Vision, Verarbeitung natürlicher Sprache und Robotik.
Wie der Informatikprofessor der Stanford University, Li Feifei, sagte: „Die Bedeutung der Verkörperung liegt nicht im Körper selbst, sondern in den allgemeinen Bedürfnissen und Funktionen der Interaktion mit der Umwelt und dem Tun von Dingen in der Umwelt.“
Einfach ausgedrückt können verkörperte intelligente Roboter die menschliche Sprache verstehen und entsprechende Aufgaben erledigen. Obwohl das Ideal großartig ist, sieht die Realität so aus, dass es nur „die menschliche Sprache verstehen“ kann und die Menschen immer noch stark auf handgeschriebenen Code angewiesen sind, um Roboter zu steuern.
Dieter Fox, leitender Direktor für Robotikforschung bei NVIDIA und Professor an der University of Washington, wies darauf hin, dass ein Hauptziel der Robotikforschung darin besteht, Roboter zu bauen, die für Menschen in der realen Welt hilfreich sind. Dazu müssen sie jedoch zunächst mit Menschen in Berührung kommen und lernen, mit ihnen umzugehen.
KI nächste Welle
Giants investieren in die humanoide Roboterbahn Nachdem Tesla letztes Jahr den Optimus-Prototyp auf den Markt gebracht hat und kürzlich der OpenAI Venture Fund die A2-Finanzierungsrunde des norwegischen Roboterherstellers 1X Technologies angeführt hat, wird chatGPT auch dazu beitragen, die Wahrnehmungsfähigkeiten humanoider Roboter zu verbessern Roboter und beschleunigen die Industrialisierung.
Das Aufkommen großer Modelle wie GPT hat neue Ideen hervorgebracht – viele Forscher haben versucht, multimodale große Sprachmodelle mit Robotern zu kombinieren, indem sie Bilder, Text und verkörperte Daten gemeinsam trainieren und multimodale Eingaben einführen um das Verständnis des Modells für reale Objekte zu verbessern und Robotern bei der Bewältigung verkörperter Argumentationsaufgaben zu helfen.
Die KI-Teams von Google und Microsoft stehen an vorderster Front und versuchen, Robotern mit großen Modellen Seele zu verleihen.
Am 8. März startete das Team von Google und der Technischen Universität Berlin das größte visuelle Sprachmodell der Geschichte – PaLM-E, mit einem Parametervolumen von 562 Milliarden (das Parametervolumen von GPT-3 beträgt 175 Milliarden). Als multimodales verkörpertes visuelles Sprachmodell (VLM) kann PaLM-E nicht nur Bilder verstehen, sondern auch Sprache verstehen und generieren und verschiedene komplexe Roboteranweisungen ohne Umschulung ausführen. Google-Forscher planen, weitere reale Anwendungen von PaLM-E zu untersuchen, beispielsweise die Heimautomatisierung oder Industrieroboter. Sie hoffen, dass PaLM-E mehr Forschung zu multimodalem Denken und verkörperter KI fördern kann.
In einer aktuellen Studie untersucht das Microsoft-Team, wie das von OpenA entwickelte ChatGPT auf den Bereich der Robotik ausgeweitet werden kann, sodass wir mithilfe von Sprache mehrere Plattformen wie Roboterarme, Drohnen und Haushaltshilferoboter intuitiv steuern können. Die Forscher führten mehrere Beispiele für die Lösung von Roboterproblemen durch ChatGPT an und führten außerdem den Einsatz von ChatGPT zur Lösung komplexer Robotereinsätze in Bereichen wie Betrieb, Luft- und Navigation ein.
Offensichtlich haben Google und Microsoft sehr ähnliche Erwartungen an die verkörperte KI: Menschen bedienen Roboter, ohne komplexe Programmiersprachen oder die Details von Robotersystemen erlernen zu müssen. „Sprache“ (Diktieren/Gestikulieren von Bedürfnissen an den Roboter) ist das „Gesetz“. . “ (Der Roboter erledigt die Aufgabe) und erreicht den Zustand „handlich, wie ein Arm mit Fingern“.
Große Sprachmodelle wie ChatGPT spielen also eine entscheidende Rolle bei der Realisierung einer bequemen Mensch-Computer-Interaktion in verkörperter Intelligenz.
Wenn das durch chatGPT repräsentierte große Modell eine neue Ära der allgemeinen KI eröffnet hat, dann muss multimodale, verkörperte, aktive und interaktive künstliche Intelligenz der einzige Weg nach vorne in dieser Ära sein.
Das obige ist der detaillierte Inhalt vonDie beiden Giganten sind gleichzeitig optimistisch! Künstliche Intelligenz fügt einen neuen Begriff hinzu. Ist es die nächste Welle der KI?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!