Heim >Technologie-Peripheriegeräte >KI >Meta-Datenbrillen nutzen multimodales Llama 3! Es kommen Möglichkeiten für heimische AR-Brillen
Die AR-Black-Technologie in Science-Fiction-Blockbustern ist tatsächlich Realität geworden!
Gerade jetzt haben Metas eigene Ray-Ban-Datenbrillen damit begonnen, die multimodale Version von Llama 3 zu unterstützen! Wissen Sie, die Open-Source-Version von Llama 3 unterstützt noch keine Multimodalität.
Kürzlich gab Xiao Zha in der Diskussion auch zu, dass das Open-Source-Modell 10 Milliarden US-Dollar wert sei. Wenn es jedoch um die Produktseite geht, ist das eine andere Geschichte.
Hey, ist das Produkt nicht hier?
Wenn Sie sich beim Reisen und Autofahren langweilen, können Sie Meta bitten, etwas Musik abzuspielen.
Mit einer AR-Brille können Sie auch unbekannte Sprachen direkt übersetzen. Oder wenn Sie unterwegs keine Zeit haben, kann Meta Sprachnachrichten an Freunde senden.
Gehen Sie zu einem Gebäude und rufen Sie Meta an, um weitere Informationen darüber zu erhalten.
Sogar Videoanrufe, Live-Übertragungen, wissenschaftliche Popularisierung usw., solange Sie daran denken können, können AR-Brillen das.
Meta gab bekannt, dass es im Dezember letzten Jahres mit dem Testen multimodaler KI auf Ray-Ban Meta-Datenbrillen begonnen hat. Derzeit wurde diese neue Funktion für Brillen eingeführt, die in den USA und Kanada verkauft werden.
Diese Brille ist mit einer 12-Megapixel-Kamera und fünf Mikrofonen ausgestattet. Durch die Integration des Meta-KI-Assistenten können Sie noch mehr damit machen.
Alles, was du siehst, kann es beschreiben.
Sagen Sie einfach: „Hey Meta, schauen Sie sich das an, sagen Sie mir, was es ist?“ und es kann per Sprachbefehl gesteuert werden.
Beim Blick auf den Stapel an Zutaten auf der Küchentheke kann Meta schnell relevante Rezepte erstellen.
Interessanter ist, dass Xiao Zha selbst auch ein Video auf Instagram gepostet hat, in dem er eine intelligente Brille trägt und Kleidung für sich auswählt.
Er suchte sich ein dunkles Hemd aus und fragte Meta, zu was für einer Hose ich es tragen sollte. Meta gibt Vorschläge für Jeans und Shorts.
Außerdem bat er die Datenbrille, einem Foto eines süßen Haustiers eine interessante Beschreibung hinzuzufügen.
Xiao Zha hält eine Art Frucht in der Hand und die Datenbrille kann ihm sagen, dass es sich um Brotfrucht handelt.
Und für AR-Brillen wird die Echtzeitübersetzung zur Killer-App.
Wenn Sie auf Reisen sind und versuchen, eine französische Speisekarte zu lesen. Intelligente Brillen können die Übersetzung in Echtzeit durchführen, ohne dass Sie Ihr Telefon konsultieren müssen.
Es kann sogar Gesten in verschiedenen Sprachen lesen, was es zu einem Muss auf Reisen macht.
Zusätzlich zur Unterstützung durch multimodales Llama 3 kündigte Meta auch an, dass intelligente Brillen Freisprech-Videoanrufe mit WhatsApp und Messenger integrieren.
Gleichzeitig können mit Korrektionsbrillen unterschiedliche modische Rahmendesigns verwendet werden.
Allerdings gibt es diese Datenbrille ab 300 US-Dollar (2100 Yuan), was nicht gerade billig ist.
Aufgrund der Aufregung über das Update veröffentlichten ausländische Medien The Verge eine Bewertung von jemandem, der sich im Voraus für interne Tests qualifiziert hatte.
Vor einiger Zeit wurde das Humane Smart Device AI Pin wegen unbefriedigender Leistung kritisiert. Der Punkt ist, dass es sich für 700 Dollar überhaupt nicht lohnt.
Der Autor sagte: „Wir sollten keine zu hohen Erwartungen an die Meta-Datenbrille haben, denn sie ist nicht allmächtig.“
Der halbe Spaß beim Testen besteht darin, herauszufinden, wo die Grenzen liegen.
Kann es dieses zufällige Auto auf der Straße richtig identifizieren? (ein Alfa Romeo Giulia Quadrifoglio und ein Alfa Romeo Tonale).
Wie die meisten KI ist Meta-KI manchmal sehr genau und manchmal halluzinierend.
Giulia wurde richtig identifiziert. Tonale wird aber auch als Giulia identifiziert.
Aber interessanterweise haben die beiden Autos fast keine Ähnlichkeiten, der Giulia ist eine Limousine und der Tonale ist ein Crossover-SUV.
Der Autor bat ihn auch, die von ihm angebauten Sukkulenten zu identifizieren (da einige davon von anderen gegeben wurden, kannte er die spezifischen Sorten nicht vollständig).
Meta antwortete: „Echeveria-, Aloe Vera- und Crassula-Sorten“.
Aber tatsächlich verwendete der Autor Planta, eine Anwendung, die Pflanzen anhand von KI-Fotos identifizieren kann, um dies zu überprüfen, und stellte fest, dass es sich bei keiner der Pflanzen um Echeveria handelte.
Das Aufregendste ist, dass der Liebhaber des Autors versehentlich ein großes Eichhörnchen im Hinterhof des Nachbarn sah und eine Datenbrille aufsetzte, um zu identifizieren, um welche Art es sich handelte.
Der Autor hat das Foto mit seinem Handy aufgenommen und es mit einer anderen App ausprobiert.
Natürlich hat Meta es falsch identifiziert, aber die vom Autor verwendete APP hat es erfolgreich als Murmeltier identifiziert.
Als jedoch die Datenbrille zur Identifizierung der Fotos auf dem Telefon verwendet wurde, wurde tatsächlich die richtige Antwort „Murmeltier“ gegeben.
Dieser Fall zeigt, dass der AR-Brille die „Zoom“-Funktion fehlt, was zur falschen Antwort führt.
Zusätzlich zu den multimodalen Erkennungsfunktionen war auch die Reaktionsgeschwindigkeit sehr schnell, als der Autor es in Verbindung mit einem Mobiltelefon testete. Gleichzeitig integrieren Datenbrillen Soundfunktionen, wodurch das Tragen einer Brille überflüssig wird und die Interaktion natürlicher wird.
Im Allgemeinen spielen Meta-Datenbrillen eine große Rolle bei der Identifizierung von Dingen bei Outdoor-Aktivitäten, und der KI-Assistent spielt eine große Rolle.
Wenn der Autor früher beim Ausgehen etwas Interessantes sah, musste er sein Mobiltelefon herausnehmen und ein Foto machen, um es zu identifizieren.
Mittlerweile können Datenbrillen auch die Fähigkeiten von Mobiltelefonen sehr gut erweitern, sofern der Inhalt, den Sie identifizieren möchten, nicht um ein Vielfaches vergrößert wird.
Das obige ist der detaillierte Inhalt vonMeta-Datenbrillen nutzen multimodales Llama 3! Es kommen Möglichkeiten für heimische AR-Brillen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!