Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Meta-Datenbrillen nutzen multimodales Llama 3! Es kommen Möglichkeiten für heimische AR-Brillen

Meta-Datenbrillen nutzen multimodales Llama 3! Es kommen Möglichkeiten für heimische AR-Brillen

王林
王林nach vorne
2024-04-24 14:50:14406Durchsuche

Die AR-Black-Technologie in Science-Fiction-Blockbustern ist tatsächlich Realität geworden!

Gerade jetzt haben Metas eigene Ray-Ban-Datenbrillen damit begonnen, die multimodale Version von Llama 3 zu unterstützen! Wissen Sie, die Open-Source-Version von Llama 3 unterstützt noch keine Multimodalität.

Kürzlich gab Xiao Zha in der Diskussion auch zu, dass das Open-Source-Modell 10 Milliarden US-Dollar wert sei. Wenn es jedoch um die Produktseite geht, ist das eine andere Geschichte.

Hey, ist das Produkt nicht hier?

Wenn Sie sich beim Reisen und Autofahren langweilen, können Sie Meta bitten, etwas Musik abzuspielen.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Mit einer AR-Brille können Sie auch unbekannte Sprachen direkt übersetzen. Oder wenn Sie unterwegs keine Zeit haben, kann Meta Sprachnachrichten an Freunde senden.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Gehen Sie zu einem Gebäude und rufen Sie Meta an, um weitere Informationen darüber zu erhalten.

Sogar Videoanrufe, Live-Übertragungen, wissenschaftliche Popularisierung usw., solange Sie daran denken können, können AR-Brillen das.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Meta gab bekannt, dass es im Dezember letzten Jahres mit dem Testen multimodaler KI auf Ray-Ban Meta-Datenbrillen begonnen hat. Derzeit wurde diese neue Funktion für Brillen eingeführt, die in den USA und Kanada verkauft werden.

Zha ist auch hier, um sein Können unter Beweis zu stellen

Diese Brille ist mit einer 12-Megapixel-Kamera und fünf Mikrofonen ausgestattet. Durch die Integration des Meta-KI-Assistenten können Sie noch mehr damit machen.

Alles, was du siehst, kann es beschreiben.

Sagen Sie einfach: „Hey Meta, schauen Sie sich das an, sagen Sie mir, was es ist?“ und es kann per Sprachbefehl gesteuert werden.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Beim Blick auf den Stapel an Zutaten auf der Küchentheke kann Meta schnell relevante Rezepte erstellen.

Interessanter ist, dass Xiao Zha selbst auch ein Video auf Instagram gepostet hat, in dem er eine intelligente Brille trägt und Kleidung für sich auswählt.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Er suchte sich ein dunkles Hemd aus und fragte Meta, zu was für einer Hose ich es tragen sollte. Meta gibt Vorschläge für Jeans und Shorts.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Außerdem bat er die Datenbrille, einem Foto eines süßen Haustiers eine interessante Beschreibung hinzuzufügen.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Xiao Zha hält eine Art Frucht in der Hand und die Datenbrille kann ihm sagen, dass es sich um Brotfrucht handelt.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Und für AR-Brillen wird die Echtzeitübersetzung zur Killer-App.

Wenn Sie auf Reisen sind und versuchen, eine französische Speisekarte zu lesen. Intelligente Brillen können die Übersetzung in Echtzeit durchführen, ohne dass Sie Ihr Telefon konsultieren müssen.

Es kann sogar Gesten in verschiedenen Sprachen lesen, was es zu einem Muss auf Reisen macht.

Zusätzlich zur Unterstützung durch multimodales Llama 3 kündigte Meta auch an, dass intelligente Brillen Freisprech-Videoanrufe mit WhatsApp und Messenger integrieren.

Gleichzeitig können mit Korrektionsbrillen unterschiedliche modische Rahmendesigns verwendet werden.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Allerdings gibt es diese Datenbrille ab 300 US-Dollar (2100 Yuan), was nicht gerade billig ist.

Genau getestet, ist es bequemer, Objekte im Freien zu identifizieren als ein Mobiltelefon.

Aufgrund der Aufregung über das Update veröffentlichten ausländische Medien The Verge eine Bewertung von jemandem, der sich im Voraus für interne Tests qualifiziert hatte.

Vor einiger Zeit wurde das Humane Smart Device AI Pin wegen unbefriedigender Leistung kritisiert. Der Punkt ist, dass es sich für 700 Dollar überhaupt nicht lohnt.

Der Autor sagte: „Wir sollten keine zu hohen Erwartungen an die Meta-Datenbrille haben, denn sie ist nicht allmächtig.“

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Der halbe Spaß beim Testen besteht darin, herauszufinden, wo die Grenzen liegen.

Kann es dieses zufällige Auto auf der Straße richtig identifizieren? (ein Alfa Romeo Giulia Quadrifoglio und ein Alfa Romeo Tonale).

Wie die meisten KI ist Meta-KI manchmal sehr genau und manchmal halluzinierend.

Giulia wurde richtig identifiziert. Tonale wird aber auch als Giulia identifiziert.

Aber interessanterweise haben die beiden Autos fast keine Ähnlichkeiten, der Giulia ist eine Limousine und der Tonale ist ein Crossover-SUV.

Der Autor bat ihn auch, die von ihm angebauten Sukkulenten zu identifizieren (da einige davon von anderen gegeben wurden, kannte er die spezifischen Sorten nicht vollständig).

Meta antwortete: „Echeveria-, Aloe Vera- und Crassula-Sorten“.

Aber tatsächlich verwendete der Autor Planta, eine Anwendung, die Pflanzen anhand von KI-Fotos identifizieren kann, um dies zu überprüfen, und stellte fest, dass es sich bei keiner der Pflanzen um Echeveria handelte.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Das Aufregendste ist, dass der Liebhaber des Autors versehentlich ein großes Eichhörnchen im Hinterhof des Nachbarn sah und eine Datenbrille aufsetzte, um zu identifizieren, um welche Art es sich handelte.

Der Autor hat das Foto mit seinem Handy aufgenommen und es mit einer anderen App ausprobiert.

Natürlich hat Meta es falsch identifiziert, aber die vom Autor verwendete APP hat es erfolgreich als Murmeltier identifiziert.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Als jedoch die Datenbrille zur Identifizierung der Fotos auf dem Telefon verwendet wurde, wurde tatsächlich die richtige Antwort „Murmeltier“ gegeben.

Dieser Fall zeigt, dass der AR-Brille die „Zoom“-Funktion fehlt, was zur falschen Antwort führt.

Zusätzlich zu den multimodalen Erkennungsfunktionen war auch die Reaktionsgeschwindigkeit sehr schnell, als der Autor es in Verbindung mit einem Mobiltelefon testete. Gleichzeitig integrieren Datenbrillen Soundfunktionen, wodurch das Tragen einer Brille überflüssig wird und die Interaktion natürlicher wird.

Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了

Im Allgemeinen spielen Meta-Datenbrillen eine große Rolle bei der Identifizierung von Dingen bei Outdoor-Aktivitäten, und der KI-Assistent spielt eine große Rolle.

Wenn der Autor früher beim Ausgehen etwas Interessantes sah, musste er sein Mobiltelefon herausnehmen und ein Foto machen, um es zu identifizieren.

Mittlerweile können Datenbrillen auch die Fähigkeiten von Mobiltelefonen sehr gut erweitern, sofern der Inhalt, den Sie identifizieren möchten, nicht um ein Vielfaches vergrößert wird.

Das obige ist der detaillierte Inhalt vonMeta-Datenbrillen nutzen multimodales Llama 3! Es kommen Möglichkeiten für heimische AR-Brillen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen