Heim >Technologie-Peripheriegeräte >KI >Auf der Suche nach Szenen für das große Google-Projekt Gemini AI-Projekt Ellman
Das Google-Team schlug die Idee vor, mithilfe von KI-Technologie Benutzerfotos und Suchmaschinenabfrageinformationen zu verarbeiten, um das Leben des Benutzers umfassend zu analysieren. Dieses Projekt heißt „Projekt Ellmann“.
Der ursprünglichen Idee zufolge würde Project Ellmann LLM (wie Gemini) verwenden, um Informationen zu extrahieren, bestimmte Muster aus den Fotos der Benutzer zu finden und dann einen Chatbot zu erstellen, um Fragen genau zu beantworten. Google behauptet, Ellmann werde ein „persönlicher Geschichtenerzähler“ sein.
Klingt interessant, aber möchte Google die Ellmann-Funktionalität in Google Fotos oder in andere Produkte einbetten? Es ist noch unbekannt. Google Fotos hat mehr als 1 Milliarde Nutzer und speichert 4 Billionen Fotos oder Videos.
Google nutzt derzeit KI-Technologie, um seine Produktlinie zu optimieren, und Ellmann ist nur eine der Möglichkeiten, wie sie genutzt werden kann. Vor ein paar Tagen hat Google Gemini sogar übertroffen. Google beabsichtigt, Gemini an Google Cloud-Benutzer zu lizenzieren, um die von ihnen gewünschten Funktionen zu entwickeln. Der hervorstechendste Vorteil von Gemini ist „multimodal“, was bedeutet, dass es mehrere Arten von Informationen wie Text, Bilder, Videos und Audio verstehen kann.
Bei einem kürzlichen internen Meeting stellte ein Google Fotos-Manager das Projekt Ellman vor. Interne Dokumente zeigen, dass das Google-Team davon überzeugt ist, dass große Sprachmodelle verwendet werden können, um die Lebensgeschichten der Nutzer in der realen Welt „aus der Vogelperspektive“ darzustellen.
Durch das Lesen von Biografien, früheren Aufzeichnungen und Fotos ist Ellman in der Lage, Situationen tiefer zu verstehen. Durch die Analyse einer Reihe von Clips kann Ellman beispielsweise feststellen, ob die Informationen das Thema College-Leben berühren
Ein Satz in der Präsentationsfolie lautet: „Wir können das Problem des individuellen Lebens nicht lösen, ohne es zu betrachten.“ „Wir schauen uns Ihre Fotos an, schauen uns ihre Tags und Standorte an und stellen fest, ob sie zu einem bedeutungsvollen Moment gehören.“ Ihre persönliche Geschichte wird im Laufe Ihres Lebens klarer.
Das Google-Team hat auch gesprochen über Ellmann Chat. Was ist Ellmann Chat? Das Team beschrieb: „Sie können sich genauso gut vorstellen, dass es beim Öffnen bereits alles weiß, was mit Ihrem Privatleben zu tun hat. Welche Fragen würden Sie ihm stellen?“
Beispielsweise stellte der Benutzer Ellmann Chat eine Frage: „Tue ich? Haben Sie Fragen? sind die Namen der Familienmitglieder.
Ein weiteres Problem besteht darin, dass der Eigentümer umziehen möchte, sodass die KI einige Städte zur Auswahl bereitstellen kann, die dem bestehenden Wohnumfeld ähneln. Ellmann kann diese Fragen beantworten. Darüber hinaus kennt Ellmann auch die Essgewohnheiten des Nutzers.
Wenn ein Nutzer zum Beispiel etwas kaufen möchte, wofür er sich interessiert, welche Arbeits- und Reisepläne er hat, kann Ellmann durch die Analyse von Fotos die Antwort finden. Ellmann weiß auch, welche Websites Benutzer gerne besuchen und welche Apps sie verwenden. Ein Google-Sprecher verriet: „Google Fotos hat immer gehofft, die Technologie der künstlichen Intelligenz zu nutzen, um Benutzern bei der Suche nach Fotos und Videos zu helfen. Mit LLM können wir mehr praktische Erfahrung bieten.“ Derzeit befindet sich Ellmann noch in der Anfangsphase der internen Erkundung, und es wird einige Zeit dauern, um festzustellen, ob es letztendlich eingeführt wird. Google muss sicherstellen, dass Ellmann den Nutzern wirklich hilft und gleichzeitig den Datenschutz und die Sicherheit der Nutzer berücksichtigt Viele Technologieunternehmen möchten dies tun. Das Projekt Ellmann ist nur eine von vielen neuen Technologien, die neue Technologien nutzen, um persönlichere Erinnerungen für Benutzer zu schaffen.
Ob Google Fotos oder Apple Fotos, sie alle analysieren Fotos, finden Muster und erstellen dann Fotoalben. Google Fotos kann ähnliche Fotos automatisch in Alben gruppieren, damit Nutzer sie leichter durchsuchen können. Apple gab im Juni bekannt, dass seine Software nach einem Upgrade in der Lage sein würde, Personen, Hunde oder Katzen auf Fotos zu identifizieren. Benutzer müssen nur den Namen der Person sagen und die Software wird Ihnen helfen, ihre Fotos zu finden.
Klingt großartig, aber die Technologien von Google und Apple weisen immer noch Mängel auf und manchmal treten Fehler auf. Im Jahr 2015 identifizierte die künstliche Intelligenz von Apple und Google einen Schwarzen fälschlicherweise als Schimpansen, ein Fehler, der für viele Witze sorgte. Selbst jetzt ist ein solcher Fehler immer noch schwer zu vermeiden
Das obige ist der detaillierte Inhalt vonAuf der Suche nach Szenen für das große Google-Projekt Gemini AI-Projekt Ellman. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!