Heim > Artikel > Technologie-Peripheriegeräte > Google führt Mirasol ein: 3 Milliarden Parameter und erweitert das multimodale Verständnis auf lange Videos
Nachrichten vom 16. November: Google hat kürzlich eine Pressemitteilung veröffentlicht, in der Mirasol vorgestellt wird, ein kleines Modell für künstliche Intelligenz, das Fragen zu Videos beantworten und neue Rekorde aufstellen kann.
Für KI-Modelle ist es derzeit schwierig, mit verschiedenen Datenströmen umzugehen. Wenn Sie möchten, dass KI Videos versteht, müssen Sie Informationen aus verschiedenen Modalitäten wie Video, Audio und Text integrieren, was die Schwierigkeit erheblich erhöht. Forscher von Google und Google Deepmind haben neue Methoden vorgeschlagen, um das multimodale Verständnis auf den Bereich langer Videos auszudehnen. Mit dem KI-Modell von Mirasol arbeitete das Team an der Lösung zweier zentraler Herausforderungen:offizielle Version von Mirasol Press an Release , interessierte Benutzer können es ausführlich lesen.
Das obige ist der detaillierte Inhalt vonGoogle führt Mirasol ein: 3 Milliarden Parameter und erweitert das multimodale Verständnis auf lange Videos. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!