Heim > Artikel > Technologie-Peripheriegeräte > Das Energieverbrauchsverhältnis erreicht das Zehnfache von GPT-4! Huang Xuedong entschlüsselt persönlich den Erfolg von Zoom AI und der AI-Begleiter kann direkt Meetings für Sie abhalten
Kürzlich veröffentlichte Huang Xuedong, der KI-Tycoon und aktuelle CTO von Zoom, einen Blog auf seiner offiziellen Website.
In dem er sechs Monate nach seinem Beitritt zu Zoom seine innovativen Errungenschaften großartig vorstellte – Zoom AI Companion, und die Zoom-Verbundansatz-KI, die Zoom AI Companion antreibt.
Vor Zoom war Huang Xuedong Chief Technology Officer von Microsoft Azure AI. Er ist nicht nur Microsofts erster globaler chinesischer technischer Akademiker, sondern auch Microsofts höchstrangiger chinesischer Wissenschaftler.
Huang Xuedong arbeitet seit mehr als 30 Jahren bei Microsoft. Mit seiner Hilfe gründete Microsoft 1998 sein erstes Asien-Forschungsinstitut.
Huang
Huang Beschäftigung mit Spracherkennung, natürlichem Sprachverständnis und Computer Vision und anderen Bereichen. In den sechs Monaten, seit ich bei Zoom angefangen habe, war die Innovationsgeschwindigkeit besonders überraschend Produktivität kontinuierlich steigern.
Zoom bietet seit vielen Jahren künstliche Intelligenzdienste wie Spracherkennung, Computer Vision, maschinelle Übersetzung und große Sprachmodelle (LLM) an, um die Wettbewerbsfähigkeit seiner Software zu verbessern.
Zoom AI Companion ist ihr neuestes Produkt. Sein Ziel besteht darin, Benutzern zu helfen, ihre Arbeitseffizienz zu verbessern, eine nahtlose Zusammenarbeit zu fördern und tiefere Kommunikation und Einblicke zu gewinnen.
Auf diese Weise wird das Benutzererlebnis erheblich verbessert und gleichzeitig kann die Beteiligung neuer Technologien unter den Benutzern schnell erhöht werden.
Für Zoom-Software, die eine große Anzahl von Benutzern hat und intensiv benötigt Verwendung von KI-Funktionen, wie können die zusätzlichen Kosten der LLM-Inferenz aufgeteilt werden?
Gerüchten zufolge soll Copilot von GitHub 10 US-Dollar pro Monat kosten, und jeder Benutzer muss einen zusätzlichen Zuschuss von 20 US-Dollar pro Monat zahlen (LLM) einschließlich eigener Modelle und Modelle von Drittanbietern, wie OpenAI GPT-3.5, GPT-4 und Anthropic Claude 2
Zoom Federated AI integriert die neueste LLM-Technologie von Partnern (wie OpenAIs neu veröffentlichtes GPT- 4 Turbo), um das End-to-End-Erlebnis von Zoom-Kunden zu verbessern
Zoom verfolgt eine kostengünstigere Strategie:
Verwenden Sie zunächst ein kostengünstigeres LLM, um die Aufgabe abzuschließen, und bewerten Sie sie dann die Initialisierung der Aufgabe durch Z-Scorer. Qualität der Fertigstellung
Zoom wird bei Bedarf ein fortgeschritteneres LLM übernehmen, um die durch das anfängliche LLM erzielten Ergebnisse zu verbessern
– Dies ähnelt der Zusammenarbeit eines zusammenhängenden Teams und in der Lage zu sein, es besser als eine Person zu machen. Produkte von höherer Qualität effizienter herzustellen.
Laut internen Tests von Zoom verwendet Zoom im Vergleich zu OpenAI GPT-3.5 Turbo oder mehreren anderen hochmodernen LLMs föderierte KI, um die Ausgabequalität von AI Companion zu verbessern und auch die Kosten effektiv zu kontrollieren.
Huang
In der Abbildung unten sehen wir den Leistungs- und Kostenvergleich von Zoom AI Companion und GPT-4 bei der englischen Besprechungsabfrageaufgabe
In dieser Abbildung vergleichen wir zwei Schlüsselmetriken, nämlich Kosten und Ausgabequalität
Zoom AI Companion erreicht eine nahezu gleichwertige Ausgabequalität bei weniger als 6 % der Kosten von GPT-4
Im Vergleich zum von Microsoft Copilot verwendeten GPT-4-32k-Modell kann die Besprechungsfragenfunktion von Zoom AI Companion die Kosten senken und beschleunigen Sie die Reaktion bei gleichzeitiger Beibehaltung einer beträchtlichen Ausgabequalität.
Das obige Bild ist ein Vergleich zwischen Zoom AI Companion und GPT-4 bei der mehrsprachigen Konferenzzusammenfassungsaufgabe.
Darüber hinaus beweist die mehrsprachige Leistung von AI Companion die Leistungsfähigkeit der Zoom-Verbund-KI, die neben Englisch auch 32 Sprachen unterstützt.
Da die meisten LLMs hauptsächlich mit englischen Daten vorab trainiert werden, hat Zoom ein Übersetzungsmodell hinzugefügt, um die Mehrsprachenfähigkeiten zu erweitern.
In der Zusammenfassungsaufgabe für mehrsprachige Besprechungen vergleicht die obige Abbildung die Leistung von Zoom AI Companion und Microsoft Copilot. Beide verwenden GPT-4 als Proxy für Microsoft Copilot zum Vergleich
In der mehrsprachigen Besprechungszusammenfassung von Zoom AI Companion werden nicht-englische Texte mithilfe des Übersetzungsmodells von Zoom ins Englische übersetzt, das sowohl die Übersetzungsdaten als auch die Originaldaten berücksichtigt .
Wie aus der Abbildung ersichtlich ist, hat Zoom AI Companion die Ausgabe mit einer Qualität nahe GPT-4-32k (97 %) bei weniger als 6 % Kosten abgeschlossen.
Zoom ist davon überzeugt, dass die Vorteile der künstlichen Intelligenz möglichst vielen Menschen allgemein zugänglich gemacht werden sollten, und die föderierte KI von Zoom spielt eine wichtige Rolle bei der Verwirklichung dieser Vision, indem sie die Vorteile verschiedener KI-Systeme nahtlos kombiniert, um eine hohe Leistung zu bieten Ergebnisse. Umgeschriebener Inhalt: Zoom ist davon überzeugt, dass die Vorteile der künstlichen Intelligenz möglichst vielen Menschen allgemein zugänglich gemacht werden sollten. Die föderierte KI von Zoom kann die Vorteile verschiedener künstlicher Intelligenzsysteme nahtlos kombinieren, um leistungsstarke Ergebnisse zu liefern, und spielt eine wichtige Rolle bei der Verwirklichung dieser Vision.
Wenn Sie an der Reihe sind, zu sprechen, können Sie Ihre eigenen Ansichten und den Inhalt früherer Besprechungen kombinieren, um einen Redeentwurf zu erstellen und so ein echtes „Treffen im Namen der Benutzer“ zu realisieren
Nachdem Sie dem beigetreten sind Während einer Besprechung auf halbem Weg kann die KI Ihnen die wichtigsten Punkte der Besprechung mitteilen.
kann Ihnen auch dabei helfen, die Reden anderer Teilnehmer in Echtzeit zu transkribieren und zu übersetzen und den Text der Besprechungsdiskussion einfach abzurufen.
Die Rolle von KI besteht nicht nur darin, fragmentierte Informationen zu organisieren, sondern auch zu generieren Besprechungen für das Team Zusammenfassung und Aufzeichnung
Sie können von der Zoom-Plattform erhaltene Kundenkurznachrichten zusammenfassen und spezifische Ausführungspläne erstellen
Und für Besprechungen, an denen Sie nicht teilnehmen können, können Sie KI auch direkt auf der Plattform vereinbaren Planen Sie eine intelligente Aufnahme und schauen Sie sich dann einzelne Segmente und wichtige Punkte an.
Hinter diesem gesamten KI-Begleiter stecken die technischen Ideen von Zoom und Huang Xuedong Federal AI, die entsprechende KI-Ressourcen nutzen, um entsprechende Anfragen zu bearbeiten.
Und Zoom verspricht, keine Audio-, Video-, Chat-, Bildschirmfreigabe-, Anhänge- oder anderen von Kunden generierten Benutzerdaten (wie Umfrageergebnisse, Whiteboards) zum Trainieren von Zoom oder der KI von Drittanbietern zu verwenden. Wie viel wird es kosten, diese praktischen Funktionen und die verantwortungsvolle KI zu nutzen? Mit Preisen zwischen 150 und 200 Yuan können Sie es ein ganzes Jahr lang nutzen, und Geschäftsanwender können auch eine angepasste Version wählen
Das obige ist der detaillierte Inhalt vonDas Energieverbrauchsverhältnis erreicht das Zehnfache von GPT-4! Huang Xuedong entschlüsselt persönlich den Erfolg von Zoom AI und der AI-Begleiter kann direkt Meetings für Sie abhalten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!