Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

王林
王林nach vorne
2023-04-11 12:34:031790Durchsuche

​Musks „Open-Source-Verpflichtung“ ist endlich wahr geworden.

Gerade hat Musk offiziell angekündigt:

Die meisten (Twitters) Empfehlungsalgorithmen werden heute Open Source sein, der Rest wird folgen.

Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

Und Musk zeigte sofort die Adresse des Quellcodes des Twitter-Empfehlungsalgorithmus auf GitHub.

In nur wenigen Stunden wurden Zehntausende Sterne gewonnen:

Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

Darüber hinaus sagte Musk auch:

Twitter wird den Empfehlungsalgorithmus alle 24 bis 48 Stunden basierend auf Benutzervorschlägen aktualisieren.

Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

An diesem Punkt wurde endlich das wahre Gesicht dieses großen Algorithmus enthüllt, der behauptet, täglich Empfehlungen aus 500 Millionen Tweets zu geben.

Wie sieht der Empfehlungsalgorithmus von Twitter aus?

Berichten zufolge basiert das Empfehlungssystem von Twitter auf einer Reihe von Kernmodellen und -funktionen, die potenzielle Informationen aus Tweets, Nutzern und Interaktionsdaten extrahieren können.

Die Rolle dieser Modelle besteht darin, wichtige Fragen im Twitter-Netzwerk zu beantworten, wie zum Beispiel: „Wie hoch ist die Wahrscheinlichkeit, dass Sie in Zukunft mit einem anderen Benutzer interagieren werden?“ oder „Welche Communities gibt es auf Twitter und welche sind das?“

Wenn Sie diese Fragen genau beantworten können, können Sie Twitter relevantere Empfehlungen geben lassen.

Das Empfehlungssystem von Twitter besteht aus drei Teilen:

  • Erhalten Sie die besten Tweets aus verschiedenen Empfehlungsquellen. Dieser Vorgang wird als Kandidatenquellen bezeichnet.
  • Verwenden Sie Modelle des maschinellen Lernens, um jeden Tweet zu bewerten.
  • Wenden Sie Heuristiken und Filter an, z. B. das Filtern von Tweets blockierter Benutzer, NSFW-Inhalten und gesehenen Tweets.

Der Dienst, der für die Erstellung und Bereitstellung der „Für Sie“-Timeline verantwortlich ist, heißt „Home Mixer“.

„Home Mixer“ basiert auf „Product Mixer“, einem benutzerdefinierten Scala-Framework, das beim Aufbau dynamischer Inhaltsflüsse hilft.

Dieser Dienst dient als Software-Rückgrat und verbindet verschiedene Kandidatenquellen, Bewertungsfunktionen, Heuristiken und Filter.

Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

Kandidatenquellen

Twitter nutzt mehrere Kandidatenquellen, um aktuelle und relevante Tweets für Benutzer abzurufen.

Für jede Anfrage versucht Twitter, über diese Quellen die besten 1500 Tweets aus einem Pool von Hunderten Millionen Tweets zu ziehen.

Finden Sie Kandidaten von Personen, denen Sie folgen (internes Netzwerk) und von Personen, denen Sie nicht folgen (externes Netzwerk).

Heutzutage besteht die Timeline „Für Sie empfohlen“ im Durchschnitt aus 50 % internen Netzwerk-Tweets und 50 % externen Netzwerk-Tweets (obwohl dies je nach Benutzer variieren kann).

In-Network Source

In-Network Source ist die größte Kandidatenquelle und zielt darauf ab, den Benutzern, denen Sie folgen, die relevantesten und neuesten Tweets bereitzustellen.

Es verwendet ein logistisches Regressionsmodell, um Tweets von Personen, denen Sie folgen, basierend auf ihrer Relevanz effizient zu bewerten. Die Tweets mit dem höchsten Rang werden dann an die nächste Stufe weitergeleitet.

Die wichtigste Komponente beim Ranking interner Netzwerk-Tweets ist der Real Graph.

Real Graph ist ein Modell zur Vorhersage der Wahrscheinlichkeit einer Interaktion zwischen zwei Benutzern. Je höher der Real Graph-Score zwischen dem Benutzer und dem Tweet-Autor ist, desto mehr Tweets werden darin enthalten.

Interne Webquellen waren kürzlich Gegenstand der Recherche von Twitter. Twitter hat kürzlich die Nutzung des Fanout-Dienstes eingestellt, eines 12 Jahre alten Dienstes, mit dem das Unternehmen Tweets aus seinem internen Netzwerk aus dem Tweet-Cache jedes Benutzers bereitstellte.

Quellen außerhalb des Netzwerks

Das Auffinden relevanter Tweets außerhalb des Netzwerks eines Benutzers ist ein kniffliges Problem.

Denn wenn Sie dem Autor nicht folgen, woher wissen Sie dann, ob ein Tweet für Sie relevant ist?

Zu diesem Zweck hat Twitter zwei Ansätze gewählt, um dieses Problem zu lösen.

Einer ist der Social Graph.

Mit dieser Methode können Sie abschätzen, was Sie relevant finden, indem Sie die Aktivitäten von Personen analysieren, denen Sie folgen oder die ähnliche Interessen haben.

Durchsuchen Sie hauptsächlich die Teilnehmergrafik und befolgen Sie die folgenden Schritte, um die folgenden Fragen zu beantworten:

  • Was haben die Personen, denen ich folge, kürzlich auf Twitter gepostet?
  • Wer mag ähnliche Tweets wie ich und was hat ihnen in letzter Zeit sonst noch gefallen?

Das Team generiert Kandidaten-Tweets basierend auf den Antworten auf diese Fragen und verwendet ein Logit-Modell, um die resultierenden Tweets zu bewerten.

Diese Art der Graph-Durchquerung ist für externe Netzwerkempfehlungen unerlässlich; das Team hat GraphJet entwickelt, eine Graph-Verarbeitungs-Engine, die ein Echtzeit-Interaktionsdiagramm zwischen Benutzern und Tweets verwaltet, um diese Durchquerungen durchzuführen.

Während sich diese Heuristik für die Suche nach Twitter-Engagement und das Verfolgen von Netzwerken als nützlich erwiesen hat, ist der eingebettete räumliche Ansatz zu einer größeren Quelle für Tweets aus externen Netzwerken geworden.

Das zweite ist das Einbetten von Leerzeichen.

Der eingebettete räumliche Ansatz zielt darauf ab, eine allgemeinere Frage zur Inhaltsähnlichkeit zu beantworten: Welche Tweets und Benutzer teilen meine Interessen?

Einbettungen funktionieren, indem sie eine digitale Darstellung der Benutzerinteressen und Tweet-Inhalte generieren. Anschließend kann die Ähnlichkeit zwischen zwei beliebigen Benutzern, Tweets oder Benutzer-Tweet-Paaren in diesem Einbettungsraum berechnet werden.

Diese Ähnlichkeit kann als Ersatz für die Korrelation verwendet werden, solange eine genaue Einbettung erzeugt wird.

Einer der nützlichsten Einbettungsbereiche von Twitter ist SimClusters.

SimClusters verwendet einen benutzerdefinierten Matrixfaktorisierungsalgorithmus, um Communities zu entdecken, die von einer Gruppe einflussreicher Benutzer verankert sind (145.000 Communities, alle drei Wochen aktualisiert).

Benutzer und Tweets werden in Community-Bereichen dargestellt und können mehreren Communities angehören. Die Größe der Community reicht von einigen Tausend Nutzern in persönlichen Freundesgruppen bis hin zu Hunderten Millionen Nutzern in der Nachrichten- oder Popkultur:

Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

...

Für weitere Details klicken Sie bitte auf den Link am Ende des Artikels~

One More Thing

Der Algorithmus von Twitter ist Open Source, und schnelle Internetnutzer ... haben begonnen, basierend auf dem Algorithmus zusammenzufassen, wie man ein großes V wird:

Das Verhältnis der Anzahl der Personen, denen man folgt Die Anzahl der Personen, die Ihnen folgen, ist sehr wichtig, und das Abonnieren von TwitterBlue spielt eine gewisse Rolle... …

Der Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln

Referenzlink:
[1]​​​https://www.php.cn/link /ce2b9a26bddc32cba5af69372ee14c00​​​
[2]​​​https://www.php /link /10fe8dc69a0964edc16fed1a1bd55716​​​
[4]​​​https:// www.php .cn/link/51f4efbfb3e18f4ea053c4d3d282c4e2​

Das obige ist der detaillierte Inhalt vonDer Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen