Heim > Artikel > Technologie-Peripheriegeräte > Komplexe experimentelle Designprobleme im zweiseitigen Markt von Kuaishou
Ein zweiseitiger Markt, also eine Plattform, umfasst zwei Teilnehmer, Produzenten und Konsumenten, und beide Parteien sich gegenseitig fördern. Kuaishou hat beispielsweise einen Videoproduzenten und einen Videokonsumenten, und die beiden Identitäten können sich bis zu einem gewissen Grad überschneiden.
Das bilaterale Experiment ist eine experimentelle Methode, die Gruppen auf Produzenten- und Verbraucherseite kombiniert.
Bilaterale Experimente haben folgende Vorteile:
(1) Die Auswirkungen der neuen Strategie auf zwei Aspekte können gleichzeitig erkannt werden, beispielsweise Änderungen im Produkt-DAU und der Anzahl der Personen, die Werke hochladen. Bilaterale Plattformen haben oft netzwerkübergreifende Effekte, je mehr Leser es gibt, desto aktiver werden die Autoren sein, und je aktiver die Autoren sind, desto mehr Leser werden ihnen folgen.
(2) kann Effektüberlauf und -übertragung erkennen.
(3) Helfen Sie uns, den Wirkungsmechanismus besser zu verstehen. Das AB-Experiment selbst kann uns nicht sagen, welche Art von Wirkung und Datenänderungen erzielt werden was wir tun. Der Wirkungsmechanismus zwischen der Produktionsseite und der Verbraucherseite erfordert jedoch komplexere experimentelle Designs und experimentellere Indikatoren, um diese Probleme klar zu verstehen. 2. Beispiel für ein bilaterales Experiment
Es gibt keine Beauty-Funktion für den Anker. Wenn es keinen Publikumsüberlauf gibt, sollten die BD-Daten jedoch konsistent sein, wenn es Unterschiede in den Daten-BD gibt, wenn der Anker dies nicht hat Bei der Schönheitsfunktion wird das Publikum andere Anker betrachten. Wenn es um die Schönheitsfunktion geht, wird sich der tatsächliche Effekt positiv oder negativ auswirken. Auf die gleiche Weise kann durch diese Art von bilateralem Experiment auch ein Überlauf auf der Ankerseite durchgeführt werden, um den Mechanismus des Experiments besser zu verstehen und festzustellen, ob auf beiden Seiten des Experiments ein Überlauf vorliegt.
2. Herausforderungen von Anreizstrategien
Innerhalb des angebotsseitigen Verbraucherökosystems erfordert die Geschäftsdauer eine politische Verkehrsunterstützung. Dies ist die Anreizstrategie, die hauptsächlich die folgenden drei Arten umfasst Szenario:
(2) Einige Unternehmen müssen bestimmte Arten von Autoren erschließen Autoren und bieten eine gewisse Makrosteuerung des Verkehrs und eine stärkere Verkehrsverteilung Inhalt.
In den oben genannten Szenarien handelt es sich häufig nicht um eine Online-Lernmethode, sondern um eine Makrosteuerung des Plattformverkehrs aus menschlicher Sicht. Für diejenigen, die sich relativ langfristig orientieren, ist es notwendig, den Lerneffekt (Förderung der Produktion usw.) zu beobachten, und Methoden wie Zeitscheibenrotation werden nicht ausprobiert. Zum Beispiel das folgende Szenario: Stellen Sie Autoren Verkehrsunterstützung mit einer Art Richtungsverkehr zur Verfügung, um zu untersuchen, ob die Interaktion und Produktion dieses Verkehrs in einem Langzeitszenario lange anhalten kann.
Der erste ist der Druck auf Seiten des Autors: Bei den meisten dieser Experimente ist die Gesamtzahl der Belichtungen auf der Plattform begrenzt Die Belastung der nicht unterstützten Kontrollgruppe nimmt zu. Wenn die Kaltstartexposition des Autors stärker ansteigt als die Kaltstartexposition des Lesers, beweist dies, dass es zu Gedränge kommt.
Gemäß der obigen Abbildung ist auf der Grundlage der Beziehung zwischen der Versuchsgruppe und der Kontrollgruppe und dem relativen Basisunterschied der Exposition jeder Gruppe ersichtlich, dass zu Beginn des Experiments der Autor schließlich einen Schub erhalten wird Wird nicht nur an Benutzergruppe B, sondern auch an Benutzergruppe B über das Empfehlungssystem weitergegeben. Die Expositionsunterschiede von Benutzergruppe A, Autor B, Benutzer B sowie Autor B und Benutzer A sind grundsätzlich konsistent. Traditionelle Experimente widmeten sich der Korrektur der durch diese Strategie verzerrten Verkehrssituation.
SUTVA geht davon aus, dass das Individuum i nur damit zusammenhängt, ob es während des Experiments der Versuchsgruppe oder der Kontrollgruppe zugeordnet wird, und nichts damit zu tun hat, zu welcher Gruppe die anderen Knoten gehören Unabhängig davon, ob andere Knoten in einer kooperativen Beziehung stehen, ist das experimentelle System immer noch eine Wettbewerbsbeziehung. SUTVA ist die grundlegendste Annahme, um in AB-Experimenten effektive Schlussfolgerungen zu erhalten.
Das tatsächliche bilaterale Netzwerk verstößt gegen die SUTVA-Annahme.
Im Kurzvideoszenario wird jede Aufnahmestrategie als Sortieralgorithmus betrachtet. Unterschiedliche Anreizstrategien führen zu unterschiedlichen Ranking-Ergebnissen von Kurzvideos. RC in der obigen Abbildung stellt die Kontrollgruppe dar, RT_25 % ist die Algorithmus-Sortierkombination, wenn der Datenverkehr der Versuchsgruppe 25 % beträgt, und RT stellt den experimentellen Vorstoß der Versuchsgruppe mit einer Algorithmus-Sortierkombination von 100 % dar. BCDE ist der experimentelle Zielbenutzertyp, dh der ausgewählte Anreizautor arbeitet. Und D bedeutet, dass, wenn die experimentelle Schlussfolgerung 25 % beträgt, sie genau in die experimentelle Gruppe fällt. Angenommen, D wird durch die Empfehlungsgewichtungsmethode direkt an die erste Stelle gesetzt. Wenn die Strategie auf 100 % ansteigt, wird BCDE gewichtet. In diesem Fall verringert sich die Rangfolge der D-Werke. Dieses Szenario ist die Überfüllung der Versuchsgruppe und der Grund für die Überfüllung. 3. Optionale Lösungen: 1. Option 1: Allmähliche Erweiterung Der Effekt nimmt ab, wenn die Flussrate der Kontrollgruppe abnimmt.
Daraus können wir folgende Schlussfolgerung ziehen: Eine schrittweise Ausweitung ist sinnvoll. Der Indikator wird entsprechend der Ausweitung ansteigen. Ob der Anstieg mit zunehmendem Verkehr geringer wird, lässt sich nicht bestätigen. Aus den aktuellen Versuchsergebnissen lässt sich schließen, dass die Datenleistung der Versuchsgruppe, die zuerst Verkehrsunterstützung erhielt, besser sein wird als die der Versuchsgruppe, die später Verkehrsunterstützung erhielt.
2. Option 2: Die kleine Welt aufteilenWie in der Abbildung oben gezeigt, sind die Experimentalgruppe und die Kontrollgruppe vollständig isoliert. Leser in der Experimentalgruppe können nur die Werke der Experimentalgruppe sehen, und Leser in der Kontrollgruppe können nur die Werke der Kontrolle sehen Gruppe. Dies vermeidet einen Engpass zwischen Autor und Leser. Ein ähnlicher Ansatz besteht darin, die Verkehrsverteilung zwischen Autoren und Lesern als Netzwerkdiagramm zu behandeln. Einige Leser lesen gerne nur einige Arten von Werken. Experimentelle Gruppen können aus der Kontrollgruppe aufgeteilt werden. Der obige Ansatz steht im Einklang mit der Methode zur Aufteilung kleiner Welten und führt zu besseren praktischen Ergebnissen, verursacht aber gleichzeitig auch höhere Rechenkosten. Die Hauptprobleme bei der Aufteilung der kleinen Welt sind: (1) Das Algorithmus-Empfehlungssystem erfordert einen bestimmten Maßstab für den Kaltstart Vertriebsraum. Unterschiedliche Unternehmen und unterschiedliche Plattformen stellen unterschiedliche Anforderungen an die feinste Granularität der Segmentierungsstruktur, um den Elastizitätseffekt der Empfehlungen beizubehalten. In den meisten Fällen werden abnehmende Randeffekte empfohlen. (2) Eine klare Verkehrsisolierung wird bestimmte Einschränkungen hinsichtlich der Anzahl der Experimente und Inspektionsmethoden für Proben mit sich bringen. Für parallele Experimentierszenarien müssen isolierte Benutzer ständig neu organisiert und aufgeteilt werden. Korrektur anhand analytischer Methoden statt experimentellem Design: Die Gründe für die Verwendung experimenteller Korrekturmethoden: Erstens ist es schwierig, die Annahmen in der tatsächlichen Analysekorrekturmethode zu überprüfen, da der Überlauf und die Verdrängung von Netzwerkeffekten variieren , und es ist schwierig, es in kurzer Zeit zu überprüfen. Es ist unmöglich, eine allgemeine Methode durch interne Zusammenfassung der Regeln zu erhalten. Tatsächlich hofft unsere Lösung, eine große Klasse von Problemen zu lösen. 4. Erstellen Sie eine umfassende Lösung RT_100 % können beibehalten werden. Konsistente Ergebnisse.
Implementierungsmethode: Verwenden Sie zunächst zwei Sätze von RT/RC-Sortieralgorithmen, um gleichzeitig zu sortieren, und teilen Sie die Autoren in eine experimentelle Gruppe und eine Kontrollgruppe auf In der Gruppe werden den Lesern die Ergebnisse der beiden Algorithmen angezeigt. Sortieren Sie die Fusionsreihenfolge.
Machen Sie RC zu einer Online-Sortierlösung, die derzeit nicht von allen Autoren unterstützt wird, und erhöhen Sie die Rechte aller Wissensautoren in RT. Platzieren Sie nach dem Zusammenführen der Sortierergebnisse von RC und RT zunächst die Autoren (T1T2), die der RT der Versuchsgruppe entsprechen, an der entsprechenden Sortierposition der endgültigen Gruppe und behalten Sie die Reihenfolge der Autoren der Kontrollgruppe in einer Reihenfolge bei, die nichts mit dem Original zu tun hat Experiment. Um konservativ zu sein, wird in Zeiten geringen Verkehrsaufkommens empfohlen, mit Ausnahme experimenteller Arbeiten andere Arbeiten in der ursprünglichen Reihenfolge auszuführen. Wenn das Experiment extrapoliert wurde, werden die RT-Ergebnisse vollständig verwendet.
Was wäre, wenn die Experimentalgruppe und die Kontrollgruppe um die gleiche Position konkurrieren?
Wenn gemäß dem obigen Versuchsaufbau die Werke der Versuchsgruppe und die Werke der Kontrollgruppe um dieselbe Position konkurrieren, ist die Auswahl nach dem Zufallsprinzip der einfachste Weg. Die Wahrscheinlichkeit dafür ist sehr gering.
Wenn sowohl die Versuchsgruppe als auch die Kontrollgruppe einen % des Gesamtverkehrs haben, angenommen a=2,
Unter der Annahme, dass 10 Werke gleichzeitig beworben werden, wird die Wahrscheinlichkeit, dass die Top 10 Werke sowohl aus der Experimentalgruppe als auch aus der Kontrollgruppe erscheinen, wie oben gezeigt berechnet, was etwa 3,3 beträgt %. Wenn die beiden Algorithmen völlig unabhängig sind, ist die Wahrscheinlichkeit eines Konflikts auf denselben Top-10-Positionen geringer.
Die Verbesserung erfolgt oft schrittweise, wobei RC und RT stark korrelieren und weniger widersprüchlich sind. Gleichzeitig kann durch Offline-Tests auch die Wahrscheinlichkeit von Konflikten im Vorfeld abgeschätzt werden.
Die Hauptindikatorauswertungen der oben genannten bilateralen Experimente lassen sich in die folgenden drei Kategorien einteilen:
Das obige ist der detaillierte Inhalt vonKomplexe experimentelle Designprobleme im zweiseitigen Markt von Kuaishou. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!