Heim  >  Artikel  >  Pagerank-Algorithmus

Pagerank-Algorithmus

(*-*)浩
(*-*)浩Original
2019-06-05 17:21:282953Durchsuche

PageRank, also Webseitenranking, auch bekannt als Seitenebene, Google-Linksranking oder Seitenranking.

Pagerank-Algorithmus

ist ein Link-Analyse-Algorithmus, der 1997 von den Google-Gründern Larry Page und Sergey Brin beim Aufbau eines frühen Suchsystem-Prototyps vorgeschlagen wurde. Seitdem Google einen beispiellosen kommerziellen Erfolg erzielt hat, hat der Algorithmus dies getan werden auch zu einem Rechenmodell, das für andere Suchmaschinen und akademische Kreise von großer Bedeutung ist. Viele wichtige Linkanalyse-Algorithmen sind vom PageRank-Algorithmus abgeleitet. PageRank ist eine von Google verwendete Methode zur Ermittlung des Niveaus/der Wichtigkeit von Webseiten. Es ist das einzige Kriterium, das von Google zur Messung der Qualität einer Website verwendet wird.

(Empfohlenes Lernen: PHP-Video-Tutorial)

Nachdem alle anderen Faktoren wie Title-Tag und Keywords-Tag kombiniert wurden, passt Google die Ergebnisse durch PageRank an, sodass Seiten mit mehr „Rang/Wichtigkeit“ erhalten einen höheren Rang in den Suchergebnissen und verbessern dadurch die Relevanz und Qualität der Suchergebnisse. Die Stufen reichen von 0 bis 10, wobei Stufe 10 die perfekte Punktzahl darstellt. Je höher der PR-Wert, desto beliebter (wichtiger) ist die Seite. Beispiel: Eine Website mit einem PR-Wert von 1 zeigt an, dass die Website nicht sehr beliebt ist, während ein PR-Wert von 7 bis 10 anzeigt, dass die Website sehr beliebt (oder äußerst wichtig) ist. Im Allgemeinen gilt ein PR-Wert von 4 als gute Website. Google setzt den PR-Wert der eigenen Seite auf 10, was zeigt, dass die Seite von Google sehr beliebt ist, man kann aber auch sagen, dass diese Seite sehr wichtig ist.

Bevor PageRank vorgeschlagen wurde, hatten einige Forscher bereits vorgeschlagen, die Anzahl der eingehenden Links zu einer Webseite zu verwenden, um Linkanalyseberechnungen durchzuführen. Bei dieser Verlinkungsmethode ist es umso wichtiger, je mehr eingehende Links eine Webseite hat Webseite ist. Viele frühe Suchmaschinen nutzten auch die Anzahl eingehender Links als Methode zur Linkanalyse, was sich ebenfalls erheblich auf die Verbesserung der Suchmaschinenleistung auswirkte. Neben der Berücksichtigung der Auswirkungen der Anzahl eingehender Links bezieht sich PageRank auch auf Webseitenqualitätsfaktoren. Die Kombination beider bietet einen besseren Bewertungsstandard für die Webseitenwichtigkeit.
Für eine Internet-Webseite A basiert die Berechnung des PageRanks der Webseite auf den folgenden zwei grundlegenden Ifs:
Menge if: Im Web-Graph-Modell, wenn ein Seitenknoten die Anzahl der eingehenden Links empfängt, auf die verwiesen wird von anderen Webseiten Je mehr, desto wichtiger ist diese Seite.
Qualität: Die Qualität der eingehenden Links, die auf Seite A verweisen, ist unterschiedlich und qualitativ hochwertige Seiten übertragen über Links viele andere Gewichtungen auf andere Seiten. Je mehr qualitativ hochwertige Seiten auf Seite A verweisen, desto wichtiger ist Seite A.
Unter Verwendung der beiden oben genannten Ifs gibt der PageRank-Algorithmus zunächst jeder Webseite den gleichen Wichtigkeitswert und aktualisiert den PageRank-Wert jedes Seitenknotens durch iterative rekursive Berechnung, bis der Wert stabil ist. Das von PageRank berechnete Ergebnis ist die Wichtigkeitsbewertung der Webseite, die nichts mit der vom Benutzer eingegebenen Suchanfrage zu tun hat, d. h. der Algorithmus ist themenunabhängig. Wenn es eine Suchmaschine gibt, deren Ähnlichkeitsberechnungsfunktion die Ähnlichkeitsfaktoren von Inhalten nicht berücksichtigt und den PageRank vollständig für das Ranking verwendet, wie wird dann die Leistung dieser Suchmaschine aussehen? Diese Suchmaschine gibt für alle unterschiedlichen Abfrageanfragen die gleichen Ergebnisse zurück, d. h. sie gibt die Seite mit dem höchsten PageRank-Wert zurück.

Prinzip des PageRank-Algorithmus

Bei der Berechnung des PageRank werden zwei Wenns voll ausgenutzt: Quantität if und Qualität if.

Der Prozess ist wie folgt:

In der Anfangsphase: Die Webseite erstellt über Linkbeziehungen ein Webdiagramm und legt für jede Seite den gleichen PageRank-Wert fest. Nach mehreren Berechnungsrunden wird der endgültige PageRank-Wert jeder Seite ermittelt. Im Verlauf jeder Berechnungsrunde wird der aktuelle PageRank-Wert der Webseite kontinuierlich aktualisiert.

Berechnungsmethode des PageRank-Scores für aktualisierte Seiten in einer Runde: Bei der Berechnung des PageRank-Scores für aktualisierte Seiten in einer Runde verteilt jede Seite ihren aktuellen PageRank-Wert gleichmäßig auf die auf dieser Seite enthaltenen ausgehenden Links dass jeder Link ein entsprechendes Gewicht erhält. Und jede Seite summiert die Gewichtungen aller eingehenden Links, die auf diese Seite verweisen, um einen neuen PageRank-Score zu erhalten. Wenn jede Seite den aktualisierten PageRank-Wert erhalten hat, ist eine Runde der PageRank-Berechnung abgeschlossen.

Grundidee:

Angenommen, dass Webseite T einen Link zu Webseite A hat, bedeutet dies, dass der Eigentümer von T denkt, dass A vorhanden ist wichtiger, also weisen Sie A einen Teil der Wichtigkeitsbewertung von T zu. Dieser Wichtigkeitswert ist: PR(T)/L(T)

wobei PR(T) der PageRank-Wert von T ist, L(T) die Anzahl der ausgehenden Links von T ist und Der PageRank-Wert von A ist die Anhäufung einer Reihe von Seitenwichtigkeits-Score-Werten ähnlich wie bei T.

Das heißt, die Anzahl der Stimmen, die eine Seite erhält, wird durch die Wichtigkeit aller Seiten bestimmt, die auf sie verweisen. Ein Hyperlink zu einer Seite entspricht einer Stimme für die Seite. Der PageRank einer Seite wird durch einen rekursiven Algorithmus ermittelt, der auf der Wichtigkeit aller Seiten basiert, die darauf verlinken (verlinkte Seiten). Eine Seite mit mehr Links hat einen höheren Rang, wohingegen eine Seite, die überhaupt keine Links hat, keinen Rang hat.

Weitere technische Artikel zum Thema PHP finden Sie in der Spalte PHP-Grafik-Tutorial, um mehr darüber zu erfahren!

Das obige ist der detaillierte Inhalt vonPagerank-Algorithmus. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:Verwendung der fscanf-FunktionNächster Artikel:Verwendung der fscanf-Funktion