ホームページ >よくある問題 >ページランクアルゴリズム

ページランクアルゴリズム

(*-*)浩
(*-*)浩オリジナル
2019-06-05 17:21:283037ブラウズ

PageRank、つまり Web ページのランキング。ページ レベル、Google 左ランキング、ページ ランキングとも呼ばれます。

ページランクアルゴリズム

は、Google 創設者のラリー ペイジとサーゲイ ブリンが 1997 年に初期の検索システム プロトタイプを構築する際に提案したリンク分析アルゴリズムです。Google が前例のない商業的成功を収めて以来、このアルゴリズムはまた、他の検索エンジンや学術界にとって大きな懸念となる計算モデルにもなります。多くの重要なリンク分析アルゴリズムは、PageRank アルゴリズムから派生しています。 PageRank は、Web ページのレベル/重要性を識別するために Google が使用する方法であり、Google がサイトの品質を測定するために使用する唯一の基準です。

(推奨学習: PHP ビデオ チュートリアル )

タイトル ロゴやキーワード ロゴなど、他のすべての要素を組み合わせた後、Google は PageRank を通じて結果を調整し、より多くのページが表示されるようにします。 「ランク/重要性」により、検索結果におけるサイトのランキングが向上し、検索結果の関連性と品質が向上します。レベルは 0 から 10 まであり、レベル 10 が満点です。 PR 値が高いほど、ページの人気が高くなります (重要度が高くなります)。たとえば、PR 値 1 のサイトはそのサイトがあまり人気がないことを示し、PR 値 7 ~ 10 はサイトが非常に人気がある (または非常に重要である) ことを示します。一般に、PR 値が 4 に達すると、良好なサイトとみなされます。 Google は自社サイトの PR 値を 10 に設定していますが、これは Google のサイトの人気が非常に高いことを示しており、非常に重要なサイトであるとも言えます。

PageRank が提案される前に、一部の研究者は、Web ページへの受信リンクの数を使用してリンク分析の計算を実行することをすでに提案していました。このリンク方法では、Web ページに受信リンクが多いほど、その重要性が高まります。ウェブページは。初期の検索エンジンの多くは、受信リンクの数をリンク分析方法として採用していましたが、これも検索エンジンのパフォーマンスの向上に大きな効果をもたらしました。 PageRank は、受信リンク数の影響を考慮するだけでなく、Web ページの品質要素も参照しており、この 2 つを組み合わせることで、Web ページの重要性をより適切に評価する基準が提供されます。
インターネット Web ページ A の場合、Web ページの PageRank の計算は、次の 2 つの基本的な if に基づいています。
Quantity if: Web グラフ モデルでは、ページ ノードがポイントされる受信リンクの数を受け取るかどうか。他の Web ページによるもの 多ければ多いほど、このページは重要になります。
品質の場合: ページ A を指す受信リンクの品質は異なり、高品質のページはリンクを通じて他のページに多くの重みを転送します。したがって、より多くの高品質のページがページ A を指しているほど、ページ A の重要性が高くなります。
上記の 2 つの if を使用して、PageRank アルゴリズムは最初に各 Web ページに同じ重要度スコアを与え、スコアが安定するまで反復再帰計算を通じて各ページ ノードの PageRank スコアを更新します。 PageRank によって計算された結果は Web ページの重要度評価であり、ユーザーが入力したクエリとは何の関係もありません。つまり、アルゴリズムはトピックに依存しません。類似度計算機能がコンテンツの類似性要素を考慮せず、完全に PageRank を使用してランキングを行う検索エンジンがあった場合、その検索エンジンのパフォーマンスはどうなるでしょうか。この検索エンジンは、さまざまなクエリ リクエストに対して同じ結果を返します。つまり、PageRank 値が最も高いページを返します。

PageRank アルゴリズムの原理

PageRank の計算では、量の if と質の if という 2 つの if が最大限に活用されます。

プロセスは次のとおりです:

初期段階: Web ページはリンク関係を通じて Web グラフを構築し、各ページに同じ PageRank 値を設定します。数回の計算の後、各ページで取得された最終的な PageRank 値が取得されます。計算が進むたびに、Web ページの現在の PageRank 値が継続的に更新されます。

1 ラウンドで更新されたページの PageRank スコアの計算方法: 1 ラウンドで更新されたページの PageRank スコアの計算では、各ページは現在の PageRank 値をこのページに含まれる発信リンクに均等に分配します。各リンクは対応する重みを取得します。そして、各ページは、このページを指すすべての受信リンクから渡された重みを合計して、新しい PageRank スコアを取得します。各ページが更新された PageRank 値を取得すると、PageRank の計算が完了します。

基本的な考え方:

Web ページ T に Web ページ A へのリンクがあると仮定すると、T の所有者は A を次のように考えていることになります。より重要なので、T の重要度スコアの一部を A に割り当てます。重要度スコア値は次のとおりです: PR(T)/L(T)

ここで、PR(T) は T の PageRank 値、L(T) は T の発信リンク数、A の PageRank 値です。は、T と同様の一連のページ重要度スコア値の累積です。

つまり、ページが取得する投票数は、そのページにリンクしているすべてのページの重要性によって決まります。ページへのハイパーリンクは、そのページに 1 票を投じることと同じです。ページの PageRank は、そのページにリンクしているすべてのページ (リンクされたページ) の重要性に基づいて、再帰的アルゴリズムを通じて取得されます。より多くのリンクがあるページはランクが高くなりますが、リンクがまったくないページにはランクがありません。

PHP 関連の技術記事の詳細については、PHP グラフィック チュートリアル 列にアクセスして学習してください。

以上がページランクアルゴリズムの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

関連記事

続きを見る