ホームページ  >  記事  >  テクノロジー周辺機器  >  2,500ページに及ぶアルゴリズム文書が流出!検索史上最強のブラックボックスが暴露、Googleは再び覆してアップグレードするのか?

2,500ページに及ぶアルゴリズム文書が流出!検索史上最強のブラックボックスが暴露、Googleは再び覆してアップグレードするのか?

WBOY
WBOYオリジナル
2024-06-02 12:21:35757ブラウズ
執筆: Noah

制作 | 51CTO テクノロジースタック (WeChat ID: blog51cto)

Google は少し悪い年を迎えています。

過去 2 日間にわたり、検索エンジンの「AI 概要」機能は、非常に不正確な検索結果情報を頻繁に提供しました。たとえば、ユーザーがピザからチーズが滑り落ちるのを防ぐために接着剤を使用することを不条理に示唆していました。これに関してピチャイCEOも、これは大規模言語モデルの幻想が原因であり、現時点では解決策がないことを認めざるを得ませんでした。

最近、Google 検索エンジンの内部文書が漏洩し、Google 検索エンジンの動作メカニズムが初めて一般公開される可能性があります。この記事はここで最初に公開されました Google はまだ漏洩に対して正式な回答を出しておらず、文書の信頼性に異議を唱えていません。

今日のインターネット上で最も有名な検索エンジンである Google がウェブサイトをどのようにランク付けしているかについての詳細は長い間謎でした。この暴露は新たな視点を提供し、Google の機密性の高い検索アルゴリズム システムと、その動作メカニズムが Google のこれまでの公式声明をどのように補完するかを垣間見ることができます。

1,2500ページの文書が流出

Googleの検索アルゴリズムは、おそらくインターネット上で最も影響力のあるシステムであり、Webサイトの存続とオンラインコンテンツのプレゼンテーションを決定します。しかし、Google が Web サイトをどのようにランク付けするかという具体的な詳細は常に「ブラックボックス」でした。メディア、研究者、検索エンジン最適化に携わる人々によってさまざまな推測がなされてきましたが、これらは単に盲目な人々がその正体を理解しようとしているだけです。 。私たちは完全なパズルを見ることはありません。

さて、海外メディアThe Vergeによると、この爆発的なリークは検索機能の背後にある謎を初めて明らかにしたようで、Googleが長年にわたりその仕組みについて完全に正直ではなかったことを示唆しているとのこと。 Googleはこれまでのところ、文書の信頼性に関する複数のコメント要請に応じていない。

SEOの分野で10年以上働いているランド・フィッシュキンがこの事件の主人公です。同氏は、ある情報筋が、検索アルゴリズムの仕組みに関するグーグル社外の「嘘」を暴露することを期待して、2,500ページの文書を彼と共有したことを明らかにした。

Fishkin 氏によると、これらの文書には Google の検索 API の概要が記載されており、従業員に提供される情報の内容が詳しく説明されています。 Fishkin が共有する詳細は複雑かつ技術的ですが、開発者や SEO 専門家にとっては一般の人よりも理解しやすいかもしれません。

リーク自体は、Google が検索ランキングに特定のデータやシグナルを使用していることを必ずしも証明するものではありません。その代わり、流出した文書は、Googleがウェブページ、サイト、検索者からどのようなデータを収集するかを概説しており、間接的にSEO専門家にGoogleの焦点に関する手がかりを提供している。

2. Google の公式声明に反する

SEO 専門家の Mike King が文書の概要で書いているように、流出した文書は、Google が収集および使用するデータの種類や、Google が次のような機密問題をターゲットにしていることなど、複数のトピックに触れています。トピックには、特定の Web サイトの権威を高める方法、Google が小規模な Web サイトをどのように扱うかなどが含まれます。

さらに懸念すべきことは、フィッシュキン氏とマイク・キング氏によると、文書内の情報の一部は Google の公式声明と矛盾しているようだということです。

「『嘘をつく』と言うのは深刻すぎるかもしれないが、この場合にはそれが最も適切な言葉だ」とマイク・キングは次のように表現した。「企業秘密を守るための Google の広報担当者の努力は理解しています。しかし、私が受け入れられないのは、疑問を見つけて提起したマーケティング、テクノロジー、ジャーナリズムの分野の人々を軽視することだということです。」 Google は、この文書に関する The Verge のコメント要請にまだ応じていない。これらには直接の反論要請も含まれている。文書の信頼性。フィッシュキン氏はザ・ヴァージへの電子メールで、グーグルは漏洩の信憑性に異議を唱えていないが、従業員からある事件に関する投稿の文言の一部を変更するよう求められたと述べた。

Google の秘密検索アルゴリズムは、Google の公開ガイドラインに従い、世界中の何百万もの企業のために SEO 戦略を実践するマーケティング担当者の業界を生み出しました。しかし、これらの広く使用されている方法により、Google の検索結果は劣化しており、スパム情報が溢れていると人々が徐々に感じるようになりました。

ウェブサイト運営者は、自分のサイトを見てもらうためにこの種のコンテンツを作成しなければならないと感じています。しかし、そのような疑念に直面すると、Google の社外広報担当者はいつもおなじみの一連のレトリックを思いつきます。つまり、我々 のガイドラインはこれを示していません。

しかし、流出した文書の一部の詳細は、検索機能がどのように機能するかについての Google の公式声明の正確性に疑問を投げかけています。

Fishkin と Mike King が挙げた一例は、Google がランキングに Chrome データを使用しているかどうかです。 Google の代表者は、Chrome データはページのランク付けに使用されていないと繰り返し述べていますが、検索でのサイトの表示方法に関するセクションでは Chrome について具体的に言及しています。

写真

2,500ページに及ぶアルゴリズム文書が流出!検索史上最強のブラックボックスが暴露、Googleは再び覆してアップグレードするのか?上のスクリーンショットでは、文書によると、メインの vogue.com URL の下に表示されるリンクは Chrome データを使用して作成された可能性があります。

もう 1 つの懸念事項は、ランキングにおいて E-A-T (専門知識、権威、信頼性) が果たす役割です。周知のとおり、E-A-T は長年にわたって Google の検索品質評価ガイドラインの基礎となってきました。

Googleの代表者は以前、E-A-Tはランキング要素ではないと述べています。フィッシュキン氏は、文書の中にはE-A-Tへの直接的な言及はあまり見つからなかったと指摘した。

また、Googleの代表者は以前、アトリビューションはランキングに影響を与えないため、Googleではなくウェブサイトの所有者が読者のために行うべきものであると主張していました。しかし、そうではないようです。

Mike King は、Google がページの著者データをどのように収集するかを詳しく説明し、エンティティが著者であるかどうかを識別するために使用されるフィールドがファイル内にあると指摘しましたが、このフィールドは主にニュース記事用に設計されていますが、その他の記事も対象としています。科学記事など。これは、アトリビューションが明示的なランキング要因であることを裏付けるものではありませんが、Google が少なくともこの属性を厳密に追跡していることを示唆しています。

3. 検索アルゴリズムの革新により、インターネットのエコシステムはそれ以来「変化」しました

これらの文書は決定的な証拠ではありませんが、詳細でフィルターのない視点を提供し、この機密性の高いブラックボックス システムを覗くことができます。 。

実際、過去 2 年間で、Google 検索は一連の大きなアップデートを経験しており、その中には前例のない破壊的なアップデートも含まれています。例えば、本稿の冒頭で述べた、多くの批判を浴びている「AIオーバービュー」機能は、最も代表的なイノベーションの1つです。

Google のリーダーであるピチャイ氏は、変更の冒頭で、将来 Google 検索は多くの質問に対して自動生成された AI の回答を提供するだろうと述べ、この製品の機能に強い自信を表明しました。

Googleの広報担当者はBBCに対し、同社は厳格なテストを行って変更がユーザーに利益をもたらすことを確認した後にのみ検索の変更を公開し、Webサイト所有者に検索ランキングに関するヘルプ、リソース、フィードバックを提供すると述べた。

しかし、現実は常に理想から乖離します。

AIの概要機能に関する「致命的な幻覚」にせよ、今回の流出疑惑文書で伝えられた「矛盾した」情報にせよ、Google検索に対する人々の疑惑と警戒を呼び起こしている。

インターネットの発展の歴史全体を振り返ってみると、Google のような企業は、この青い星に住むほとんどの人々が情報を入手する方法を変えただけでなく、コンテンツの作成と配布のパターンを再構築した企業はありません。

AI を活用した生成検索を例に挙げると、Google はこれらの技術革新を利用してユーザーと情報をより効率的に結び付け、検索エクスペリエンスの全体的な品質を向上させることを目指しているようです。

しかし、実際には、批評家が言うように、この変化は情報の均一性を悪化させ、ユーザーが直接ではなく Google から直接提供される短い回答にますます依存するようになるため、ユーザーのウェブ探索の深さと範囲を狭める可能性があります。 Webサイト。これは、独立した Web サイトやブログの認知度や収益モデルを弱めるだけでなく、オンライン エコシステムの健全性や多様性にも影響を及ぼし、ユーザーが多様な視点や詳細な分析に触れる機会を制限する可能性があります。

Google のような強力な検索プレーヤーにとって、検索アルゴリズムの最適化が公衆に役立つだけでなく、インターネットに高品質のコンテンツを提供する生態学的基盤を破壊しないことを保証する方法は、長期的な発展の鍵となる可能性があります。

参考リンク:

https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents-link-seo

https://www .php.cn/link/c30ca4400db3c72274c8ad819f688c21

AIGC の詳細については、こちらをご覧ください:

51CTO AI.x コミュニティ

https://www.51cto.com/aigc/

以上が2,500ページに及ぶアルゴリズム文書が流出!検索史上最強のブラックボックスが暴露、Googleは再び覆してアップグレードするのか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。