2500頁演算法文檔外洩！搜尋史上最強黑箱曝光，Google翻車再升級？-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

2500頁演算法文檔外洩！搜尋史上最強黑箱曝光，Google翻車再升級？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 02, 2024 pm 12:21 PM

Google演算法蒙特內哥羅

撰稿丨諾亞

出品 | 51CTO技術堆疊（微訊號：blog51cto）

#Google有點流年不利。

在過去兩天裡，搜尋引擎提供了關於「AI 摘要（AI Overviews）」功能經常提供嚴重錯誤的搜尋結果信息，例如，荒唐地建議用戶用膠水來防止披薩上的起司滑落。對此，CEO 皮查伊也不得不不承認這是大語言模型的幻覺所致，目前還沒有解決方案。

最近有Google搜尋引擎的一份內部文件洩露，可能首次向公眾展示了Google搜尋引擎的運作機制。此文首次發佈於本文，Google尚未就洩漏事件做出官方回應，也沒有對文件的真實性提出異議。

長期以來，Google作為當今網路上最著名的搜尋引擎，如何對網站進行排名的細節一直是個謎。而這次曝光事件提供了一個新視角，讓我們得以窺見谷歌高度保密的搜尋演算法系統，以及運作機制與Google先前的公開聲明裡相輔相成的地方。

1.2500頁洩漏檔案

Google的搜尋演算法或許是網路上最具影響力的系統，它決定了網站的生死存亡及網路內容的呈現形態。但谷歌究竟是如何對網站進行排名的具體細節，從來都是“黑箱”，雖然也有媒體、研究人員以及從事搜尋引擎優化工作的人士進行過種種猜測，但也只是盲人摸象。我們始終難以窺見完整的拼圖。

如今，據外媒The Verge報道，這起堪稱炸裂的洩漏事件似乎首次揭開了搜尋功能背後的神秘面紗，並暗示谷歌多年來並未完全誠實地公開其運作方式。到目前為止，谷歌尚未對有關文件真實性的多次置評請求作出回應。

從事SEO工作超過十年的Rand Fishkin是這起事件的主角。他透露，一位消息人士與他分享了長達2500頁的文件，希望藉此來揭露谷歌關於搜尋演算法運作方式所散佈的對外「謊言」。

根據Fishkin介紹，這些文件概述了Google的搜尋API，並分解了提供給員工的資訊內容。 Fishkin分享的細節繁複且技術性強，對於開發者和SEO專家來說可能比普通人更容易理解。

洩漏內容本身並不一定證明Google使用了特定資料和訊號來進行搜尋排名。相反，洩漏文件概述了谷歌從網頁、網站和搜尋者收集了哪些數據，並間接向SEO專家提供了關於谷歌關注點的線索。

2.與Google公開聲明相矛盾

正如SEO專家Mike King在其對文件概述中所寫的那樣，洩露的文件涉及多個主題，如Google收集和使用的資料類型、Google針對選舉等敏感話題如何提升某些網站的權重、Google如何處理小型網站等。

更值得關注的是，根據Fishkin和Mike King所述，文件中的某些資訊似乎與Google的公開聲明相矛盾。

「說『說謊』可能太過嚴重，但在這種情況下，這是最貼切的說法，」Mike King這樣表述：「我理解谷歌的公關人員為了保護公司秘密所做的努力，但我不能接受的是，他們會去貶低那些在行銷、科技和新聞領域內，發現並提出質疑的人。尚未就涉及這些文件的The Verge的置評請求做出回應，其中包括直接要求反駁文件的真實性。 Fishkin在給The Verge的電子郵件中表示，谷歌並未對洩露的真實性提出異議，但有一位員工要求他更改帖子中關於某個事件描述的部分措辭。

Google保密的搜尋演算法催生了一個由行銷者組成的行業，他們緊跟著Google的公開指南，為全世界數百萬公司實踐SEO策略。然而，這些廣泛應用的手段，逐漸使人們普遍感覺到：Google的搜尋結果正每況愈下，充滿了垃圾訊息。

網站經營者感覺不得不生產這類內容以使自己的網站被看到。但面對這樣的質疑，Google的對外發言人總是會搬離一套熟悉的說詞：我們的指南並非如此指示。

但洩漏文件中的某些細節讓人質疑Google關於搜尋功能運作方式的公開聲明的準確性。

Fishkin和Mike King引用的一個例子是Google是否在排名中使用Chrome資料。谷歌代表多次表示不使用Chrome數據來排名頁面，但Chrome在關於網站如何出現在搜尋中的部分被特別提及。

圖片

2500頁演算法文檔外洩！搜尋史上最強黑箱曝光，Google翻車再升級？ #在上面的截圖中，根據檔案顯示，主要vogue.com網址下方出現的連結部分可能就是利用Chrome資料創建的。

另一個引起關注的問題是E-A-T（專業知識、權威性和可信度）在排名中扮演的角色。眾所周知，多年來E-A-T一直是Google搜尋品質評估指南的基石。

Google的代表先前曾表示，E-A-T並不是排名因素。 Fishkin指出，他在文件中沒有找到太多直接提到E-A-T的內容。

還有，Google的代表以前曾堅稱，署名是網站所有者應該為讀者而不是為谷歌做的，因為它不影響排名。但似乎並非如此。

邁克金詳述了谷歌如何收集頁面的作者數據，並指出文件中存在一個用於辨識實體是否為作者的字段，該字段雖主要為新聞文章設計，但也涵蓋其他諸如科學文章的內容。儘管這並不能證實署名是明確的排名要素之一，但它確實表明Google至少在密切追蹤這一屬性。

3.搜尋演算法革新，從此網路生態「變天」

儘管這些文件並非確鑿無疑的證據，但它們提供了一個深度且未經過濾的視角，讓我們得以窺見這個高度保密的黑箱系統。

事實上，在過去的兩年裡，Google搜尋經歷了一系列重大更新，有些甚至是前所未有的顛覆式更新。例如本文開頭提到的，飽受批評的「AI概覽」功能就是很有代表性的革新之一。

變革之初，Google掌舵人皮查伊表示，未來Google搜尋將為你的許多問題提供自己生成的AI答案，並對這一產品功能表達了強大的信心。

Google的一位發言人曾告訴BBC，公司只有在經過嚴格測試，確認變化對用戶有益後才會推出搜尋變更，並且公司為網站所有者提供了幫助、資源和就其搜尋排名回饋的機會。

但現實總是脫軌於理想。

無論是關於AI概覽功能的“致命幻覺”，還是在這份疑似洩露文件裡傳達出的“表裡不一”的信息，都在引發人們對於谷歌搜索的猜疑與警惕。

回顧整個網路發展史，沒有哪一家企業像Google一樣，不僅改變了這個藍星上大多數人獲取資訊的方式，也重塑了內容創造和分發的格局。

就用生成式AI加持搜尋舉例，Google似乎志在透過這些技術革新來更有效率地連結使用者與訊息，提升搜尋體驗的整體品質。

但事實上，正如批評者所說，這種轉變可能加劇資訊同質化，減少用戶探索網路的深度和廣度，因為他們越來越依賴谷歌直接提供的簡短答案，而不是親自訪問來源網站。這不僅可能削弱獨立網站和部落格的可見度及獲利模式，還可能影響網路生態的健康和多樣性，限制了用戶接觸多元觀點和深入分析的機會。

對強大如Google的搜尋玩家來說，如何確保搜尋演算法最佳化既能服務大眾，又不會破壞那些為網路貢獻高品質內容的生態基石，也許才是能夠長遠發展的根本所在。

參考連結：

https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents -link-seo

https://www.php.cn/link/c30ca4400db3c72274c8ad819f688c21

想了解更多AIGC的內容，請造訪：

51CTO AI.x社群

https://www.51cto.com/aigc/

以上是2500頁演算法文檔外洩！搜尋史上最強黑箱曝光，Google翻車再升級？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

AI內部部署的隱藏危險：治理差距和災難性風險Apr 28, 2025 am 11:12 AM

Apollo Research的一份新報告顯示，先進的AI系統的不受檢查的內部部署構成了重大風險。在大型人工智能公司中缺乏監督，普遍存在，允許潛在的災難性結果

構建AI測謊儀Apr 28, 2025 am 11:11 AM

傳統測謊儀已經過時了。依靠腕帶連接的指針，打印出受試者生命體徵和身體反應的測謊儀，在識破謊言方面並不精確。這就是為什麼測謊結果通常不被法庭採納的原因，儘管它曾導致許多無辜者入獄。相比之下，人工智能是一個強大的數據引擎，其工作原理是全方位觀察。這意味著科學家可以通過多種途徑將人工智能應用於尋求真相的應用中。一種方法是像測謊儀一樣分析被審問者的生命體徵反應，但採用更詳細、更精確的比較分析。另一種方法是利用語言標記來分析人們實際所說的話，並運用邏輯和推理。俗話說，一個謊言會滋生另一個謊言，最終

AI是否已清除航空航天行業的起飛？Apr 28, 2025 am 11:10 AM

航空航天業是創新的先驅，它利用AI應對其最複雜的挑戰。現代航空的越來越複雜性需要AI的自動化和實時智能功能，以提高安全性，降低操作

觀看北京的春季機器人比賽Apr 28, 2025 am 11:09 AM

機器人技術的飛速發展為我們帶來了一個引人入勝的案例研究。來自Noetix的N2機器人重達40多磅，身高3英尺，據說可以後空翻。 Unitree公司推出的G1機器人重量約為N2的兩倍，身高約4英尺。比賽中還有許多體型更小的類人機器人參賽，甚至還有一款由風扇驅動前進的機器人。數據解讀這場半程馬拉松吸引了超過12,000名觀眾，但只有21台類人機器人參賽。儘管政府指出參賽機器人賽前進行了“強化訓練”，但並非所有機器人均完成了全程比賽。冠軍——由北京類人機器人創新中心研發的Tiangong Ult

鏡子陷阱：人工智能倫理和人類想像力的崩潰Apr 28, 2025 am 11:08 AM

人工智能以目前的形式並不是真正智能的。它擅長模仿和完善現有數據。我們不是在創造人工智能，而是人工推斷 - 處理信息的機器，而人類則

新的Google洩漏揭示了方便的Google照片功能更新Apr 28, 2025 am 11:07 AM

一份報告發現，在谷歌相冊Android版7.26版本的代碼中隱藏了一個更新的界面，每次查看照片時，都會在屏幕底部顯示一行新檢測到的面孔縮略圖。新的面部縮略圖缺少姓名標籤，所以我懷疑您需要單獨點擊它們才能查看有關每個檢測到的人員的更多信息。就目前而言，此功能除了谷歌相冊已在您的圖像中找到這些人之外，不提供任何其他信息。此功能尚未上線，因此我們不知道谷歌將如何準確地使用它。谷歌可以使用縮略圖來加快查找所選人員的更多照片的速度，或者可能用於其他目的，例如選擇要編輯的個人。我們拭目以待。就目前而言