首頁  >  文章  >  科技週邊  >  2500頁演算法文檔外洩!搜尋史上最強黑箱曝光,Google翻車再升級?

2500頁演算法文檔外洩!搜尋史上最強黑箱曝光,Google翻車再升級?

WBOY
WBOY原創
2024-06-02 12:21:35757瀏覽
撰稿丨諾亞   

出品 | 51CTO技術堆疊(微訊號:blog51cto)

#Google有點流年不利。

在過去兩天裡,搜尋引擎提供了關於「AI 摘要(AI Overviews)」功能經常提供嚴重錯誤的搜尋結果信息,例如,荒唐地建議用戶用膠水來防止披薩上的起司滑落。對此,CEO 皮查伊也不得不不承認這是大語言模型的幻覺所致,目前還沒有解決方案。

最近有Google搜尋引擎的一份內部文件洩露,可能首次向公眾展示了Google搜尋引擎的運作機制。此文首次發佈於本文,Google尚未就洩漏事件做出官方回應,也沒有對文件的真實性提出異議。

長期以來,Google作為當今網路上最著名的搜尋引擎,如何對網站進行排名的細節一直是個謎。而這次曝光事件提供了一個新視角,讓我們得以窺見谷歌高度保密的搜尋演算法系統,以及運作機制與Google先前的公開聲明裡相輔相成的地方。

1.2500頁洩漏檔案

Google的搜尋演算法或許是網路上最具影響力的系統,它決定了網站的生死存亡及網路內容的呈現形態。但谷歌究竟是如何對網站進行排名的具體細節,從來都是“黑箱”,雖然也有媒體、研究人員以及從事搜尋引擎優化工作的人士進行過種種猜測,但也只是盲人摸象。我們始終難以窺見完整的拼圖。

如今,據外媒The Verge報道,這起堪稱炸裂的洩漏事件似乎首次揭開了搜尋功能背後的神秘面紗,並暗示谷歌多年來並未完全誠實地公開其運作方式。到目前為止,谷歌尚未對有關文件真實性的多次置評請求作出回應。

從事SEO工作超過十年的Rand Fishkin是這起事件的主角。他透露,一位消息人士與他分享了長達2500頁的文件,希望藉此來揭露谷歌關於搜尋演算法運作方式所散佈的對外「謊言」。

根據Fishkin介紹,這些文件概述了Google的搜尋API,並分解了提供給員工的資訊內容。 Fishkin分享的細節繁複且技術性強,對於開發者和SEO專家來說可能比普通人更容易理解。

洩漏內容本身並不一定證明Google使用了特定資料和訊號來進行搜尋排名。相反,洩漏文件概述了谷歌從網頁、網站和搜尋者收集了哪些數據,並間接向SEO專家提供了關於谷歌關注點的線索。

2.與Google公開聲明相矛盾

正如SEO專家Mike King在其對文件概述中所寫的那樣,洩露的文件涉及多個主題,如Google收集和使用的資料類型、Google針對選舉等敏感話題如何提升某些網站的權重、Google如何處理小型網站等。

更值得關注的是,根據Fishkin和Mike King所述,文件中的某些資訊似乎與Google的公開聲明相矛盾。

「說『說謊』可能太過嚴重,但在這種情況下,這是最貼切的說法,」Mike King這樣表述:「我理解谷歌的公關人員為了保護公司秘密所做的努力,但我不能接受的是,他們會去貶低那些在行銷、科技和新聞領域內,發現並提出質疑的人。尚未就涉及這些文件的The Verge的置評請求做出回應,其中包括直接要求反駁文件的真實性。 Fishkin在給The Verge的電子郵件中表示,谷歌並未對洩露的真實性提出異議,但有一位員工要求他更改帖子中關於某個事件描述的部分措辭。

Google保密的搜尋演算法催生了一個由行銷者組成的行業,他們緊跟著Google的公開指南,為全世界數百萬公司實踐SEO策略。然而,這些廣泛應用的手段,逐漸使人們普遍感覺到:Google的搜尋結果正每況愈下,充滿了垃圾訊息。

網站經營者感覺不得不生產這類內容以使自己的網站被看到。但面對這樣的質疑,Google的對外發言人總是會搬離一套熟悉的說詞:我們的指南並非如此指示。

但洩漏文件中的某些細節讓人質疑Google關於搜尋功能運作方式的公開聲明的準確性。

Fishkin和Mike King引用的一個例子是Google是否在排名中使用Chrome資料。谷歌代表多次表示不使用Chrome數據來排名頁面,但Chrome在關於網站如何出現在搜尋中的部分被特別提及。

圖片

2500頁演算法文檔外洩!搜尋史上最強黑箱曝光,Google翻車再升級?#在上面的截圖中,根據檔案顯示,主要vogue.com網址下方出現的連結部分可能就是利用Chrome資料創建的。

#

另一個引起關注的問題是E-A-T(專業知識、權威性和可信度)在排名中扮演的角色。眾所周知,多年來E-A-T一直是Google搜尋品質評估指南的基石。

Google的代表先前曾表示,E-A-T並不是排名因素。 Fishkin指出,他在文件中沒有找到太多直接提到E-A-T的內容。

還有,Google的代表以前曾堅稱,署名是網站所有者應該為讀者而不是為谷歌做的,因為它不影響排名。但似乎並非如此。

邁克金詳述了谷歌如何收集頁面的作者數據,並指出文件中存在一個用於辨識實體是否為作者的字段,該字段雖主要為新聞文章設計,但也涵蓋其他諸如科學文章的內容。儘管這並不能證實署名是明確的排名要素之一,但它確實表明Google至少在密切追蹤這一屬性。

3.搜尋演算法革新,從此網路生態「變天」 

儘管這些文件並非確鑿無疑的證據,但它們提供了一個深度且未經過濾的視角,讓我們得以窺見這個高度保密的黑箱系統。

事實上,在過去的兩年裡,Google搜尋經歷了一系列重大更新,有些甚至是前所未有的顛覆式更新。例如本文開頭提到的,飽受批評的「AI概覽」功能就是很有代表性的革新之一。

變革之初,Google掌舵人皮查伊表示,未來Google搜尋將為你的許多問題提供自己生成的AI答案,並對這一產品功能表達了強大的信心。

Google的一位發言人曾告訴BBC,公司只有在經過嚴格測試,確認變化對用戶有益後才會推出搜尋變更,並且公司為網站所有者提供了幫助、資源和就其搜尋排名回饋的機會。

但現實總是脫軌於理想。

無論是關於AI概覽功能的“致命幻覺”,還是在這份疑似洩露文件裡傳達出的“表裡不一”的信息,都在引發人們對於谷歌搜索的猜疑與警惕。

回顧整個網路發展史,沒有哪一家企業像Google一樣,不僅改變了這個藍星上大多數人獲取資訊的方式,也重塑了內容創造和分發的格局。

就用生成式AI加持搜尋舉例,Google似乎志在透過這些技術革新來更有效率地連結使用者與訊息,提升搜尋體驗的整體品質。

但事實上,正如批評者所說,這種轉變可能加劇資訊同質化,減少用戶探索網路的深度和廣度,因為他們越來越依賴谷歌直接提供的簡短答案,而不是親自訪問來源網站。這不僅可能削弱獨立網站和部落格的可見度及獲利模式,還可能影響網路生態的健康和多樣性,限制了用戶接觸多元觀點和深入分析的機會。

對強大如Google的搜尋玩家來說,如何確保搜尋演算法最佳化既能服務大眾,又不會破壞那些為網路貢獻高品質內容的生態基石,也許才是能夠長遠發展的根本所在。

參考連結:

https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents -link-seo

https://www.php.cn/link/c30ca4400db3c72274c8ad819f688c21

想了解更多AIGC的內容,請造訪:

51CTO AI.x社群

https://www.51cto.com/aigc/

以上是2500頁演算法文檔外洩!搜尋史上最強黑箱曝光,Google翻車再升級?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn