Rumah  >  Artikel  >  Peranti teknologi  >  Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

PHPz
PHPzasal
2024-06-11 09:14:23935semak imbas

Baru-baru ini, 2,500 halaman dokumen dalaman Google telah dibocorkan, mendedahkan cara carian, "penimbang tara Internet yang paling berkuasa," beroperasi.

Pengasas bersama dan Ketua Pegawai Eksekutif SparkToro ialah orang tanpa nama Dia menerbitkan catatan blog di tapak web peribadinya, mendakwa bahawa "orang tanpa nama berkongsi dengan saya beribu-ribu halaman dokumentasi API Carian Google yang bocor, dan semua orang dalam SEO. Semua orang mesti melihatnya!"

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Selama bertahun-tahun, Rand Fishkin telah menjadi jurucakap teratas dalam bidang SEO (Pengoptimuman Enjin Carian, pengoptimuman enjin carian). Konsep "Pihak Berkuasa Laman Web" (Penilaian Domain) adalah Cadangan beliau.

Memandangkan dia sangat dihormati dalam bidang ini, Rand Fishkin secara semula jadi terpaksa memeriksa orang yang tidak dikenali ini dengan teliti sebelum mengumumkan berita itu.

Jumaat lalu, selepas menghantar beberapa e-mel, Rand Fishkin telah membuat panggilan video dengan lelaki misteri itu, pihak yang satu lagi tidak menunjukkan wajahnya.

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Panggilan ini membenarkan Rand mengetahui lebih lanjut tentang dokumen yang bocor: ia ialah dokumen API lebih daripada 2,500 halaman, mengandungi 14,014 sifat. Sifat ini serupa dengan bahagian dalaman Google "Gudang API Kandungan".

Menurut sejarah komit dokumen, kod tersebut telah dimuat naik ke GitHub pada 27 Mac 2024 dan tidak dipadamkan sehingga 7 Mei 2024.

Selepas panggilan itu, Rand mengesahkan sejarah kerja dan kenalan bersama orang tanpa nama itu dalam dunia pemasaran. Dia memutuskan untuk memenuhi jangkaan Anonymous dengan menerbitkan artikel untuk berkongsi kebocoran itu dan menyangkal "beberapa pembohongan yang telah disebarkan oleh pekerja Google selama bertahun-tahun."

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Matt Cutts, Gary Ilyes dan John Mueller menafikan bahawa Google telah menggunakan data pengguna berasaskan klik untuk kedudukan selama bertahun-tahun

Artikel Rand bercakap tentang kotak pasir, kadar klik lalu, dsb. yang menjejaskan faktor SEO, yang telah dinafikan sekeras-kerasnya oleh Google sebelum ini. .

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Seorang lagi pakar SEO Mike King turut menerbitkan artikel yang mendedahkan "rahsia algoritma Google." Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Mike King berkata, "Dokumen yang bocor melibatkan data yang dikumpulkan dan digunakan oleh Google, tapak web yang mana Google mempromosikan topik sensitif seperti pilihan raya, cara Google mengendalikan tapak web kecil dan topik lain Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

banyak maklumat menunjukkan bahawa , Google tidak melaporkan sepenuhnya dengan benar selama bertahun-tahun, "Sesetengah maklumat dalam dokumen nampaknya bercanggah dengan kenyataan awam oleh wakil Google

Menghadapi keraguan semua orang, Google memilih untuk berdiam diri dan enggan mengulas." kebocoran bahan letupan ini.

Pemilik sebenar tidak bersuara sebaliknya, seorang misteri yang sebelum ini memberikan maklumat tanpa nama muncul. Pada 28 Mei, lelaki misteri itu akhirnya membuat keputusan untuk tampil ke hadapan dan mengeluarkan video di mana dia mendedahkan identitinya.

Nama beliau Erfan Azimi, beliau juga seorang pengamal SEO dan pengasas EA Eagle Digital.

Jadi, memandangkan dokumen yang disediakan oleh Erfan Azimi berasal daripada "Gudang API Kandungan" dalaman Google, kita perlu memahami apa itu Gudang Kandungan API Google, dan apakah sebenarnya dokumen ini bocor? . telah secara tidak sengaja didedahkan secara ringkas kerana banyak pautan dalam dokumen membawa kepada repositori GitHub peribadi, serta halaman dalaman di tapak web korporat Google yang memerlukan log masuk pengesahan khusus.

Semasa tempoh awam yang mungkin tidak disengajakan dari Mac hingga Mei 2024, dokumentasi API telah disebarkan ke Hexdocs (repositori GitHub awam yang diindeks), tempat ia ditemui dan disebarkan oleh orang lain.

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian TerbongkarApa yang membingungkan Rand ialah dia yakin bahawa orang lain juga mempunyai salinan, tetapi sehingga pendedahan ini, dokumen ini belum dibincangkan secara terbuka.

Menurut bekas pembangun Google, hampir setiap pasukan Google mempunyai dokumen sedemikian untuk menerangkan pelbagai sifat dan modul API untuk membantu kakitangan projek membiasakan diri dengan elemen data yang tersedia.

Maklumat yang bocor ini sepadan dengan maklumat lain dalam repositori awam GitHub dan dokumentasi API Awan Google, menggunakan gaya notasi, format dan juga nama proses/modul/fungsi dan rujukan.

"API Content Warehouse" kedengaran seperti istilah teknikal, tetapi kita boleh menganggapnya sebagai panduan untuk ahli pasukan enjin carian Google.

Ia seperti katalog buku di perpustakaan, Google menggunakannya untuk memberitahu pekerja tentang buku yang tersedia dan cara mendapatkannya.

Tetapi perbezaannya ialah perpustakaan adalah awam, manakala Carian Google ialah salah satu kotak hitam yang paling misteri dan dikawal ketat di dunia. Dalam lebih daripada dua dekad, tidak pernah ada kebocoran magnitud atau butiran ini daripada bahagian carian Google.

Apakah yang "bocor"? 1. Penggunaan data klik pengguna Ini semua berkaitan dengan Navboost dan Glue, dan mereka yang telah membaca keterangan Jabatan Kehakiman Google mungkin biasa dengan dua istilah ini.

Berikut adalah petikan yang relevan daripada pemeriksaan balas peguam Jabatan Kehakiman Kenneth Dintzer terhadap Pandu Nayak, naib presiden carian untuk Pasukan Kualiti Carian:

S. Jadi sekadar mengingatkan saya, adakah Navboost kembali ke 2005?

A Dalam julat ini, mungkin lebih awal.

S. Ia telah dikemas kini, adakah ia bukan lagi Navboost seperti dahulu?

A takde lagi

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Q.

A gam hanyalah nama lain untuk Navboost, termasuk semua ciri lain pada halaman.

Q. Saya akan bercakap mengenainya kemudian, tetapi kita boleh bercakap mengenainya sekarang. Seperti yang kita bincangkan, Navboost boleh menjana hasil web, bukan?

A.

Q Gam juga boleh mengendalikan semua kandungan di halaman yang bukan hasil web, bukan?

A betul.

S. Bersama-sama mereka membantu mencari dan menilai kandungan yang akhirnya muncul di halaman hasil carian kami?

A betul. Mereka semua isyarat itu, ya.

Dokumen API yang bocor ini menyokong keterangan Encik Nayak dan konsisten dengan paten kualiti tapak web Google.

Nampaknya Google mempunyai cara untuk menapis klik yang mereka tidak mahu dikira ke dalam sistem ranking dan memasukkan klik yang mereka mahu dikira ke dalam sistem ranking.

Mereka juga kelihatan seperti mengukur pogo-sticking (apabila pencari mengklik pada hasil dan kemudian dengan cepat mengklik butang belakang kerana tidak berpuas hati dengan jawapan yang mereka temui) dan tera. .

Sumber tanpa nama yang membocorkan dokumen itu berkata seawal tahun 2005, Google mahu mendapatkan aliran klik lengkap berbilion pengguna Internet, dan melalui penyemak imbas Chrome, mereka telah mencapai apa yang mereka inginkan.

Dokumentasi API menunjukkan bahawa Google boleh menggunakan Chrome untuk mengira beberapa kategori metrik yang berkaitan dengan halaman individu dan keseluruhan domain.

Dokumen ini memperkenalkan cara Google mencipta fungsi berkaitan Pautan Tapak, yang sangat menarik.

Ia menunjukkan panggilan yang dipanggil topUrl, iaitu, "Senarai url teratas dengan skor_dua_peringkat tertinggi, iaitu, chrome_trans_clicks."

Ia boleh disimpulkan bahawa Google berkemungkinan menggunakan halaman web dalam penyemak imbas Chrome bilangan klik, dan gunakan ini untuk menentukan URL yang paling popular atau penting di tapak web, dan kemudian mengira URL yang harus disertakan dalam ciri Pautan Tapak.

Dalam hasil carian Google, ia sentiasa memaparkan halaman yang paling kerap dilawati pengguna, yang ia lakukan dengan menjejak aliran klik berbilion pengguna Chrome.

Sudah tentu netizen tidak berpuas hati dengan perangai Google ini.

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

3. Buat senarai putih untuk topik yang serius

Tidak sukar bagi kami untuk membuat inferens sedemikian melalui modul "Tapak Web Perjalanan Berkualiti" - Google mempunyai senarai putih dalam bidang perjalanan, walaupun ia masih belum jelas. Sama ada ia khusus untuk pilihan carian "perjalanan" Google atau carian web yang lebih luas.

Selain itu, beberapa sebutan "isCovidLocalAuthority" (pihak berkuasa tempatan mahkota baharu) dan "isElectionAuthority" (pihak berkuasa pilihan raya) dalam dokumen itu menunjukkan lagi bahawa Google sedang menyenarai putih nama domain tertentu dan nama domain ini mungkin muncul dalam carian pengguna keputusan isu kontroversi dipaparkan terlebih dahulu.

Sebagai contoh, selepas pilihan raya presiden AS 2020, calon tertentu mendakwa tanpa bukti bahawa undi telah dicuri dan menggalakkan pengikutnya menyerbu Capitol Hill.

Google hampir pasti akan menjadi salah satu tempat pertama orang mencari maklumat tentang acara ini, dan jika enjin carian mereka mengembalikan tapak propaganda yang menggambarkan bukti pilihan raya secara tidak tepat, ini boleh membawa terus kepada lebih banyak kontroversi, Keganasan, malah penghujung demokrasi Amerika.

Dari perspektif ini, senarai putih mempunyai kepentingan praktikalnya. Rand Fishkin berkata, "Kami yang mahukan pilihan raya yang bebas dan adil diteruskan harus berterima kasih kepada jurutera Google kerana menggunakan senarai putih dalam situasi ini Google telah lama mempunyai platform penarafan berkualiti yang dipanggil EWOK, dan kami kini mempunyai bukti bahawa beberapa elemen daripada penilai kualiti digunakan dalam sistem carian.

Rand Fishkin mendapati menarik bahawa markah dan data yang dijana oleh penilai kualiti EWOK boleh mengambil bahagian secara langsung dalam sistem carian Google, dan bukannya hanya menjadi set latihan untuk eksperimen.

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

Sudah tentu, ini mungkin "hanya untuk ujian", tetapi apabila menyemak imbas dokumentasi yang bocor, anda akan melihat bahawa apabila ini benar, ia dinyatakan dengan jelas dalam ulasan dan butiran modul.

"Penilaian perkaitan setiap dokumen" yang disebutkan di dalamnya berasal dari penilaian EWOK Walaupun tiada penjelasan terperinci, tidak sukar untuk membayangkan betapa pentingnya penilaian manusia terhadap laman web.

Dokumentasi juga menyebut "penilaian manusia" (seperti yang daripada EWOK), dengan menyatakan bahawa mereka "biasanya hanya diisi dalam saluran penilaian," mencadangkan bahawa mereka mungkin melatih data dalam modul ini.

Tetapi Rand Fishkin percaya bahawa ini masih peranan yang sangat penting, dan pemasar tidak boleh mengabaikan betapa pentingnya penilai kualiti terhadap persepsi dan penilaian yang baik terhadap tapak web mereka.

Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar

5 Gunakan data klik untuk menentukan berat

Google membahagikan indeks pautan kepada tiga tahap (berkualiti rendah, sederhana, tinggi) dan data klik digunakan untuk menentukan tahap mana tapak web tersebut berada.

. dan pautan melepasi Isyarat Kedudukan

Sebaik sahaja pautan menjadi pautan "dipercayai" kerana ia tergolong dalam indeks tahap yang lebih tinggi, ia boleh mengalirkan PageRank dan sauh, atau ditapis/dialih keluar oleh sistem pautan spam.

Pautan daripada indeks pautan berkualiti rendah tidak akan menjejaskan kedudukan tapak anda, ia hanya akan diabaikan.

Algoritma carian Google mungkin merupakan sistem yang paling penting di internet, yang menentukan kehidupan dan kematian tapak web yang berbeza dan perkara yang kita lihat dalam talian.

Tetapi cara kedudukan tapak web telah lama menjadi misteri, dan wartawan, penyelidik dan orang yang bekerja dalam SEO sentiasa menyusun jawapan kepada teka-teki ini.

Google tetap senyap mengenai kebocoran ini, nampaknya mengekalkan misteri itu.

Tetapi kali ini, kebocoran Google yang paling teruk pernah berlaku, ia membuka celah dan memberi orang pemahaman yang tidak pernah berlaku sebelum ini tentang cara carian berfungsi.

Atas ialah kandungan terperinci Kisah dalaman algoritma carian Google telah didedahkan, dan 2,500 halaman dokumen telah dibocorkan dengan nama sebenar! Pembohongan Kedudukan Carian Terbongkar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn