Rumah >Peranti teknologi >AI >Penerbit dalam talian bimbang bahawa carian AI Google akan membebaskan kandungan dan menjejaskan hasil trafik tapak web
Berita pada 12 Mei, waktu tempatan Rabu ini, Google mengumumkan pengenalan kecerdasan buatan generatif ke dalam enjin carian Ini mungkin salah satu perubahan terbesar dalam sejarah Enjin carian Google. Terdapat kebimbangan yang meluas di kalangan penerbit dalam talian bahawa carian baharu Google boleh memberi kesan kepada trafik ke tapak mereka.
Pada persidangan pembangun tahunan, Google mengumumkan bahawa ia akan menggunakan model kecerdasan buatan untuk menyepadukan dan meringkaskan maklumat di mana-mana di Internet Google berkata bahawa produk pengalaman carian generatif ini boleh menjadikannya lebih Baik respons datang daripada pertanyaan carian pengguna.
Google akan menunjukkan beberapa perenggan teks yang dijana AI kepada pengguna dan mengutamakan beberapa pautan yang berkaitan pada halaman hasil carian dan bukannya "sepuluh pautan biru" yang biasanya dipaparkan oleh hasil carian Google.
Carian Google berkuasa AI baharu sedang diuji dengan pengguna terpilih dan belum tersedia secara meluas. Walau bagaimanapun, ramai penerbit dalam talian mula bimbang jika ini menjadi cara lalai Google untuk memaparkan hasil carian, lebih ramai pengguna akan kekal di tapak web Google, yang mungkin membawa kurang trafik ke tapak web mereka dan menjejaskan pendapatan perniagaan dalam talian.
Kontroversi itu juga menyerlahkan ketegangan yang berpanjangan antara Google dan tapak yang diindeksnya, keadaan yang sudah pasti diburukkan lagi dengan kemunculan alat kecerdasan buatan baharu. Penerbit web telah lama bimbang bahawa Google akan mengadun semula coretan kandungan daripada tapak mereka sendiri, tetapi kini Google nampaknya menggunakan model pembelajaran mesin lanjutan untuk "melatih" kecerdasan buatan untuk menghasilkan teks yang serupa dan hasil responsif.
Rutledge Daugette, Ketua Pegawai Eksekutif TechRaptor, sebuah laman web yang memfokuskan pada berita permainan dan kandungan ulasan, berkata bahawa langkah Google tidak mengambil kira kepentingan penerbit dalam talian sama sekali, dan carian kecerdasan buatan Google Ia adalah setara dengan menciplak. kandungan laman web.
“Tumpuan mereka adalah pada carian sifar klik, menggunakan kandungan berkualiti tinggi yang telah dihabiskan oleh penerbit dan penulis dalam talian untuk mencipta tidak seperti pengguna yang mungkin mengklik pada tapak web, ini tidak menawarkan penerbit dan penulis dalam talian "Setakat ini, kecerdasan buatan telah menggunakan semula maklumat orang lain dengan pantas tanpa sebarang faedah kepada pemilik kandungan. Dalam kes Google khususnya, chatbot Bard tidak akan memberikan kandungan yang digunakan."
Luther Lowe, pengarah dasar awam Yelp, telah lama mengkritik dasar carian Google. Beliau berkata kemas kini kepada Carian Google adalah sebahagian daripada strategi selama beberapa dekad untuk memastikan pengguna berada di tapak Google lebih lama daripada mengarahkan mereka ke tapak di mana maklumat itu pada asalnya disediakan.
Lowe berkata dalam temu bual: "Keeksklusifan yang dicipta oleh pengenalan klon ChatGPT oleh Google ke dalam medan carian ialah bab terakhir pertumpahan darah untuk seluruh rangkaian." enjin carian Google Tukar laman berita Search Engine Land mendedahkan bahawa setakat ini dalam ujian, kandungan yang dijana AI telah ditunjukkan di atas hasil carian organik (pautan ke penyenaraian percuma yang relevan dan berharga untuk carian). Terdapat laporan sebelum ini bahawa Google merancang untuk mereka bentuk semula halaman hasil cariannya untuk mempromosikan kandungan yang dijana kecerdasan buatan.
Berdasarkan ujian pengalaman carian generatif, kandungan yang dijana AI akan diutamakan dalam kotak hijau di bahagian atas halaman hasil carian Google, dengan tiga kotak di sebelah kanan menunjukkan pautan tapak web yang berkaitan. Dalam contoh pertama tentang hasil carian Google, tajuk maklumat daripada tiga tapak web tidak dipaparkan sepenuhnya.
Google berkata maklumat ini tidak dikikis daripada tapak web dan hanya digunakan untuk mengesahkan pautan. Search Engine Land mengatakan pengalaman carian generatif ialah penambahbaikan dan cara "lebih sihat" untuk dipautkan berbanding dengan bot sembang Bard Google, yang jarang memaut terus ke tapak penerbit web.
Sesetengah penerbit dalam talian tertanya-tanya sama ada mereka boleh menghentikan syarikat AI seperti Google daripada mengikis kandungan di tapak mereka untuk melatih model AI. Syarikat kecerdasan buatan seperti Stable Diffusion telah menghadapi tindakan undang-undang daripada pemilik data, tetapi masih belum ada kesimpulan yang jelas tentang cara untuk menentukan tingkah laku data rangkaian merangkak kecerdasan buatan. Syarikat lain, seperti Reddit, mula mengumumkan rancangan untuk mengenakan bayaran untuk akses kepada data mereka.
IAC memiliki berbilang tapak web seperti All Recipe, People Magazine dan Daily Beast. Pengerusi syarikat itu, Barry Diller, ialah seorang tokoh terkemuka dalam industri penerbitan. "Jika semua maklumat di dunia boleh disedut ke dalam kawah ini dan dibungkus semula ke dalam ayat deklaratif dalam apa yang dipanggil fungsi sembang, anda boleh memilikinya seberapa banyak yang anda mahukan," katanya pada persidangan bulan lepas, maka akan ada bukan industri penerbitan, kerana ia adalah mustahil.”
Diller meneruskan: "Apa yang anda perlu lakukan ialah membuat industri bersetuju bahawa melainkan anda boleh menghasilkan sistem yang membenarkan penerbit dalam talian mendapatkan saluran berbayar, anda tidak boleh mencuri kandungan kami." soalan ini.
Diller berkata bahawa dia percaya bahawa penerbit dalam talian boleh menyaman syarikat kecerdasan buatan di bawah undang-undang hak cipta dan skop sekatan ke atas "penggunaan adil" perlu ditakrifkan semula. Dilaporkan pada hari Rabu bahawa sekumpulan eksekutif penerbit dalam talian yang diketuai oleh Diller berkata, "Jika perlu, kami akan mengubah undang-undang hak cipta
Cabaran utama yang dihadapi oleh penerbit dalam talian ialah bagaimana untuk menentukan kandungan di tapak mereka." kandungan sedang digunakan oleh kecerdasan buatan. Google tidak mendedahkan sumber latihan PaLM 2, model bahasa besar di sebalik pengalaman carian generatif. Doggett berkata walaupun dia telah melihat contoh kandungan daripada tapak web lain ditulis semula tanpa atribusi pada chatbot Bard, adalah sukar untuk mengetahui sama ada maklumat itu datang daripada tapak web tertentu tanpa pautan terus kepada sumber.
Google tidak mengulas. "PaLM 2 telah dilatih mengenai sejumlah besar data yang tersedia secara umum daripada internet, dan kami dengan jelas mengambil serius tentang kesihatan ekosistem web," kata Zoubin Ghahramani, naib presiden penyelidikan Google, dalam taklimat media awal minggu ini "Memastikan a ekosistem yang sihat sememangnya sebahagian daripada cara kita berfikir tentang cara kita membangunkan produk, dan pencipta adalah sebahagian daripada ekosistem yang berkembang maju ini," kata Docter pada mesyuarat itu. Langkah Google akan membolehkan rangkaian bebas kepada Penerbit berada di tempat yang sukar.
"Saya rasa amat mengecewakan industri kami apabila ramai rakan sekerja kami diberhentikan kerja dan kami perlu bimbang kerja keras kami diciplak," kata Doggett "Itu tidak betul."
Atas ialah kandungan terperinci Penerbit dalam talian bimbang bahawa carian AI Google akan membebaskan kandungan dan menjejaskan hasil trafik tapak web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!