首頁  >  文章  >  科技週邊  >  Reddit CEO:微軟等公司必須付費才能抓取數據

Reddit CEO:微軟等公司必須付費才能抓取數據

WBOY
WBOY原創
2024-08-01 15:17:23703瀏覽

本站 8 月 1 日消息,Reddit CEO 史蒂夫・霍夫曼近日表示,如果微軟等公司希望繼續抓取該網站的數據,就必須付費。在此之前,Reddit 已經與Google和 OpenAI 達成協議。

Reddit CEO:微软等公司必须付费才能抓取数据

圖源 Pexels
圖源 Pexels
霍夫曼指出,如果沒有這些協議,Reddit 無法控製或了解其數據的使用方式,這迫使他們不得不屏蔽那些不願意接受數據使用條件的公司。他特別點名了微軟、Anthropic 和 Perplexity 三家公司,稱他們拒絕談判,並稱封鎖這些公司「非常麻煩」。
近幾個月來,Reddit 一直在加強打擊爬蟲。 7 月初,Reddit 更新了 robots.txt 文件,封鎖了未經授權的網路爬蟲。隨後人們發現,Reddit 的內容只出現在Google搜尋結果中,而 Bing 等其他搜尋引擎則看不到。
霍夫曼指責微軟未經授權利用 Reddit 的資料訓練 AI,並在 Bing 搜尋結果中總結 Reddit 內容,甚至透過 Bing API 將這些資料出售給其他搜尋引擎。他也回應了微軟AI 負責人穆斯塔法・蘇萊曼先前關於網路公共資料是「免費軟體」的言論,稱微軟等公司認為網路上的所有內容都可以供他們免費使用,這是他們的真實立場。
本站注意到,針對Reddit 搜尋結果從Bing 消失一事,微軟搜尋主管喬迪・里巴斯在社群媒體上表示,Reddit 封鎖了Bing 的爬蟲,偏袒另一家搜尋引擎,影響了Bing 和基於Bing 的搜尋引擎的競爭。微軟發言人凱特琳・勞爾頓也表示,公司尊重網站不希望其內容被用於生成式 AI 模型的意願。
霍夫曼以 OpenAI 的 SearchGPT 為例,強調了付費協議的重要性。今年早些時候,Reddit 和 OpenAI 達成協議,允許 SearchGPT 顯示 Reddit 內容。 Reddit 發言人 Tim・拉特施密特表示,目前簽署的所有內容授權協議都不涉及資料獨佔使用權。
Reddit 要求付費的做法與傳統媒體出版商類似,他們也希望從允許內容用於生成式 AI 中獲得收益。霍夫曼認為,搜尋引擎的傳統價值交換已經改變,搜尋、摘要和訓練正在融合,單純依靠爬取內容換取流量的模式變得模糊。

以上是Reddit CEO:微軟等公司必須付費才能抓取數據的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn