首頁  >  文章  >  科技週邊  >  OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

WBOY
WBOY轉載
2023-08-15 12:41:05777瀏覽

據報道,OpenAI最近推出了一個新功能,允許網站阻止其網路爬蟲從其網站上抓取資料以訓練GPT模型,以應對資料隱私和版權等問題

GPTBot是OpenAI開發的網路爬蟲程序,它能夠自動搜尋和提取網路上的信息,並將網頁內容保存下來,以供訓練GPT模型使用

OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

根據OpenAI的部落格文章,網站管理員可以透過在其網站的Robots.txt檔案中禁止GPTBot訪問,或透過封鎖其IP位址來阻止GPTBot從網站上抓取資料。 OpenAI也指出,使用GPTBot使用者代理程式抓取的網頁可能會被用於改進未來的模型,同時會過濾掉付費存取、已知收集個人識別資訊(PII),或違反OpenAI政策的文字來源。對於符合排除標準的來源,允許GPTBot存取網站將有助於提高AI模型的準確性、通用能力和安全性

以上是OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:sohu.com。如有侵權,請聯絡admin@php.cn刪除