ホームページ >テクノロジー周辺機器 >AI >OpenAI は Web クローラーのアクセスを制限し、AI モデルのトレーニングにデータが使用されないように保護します

OpenAI は Web クローラーのアクセスを制限し、AI モデルのトレーニングにデータが使用されないように保護します

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB転載
2023-08-15 12:41:05918ブラウズ

レポートによると、OpenAI は最近、データ プライバシーや著作権などの問題に対処するために GPT モデルをトレーニングするために、Web クローラーが Web サイトからデータをクロールするのを防ぐ新機能をリリースしました。

GPTBot は、OpenAI によって開発された Web クローラー プログラムです。インターネット上の情報を自動的に検索および抽出し、GPT モデルのトレーニングに使用するために Web コンテンツを保存できます。

OpenAI は Web クローラーのアクセスを制限し、AI モデルのトレーニングにデータが使用されないように保護します

OpenAI のブログ投稿によると、Web サイト管理者は、Web サイトの Robots.txt ファイルで GPTBot アクセスを無効にするか、IP アドレスをブロックすることで、GPTBot が Web サイトからデータを収集するのを防ぐことができます。 OpenAIはまた、GPTBotユーザーエージェントを使用してスクレイピングされたWebページは、将来のモデルを改善するために使用される可能性があり、その一方で、アクセスに対して料金が支払われている、個人を特定できる情報(PII)を収集することが知られている、またはOpenAIポリシーに違反していることが知られているテキストソースをフィルタリングして除外する可能性があると指摘した。除外基準を満たすソースの場合、GPTBot による Web サイトへのアクセスを許可すると、AI モデルの精度、一般的な機能、セキュリティが向上します。

以上がOpenAI は Web クローラーのアクセスを制限し、AI モデルのトレーニングにデータが使用されないように保護しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。