ホームページ >テクノロジー周辺機器 >AI >OpenAI は Web クローラーのアクセスを制限し、AI モデルのトレーニングにデータが使用されないように保護します
レポートによると、OpenAI は最近、データ プライバシーや著作権などの問題に対処するために GPT モデルをトレーニングするために、Web クローラーが Web サイトからデータをクロールするのを防ぐ新機能をリリースしました。
GPTBot は、OpenAI によって開発された Web クローラー プログラムです。インターネット上の情報を自動的に検索および抽出し、GPT モデルのトレーニングに使用するために Web コンテンツを保存できます。
OpenAI のブログ投稿によると、Web サイト管理者は、Web サイトの Robots.txt ファイルで GPTBot アクセスを無効にするか、IP アドレスをブロックすることで、GPTBot が Web サイトからデータを収集するのを防ぐことができます。 OpenAIはまた、GPTBotユーザーエージェントを使用してスクレイピングされたWebページは、将来のモデルを改善するために使用される可能性があり、その一方で、アクセスに対して料金が支払われている、個人を特定できる情報(PII)を収集することが知られている、またはOpenAIポリシーに違反していることが知られているテキストソースをフィルタリングして除外する可能性があると指摘した。除外基準を満たすソースの場合、GPTBot による Web サイトへのアクセスを許可すると、AI モデルの精度、一般的な機能、セキュリティが向上します。
以上がOpenAI は Web クローラーのアクセスを制限し、AI モデルのトレーニングにデータが使用されないように保護しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。