보고서에 따르면 OpenAI는 최근 웹 크롤러가 데이터 개인 정보 보호 및 저작권과 같은 문제를 처리하기 위해 GPT 모델을 교육하기 위해 웹 크롤러가 웹 사이트에서 데이터를 긁어내는 것을 방지할 수 있는 새로운 기능을 출시했습니다.
GPTBot는 OpenAI에서 개발한 웹 크롤러 프로그램으로, 인터넷에서 자동으로 정보를 검색 및 추출하고 GPT 모델 훈련에 사용할 웹 콘텐츠를 저장할 수 있습니다.
OpenAI 블로그 게시물에 따르면 웹사이트 관리자는 웹사이트의 Robots.txt 파일에서 GPTBot 액세스를 비활성화하거나 IP 주소를 차단하여 GPTBot이 웹사이트에서 데이터를 스크랩하는 것을 방지할 수 있습니다. OpenAI는 또한 GPTBot 사용자 에이전트를 사용하여 스크랩한 웹 페이지가 향후 모델을 개선하는 동시에 개인 식별 정보(PII)를 수집하거나 OpenAI 정책을 위반하는 것으로 알려진 액세스 비용을 지불하는 텍스트 소스를 필터링하는 데 사용될 수 있다고 지적합니다. 제외 기준을 충족하는 소스의 경우 GPTBot이 웹 사이트에 액세스하도록 허용하면 AI 모델의 정확성, 일반 기능 및 보안을 향상하는 데 도움이 됩니다
위 내용은 OpenAI는 데이터가 AI 모델 훈련에 사용되지 않도록 보호하기 위해 웹 크롤러 액세스를 제한합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!