이 사이트는 11월 10일에 OpenAI가 AI 모델 교육을 위한 공공/민간 데이터 세트를 생성하기 위해 조직과 협력할 것이라고 발표했다고 보도했습니다. 데이터 파트너십은 "더 많은 조직이 AI의 미래를 이끌 수 있도록 지원"하는 것을 목표로 합니다. 그리고 “더 유용한 모델의 혜택을 누리세요”.
이 사이트는 OpenAI가 다음과 같이 말한 블로그에서 배웠습니다. “궁극적으로 AI를 더욱 안전하게 만들고 모든 인류에게 혜택을 주기 위해 우리는 AI 모델이 모든 주제, 산업, 문화 및 언어를 깊이 이해할 수 있기를 바랍니다. 이를 위해서는 가능한 가장 광범위한 훈련 데이터 수집이 필요합니다. ."
데이터 파트너십 프로그램의 일환으로 OpenAI는 "인간 사회를 반영"하고 현재 온라인에서 쉽게 접근할 수 없는 "대규모" 데이터세트를 수집할 것이라고 밝혔습니다. 회사는 이미지, 오디오, 비디오를 포함한 다양한 양식에 걸쳐 작업할 계획이지만 특히 다양한 언어, 주제 및 형식에 걸쳐 "인간의 의도를 표현"(예: 장문의 글쓰기 또는 대화)하는 데이터 를 찾고 있습니다.
OpenAI는 광학 문자 인식과 자동 음성 인식 도구를 함께 사용하여 조직과 협력하여 교육 데이터를 디지털화하고 필요한 경우 민감한 정보 또는 개인 정보를 제거할 것이라고 밝혔습니다.
OpenAI는 두 가지 유형의 데이터 세트, 즉 AI 모델 교육에 누구나 사용할 수 있는 공개 오픈 소스 데이터 세트와 독점 AI 모델 교육에 사용할 수 있는 비공개 데이터 세트 를 생성하기를 희망합니다.
OpenAI는 개인 세트가 데이터를 비공개로 유지하고 싶지만 OpenAI의 모델이 자신의 도메인을 더 잘 이해하기를 원하는 조직을 위한 것이라고 말합니다. 지금까지 OpenAI는 아이슬란드 정부 및 Miðeind ehf와 협력하여 아이슬란드 사용자용 GPT-4 기능을 개선했습니다. 법률 문서에 대한 모델의 이해를 향상시키기 위해 Liberty Legal Project와 협력하고 있습니다.
위 내용은 OpenAI는 AI 모델 훈련을 위한 데이터 세트를 생성할 파트너를 찾고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!