4월 19일 뉴스에 따르면 Microsoft, Google 및 OpenAI는 Reddit 포럼의 사용자 채팅 데이터를 사용하여 새로운 인공 지능 시스템을 개발해 왔습니다. 이제 Reddit은 이들 회사에 로열티를 청구할 계획입니다.
Reddit은 메이크업 팁, 비디오 게임, 자동 세차 등 다양한 주제를 토론하기 위해 매일 약 5,700만 명의 사람들이 사이트를 방문할 정도로 항상 인터넷에서 뜨거운 주제에 대한 토론의 허브였습니다.
최근 몇 년 동안 Reddit 포럼의 채팅은 Google, OpenAI, Microsoft와 같은 회사에서 인공 지능 시스템을 개발할 수 있는 무료 교육 도구가 되었습니다. 이제 업계의 많은 사람들은 이러한 인공 지능 시스템이 기술 산업의 차세대 기술이 될 것이라고 믿고 있습니다.
그래서 Reddit은 인공지능 기술을 개발하는 기업에 비용을 청구할 계획입니다. 많은 회사에서는 API(응용 프로그래밍 인터페이스)를 통해 포럼 채팅을 다운로드하고 처리합니다. 화요일에 Reddit은 API 사용에 대해 회사에 비용을 청구하기 시작할 계획이라고 말했습니다.
Reddit 창립자이자 CEO인 Steve Huffman은 인터뷰에서 다음과 같이 말했습니다. "Reddit의 데이터베이스는 실제로 가치가 있으며 우리는 세계 최대 기업에 이 가치를 무료로 제공할 필요가 없습니다."
Reddit의 움직임은 처음입니다. 소셜 네트워크는 ChatGPT와 같은 인공 지능 시스템을 개발하기 위한 공개 액세스에 대해 OpenAI 및 기타 업체에 명시적으로 비용을 청구했습니다. ChatGPT와 같은 새로운 AI 시스템은 언젠가 큰 사업이 될 수 있지만 Reddit과 같은 회사에 큰 도움이 되지는 않을 것입니다. 반대로 이러한 인공 지능 시스템은 자동으로 채팅 콘텐츠를 생성하여 Reddit의 경쟁자가 될 수도 있습니다.
Reddit은 올해 상장을 준비하고 있습니다. 이 회사는 2005년에 설립되었으며 현재 주로 플랫폼 광고와 전자상거래에 의존하여 수익을 창출하고 있습니다. Reddit은 API 인터페이스의 청구 세부 사항을 마무리하고 있으며 앞으로 몇 주 안에 가격을 발표할 것이라고 말했습니다.
요즘 새로운 인공지능 기술 개발에 있어 대규모 언어 모델이 중요한 부분이 되었고, Reddit 포럼의 사용자 채팅 콘텐츠도 귀중한 상품이 되었습니다.
Google 인공지능 챗봇 Bard의 기본 알고리즘 중 하나는 Reddit 채팅 데이터를 사용하여 학습되었습니다. 동시에 OpenAI의 ChatGPT도 대규모 언어 모델을 훈련하기 위한 정보 중 하나로 Reddit 데이터를 사용합니다.
또한 다른 회사들도 플랫폼에 저장된 채팅 콘텐츠와 사진의 가치를 깨닫기 시작했습니다. 이미지 호스팅 서비스인 Shutterstock은 간단한 텍스트 프롬프트를 기반으로 이미지를 생성할 수 있는 인공 지능 시스템인 DALL-E 개발을 도운 OpenAI에 이미지 데이터를 판매했습니다.
현재 크고 작은 수천 개의 회사와 개발자가 API를 사용하여 Twitter 플랫폼에서 수백만 건의 채팅을 추적하고 있습니다. 지난 달 개인 소셜 미디어 플랫폼인 트위터(Twitter)의 소유주인 엘론 머스크(Elon Musk)는 현재의 트위터 API 사용 방식을 바꾸고 API 사용에 수만에서 수십만 달러에 이르는 수수료를 부과한다고 밝혔습니다. 그러나 머스크는 변화의 이유로 대규모 언어 모델을 언급하지 않았습니다.
인공지능 기업이 지속적으로 모델을 개선하기 위해서는 두 가지 중요한 요소가 필요합니다. 강력한 컴퓨팅 성능과 사용 가능한 대량의 데이터입니다. 일부 대규모 인공지능 개발 회사는 일반적으로 충분한 컴퓨팅 성능을 갖추고 있지만 여전히 인터넷에서 알고리즘을 개선하는 데 필요한 데이터를 찾습니다. 여기에는 Wikipedia, 다양한 디지털 서적, 학술 기사, Reddit 포럼의 채팅과 같은 리소스가 포함됩니다.
Google, OpenAI, Microsoft와 같은 회사는 아직 Reddit의 청구 계획에 응답하지 않았습니다.
Reddit은 오랫동안 Google, Bing과 같은 검색 엔진과 상호 의존적인 관계를 유지해 왔습니다. Reddit 페이지 정보를 자동으로 가져와서 색인을 생성한 다음 검색 결과 페이지에 관련 정보를 표시합니다. 이 자동 크롤링 방법이 모든 웹사이트에서 인기가 있는 것은 아니지만 Reddit은 검색 결과에서 높은 순위를 차지할 수 있습니다.
대규모 언어 모델은 완전히 다릅니다. 새로운 인공 지능 시스템을 만들려면 최대한 많은 데이터를 얻어야 합니다.
Reddit은 포럼 데이터가 지속적으로 업데이트되기 때문에 특히 가치가 있다고 믿습니다. 이러한 종류의 신선함과 관련성은 정확히 대규모 언어 모델 알고리즘이 최상의 결과를 생성하는 데 필요한 것이라고 Huffman은 말했습니다.
"Reddit은 인터넷의 다른 어느 곳보다 채팅하기에 더 좋은 장소입니다."라고 Huffman은 말합니다. "사이트에는 개인적으로만 말하거나 전혀 말하지 않는 내용이 많이 있습니다."
Hoffman은 또한 사람들이 Reddit을 사용하는 데 도움이 되는 애플리케이션을 구축하려는 애플리케이션 개발자에게 API는 여전히 무료라고 강조했습니다. 예를 들어 개발자는 API와 같은 도구를 무료로 사용하여 사용자 댓글이 콘텐츠 게시 규칙을 준수하는지 자동으로 추적하는 로봇을 개발할 수 있습니다. 학술 연구 또는 비상업적 목적으로 Reddit 데이터를 연구하는 사람들도 계속해서 데이터에 무료로 액세스할 수 있습니다.
Reddit은 또한 더 많은 기계 학습을 포럼 운영에 통합하기를 희망합니다. 예를 들어 Reddit은 기계 학습을 사용하여 플랫폼에서 인공 지능 생성 텍스트의 사용을 식별하고 라벨을 추가하여 사용자에게 로봇에서 나온 댓글을 알릴 수 있습니다. Reddit은 또한 포럼 중재자가 포럼에서 타사 봇을 모니터링하는 데 도움이 되는 소프트웨어 도구를 개선하겠다고 약속했습니다.
그러나 AI 제작자에게 Reddit은 이제 대가를 치를 때라고 생각합니다.
“사용자에게 보상하지 않고 Reddit의 데이터를 스크랩하여 가치를 창출하는 것은 우리 자신의 문제입니다.”라고 Huffman은 말했습니다. "지금이야말로 경영을 강화할 때다."(첸첸)
위 내용은 Reddit은 사용자 채팅의 부적절한 사용을 피하기 위해 OpenAI와 같은 회사에 비용을 지불합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!