정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 11, 2023 pm 09:34 PM

ai모델

이 회사는 4차 산업 혁명을 촉발할 수 있는 제품을 만들었지만 왜 그들의 제품이 그렇게 인기가 있는지 의아해합니다.

그냥, 정말 베르사유는 아니네요.

최근 MIT Technology Review에서는 ChatGPT의 여러 개발자를 인터뷰하여 이 인기 있는 AI 제품 뒤에 숨겨진 이야기를 자세히 살펴보았습니다.

방어가 전혀 없을 정도로 인기가 많습니다

OpenAI가 2022년 11월 말 조용히 ChatGPT를 출시했을 때 스타트업은 큰 기대를 하지 않았습니다.

OpenAI 직원들은 자신의 모델이 최고의 모델로 성장할 것이라고는 전혀 생각하지 못했습니다.

ChatGPT가 하룻밤 사이에 인기를 끌면서 대규모 언어 모델에 대한 글로벌 골드 러시를 촉발한 것 같습니다. 그러나 OpenAI는 전혀 준비가 되어 있지 않으며 서둘러 상위 모델을 따라잡고 기회를 잡으려고 노력할 뿐입니다.

OpenAI에서 정책 작업을 하는 Sandhini Agarwal은 OpenAI 내에서 ChatGPT는 항상 "연구 미리 보기"로 간주되어 왔다고 말했습니다. 이는 2년 된 기술의 보다 완전한 버전이며 더 중요한 것은 회사는 모델의 일부 단점을 제거하기 위해 공개 피드백을 전달하려고 노력하고 있습니다.

이런 '미리보기' 제품이 우연히 데뷔 후 인기를 끌 것이라고 누가 생각이나 했을까요.

OpenAI의 과학자들은 이에 대해 매우 혼란스러워하고 있으며, 외부 세계의 꽃과 박수도 잘 알고 있습니다.

ChatGPT 개발에 참여한 OpenAI 과학자 Liam Fedus는 "우리는 이것을 엄청난 근본적인 진전이라고 과장하고 싶지 않습니다."라고 말했습니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

ChatGPT 팀원 중 5명이 2023년 AI 2000 글로벌 인공지능 학자로 선정되었습니다

이 때문에 MIT Technology Review 기자인 Will Douglas Heaven이 합작 투자 회사인 Will Douglas Heaven과 인터뷰했습니다. OpenAI 창립자 John Schulman, 개발자 Agarwal 및 Fedus, 정렬 팀 Jan Leike 리더.

ChatGPT가 왜 그렇게 인기가 있는지조차 이해가 되지 않습니다

창립자 John Schulman은 ChatGPT가 출시된 지 며칠 후 가끔씩 Twitter를 확인한다고 말했습니다. Twitter 피드가 ChatGPT의 스크린샷으로 가득 차던 시절이 있었습니다.

이 제품이 사용자에게 매우 직관적인 제품이라고 생각했고, 팬도 있을 것이라고 생각했지만, 이 정도로 주류가 될 것이라고는 예상하지 못했습니다.

Jan Leike는 모든 것이 너무 갑작스러워서 모두가 놀랐으며 ChatGPT의 인기를 따라잡기 위해 열심히 노력했다고 말했습니다. 폭발적인 인기를 끌었던 비하인드 스토리가 궁금했다. 결국 OpenAI 자체는 ChatGPT가 왜 그렇게 인기가 있는지 파악하지 못합니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

Liam Fedus는 왜 그렇게 놀랐는지 설명했습니다. 왜냐하면 ChatGPT는 최초의 범용 챗봇이 아니며 많은 사람들이 이전에 시도해 본 적이 있기 때문에 Liam Fedus는 가능성이 크지 않다고 느낍니다. 그러나 비공개 베타 버전은 그에게 자신감을 주기도 했습니다. 아마도 이 A는 사용자가 정말 좋아할 것입니다.

Sandhini Agarwal은 ChatGPT의 즉각적인 성공이 모두에게 놀라운 일이라고 결론지었습니다. 이 모델에 대해 너무 많은 작업이 수행되었기 때문에 회사 외부의 일반 대중에게 이 모델이 얼마나 놀라운지 잊어버렸습니다.

실제로 ChatGPT에 포함된 대부분의 기술은 새로운 것이 아닙니다. OpenAI가 ChatGPT보다 몇 달 전에 출시한 GPT-3.5의 미세 조정 버전입니다. GPT-3.5 자체는 2020년에 등장한 GPT-3의 업데이트 버전입니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

ChatGPT 팀의 이전 7개 기술 R&D에 참여한 인원 수

OpenAI는 웹사이트에서 이러한 모델을 애플리케이션 프로그래밍 인터페이스 또는 API 형식으로 제공하며, 다른 개발자는 자신의 코드에 모델을 쉽게 삽입할 수 있습니다.

2022년 1월 OpenAI는 GPT-3.5의 이전 미세 조정 버전인 InstructGPT도 출시했습니다. 그러나 이러한 기술은 대중에게 홍보되지 않습니다.

미세 조정 프로세스

Liam Fedus의 소개에 따르면 ChatGPT 모델은 InstructGPT와 동일한 언어 모델에서 미세 조정되었으며 사용된 미세 조정 방법도 유사합니다. 연구원들은 일부 대화 데이터를 추가하고 훈련 과정을 일부 조정했습니다. 그래서 그들은 그것을 엄청난 근본적인 진보라고 과장하고 싶지 않습니다.

ChatGPT에서 큰 역할을 하는 것은 바로 대화 데이터인 것으로 밝혀졌습니다.

표준 벤치마크 평가에 따르면 실제로 두 모델 간의 원시 기술 성능에는 큰 차이가 없습니다. ChatGPT의 가장 큰 차이점은 구하고 사용하기가 더 쉽다는 것입니다.

Jan Leike는 어떤 의미에서 ChatGPT는 OpenAI가 한동안 갖고 있던 AI 시스템의 버전으로 이해될 수 있다고 설명했습니다. ChatGPT는 더 이상 기능이 없습니다. ChatGPT가 출시되기 전 거의 1년 동안 동일한 기본 모델이 API에서 사용되었습니다.

연구자들의 개선 사항은 어떤 의미에서는 인간이 사용하려는 목적에 더 부합하도록 요약할 수 있습니다. 대화를 통해 사용자와 대화하는 채팅 인터페이스이며 쉽게 액세스할 수 있습니다. 이를 통해 의도를 더 쉽게 추론할 수 있으며 사용자는 원하는 것을 달성하기 위해 앞뒤로 실험할 수 있습니다.

비결은 RLHF(Reinforcement Learning with Human Feedback) 기술입니다. 이는 InstructGPT의 훈련 방법과 매우 유사합니다. 즉, 인간 사용자가 실제로 좋아하는 것을 가르치는 것입니다.

Jan Leike는 많은 사람들에게 ChatGPT의 프롬프트와 응답을 읽은 다음 두 응답 중 하나를 선택하여 모두가 더 좋다고 생각하는 응답을 확인하도록 요청했다고 말했습니다. 그런 다음 이 모든 데이터가 하나의 훈련 세션으로 결합됩니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

대부분 InstructGPT에서 수행하는 작업과 동일합니다. 도움이 되기를 바라는 것처럼, 그것이 사실이기를 바라며, 그것이 사악하지 않기를 바랍니다.

몇 가지 세부 사항도 있습니다. 예를 들어 사용자의 쿼리가 명확하지 않은 경우 후속 질문을 통해 이를 개선해야 합니다. 또한 그것이 인공 지능 시스템이며, 갖고 있지 않은 정체성을 가정하거나 소유하지 않은 기능을 가지고 있다고 주장해서는 안 된다는 점을 명확히 해야 합니다. 사용자가 해서는 안 되는 작업을 수행하도록 요청하면 명시적으로 거부해야 합니다.

즉, 인간 평가자가 모델의 순위를 매기기 위해 가져야 하는 다양한 기준 목록(예: 진위성)이 있습니다. 그러나 그들은 또한 AI가 인간인 척하지 않는 것과 같은 특정 관행을 선호할 것입니다.

출시 준비

일반적으로 ChatGPT는 OpenAI가 이미 사용한 기술을 사용하기 때문에 팀에서는 이 모델을 대중에게 출시할 준비를 할 때 특별한 조치를 취하지 않았습니다. 그들의 견해로는 이전 모델에 설정된 표준은 충분했고 GPT-3.5는 충분히 안전했습니다.

ChatGPT의 인간 선호도 훈련에서 거부 행동을 스스로 학습하고 많은 요청을 거부했습니다.

OpenAI는 ChatGPT를 위해 일부 "가수"를 모았습니다. 회사의 모든 구성원이 앉아서 모델을 깨려고 했습니다. 같은 일을 하는 외부 그룹도 있습니다. 신뢰할 수 있는 초기 사용자도 피드백을 제공합니다.

Sandhini Agarwal은 원치 않는 출력이 생성되는 것을 발견했다고 말했지만 이는 GPT-3.5에서도 생성되는 것입니다. 따라서 위험만 본다면 ChatGPT는 "연구 미리보기"로 충분합니다.

John Schulman도 시스템을 출시하기 전에 시스템이 100% 완벽할 때까지 기다리는 것은 불가능하다고 말했습니다. 그들은 몇 달 동안 초기 버전을 베타 테스트해 왔으며 베타 테스터는 ChatGPT에 깊은 인상을 받았습니다.

OpenAI가 가장 걱정하는 것은 사실 사실 문제입니다. ChatGPT는 조작하는 것을 너무 좋아하기 때문입니다. 그러나 이러한 문제는 InstructGPT 및 기타 대규모 언어 모델에 존재하므로 연구원의 눈에는 ChatGPT가 사실성 및 기타 보안 문제에 대한 모델보다 우수하다면 충분합니다.

그리고 제한된 평가에 따르면 출시 전 ChatGPT가 다른 모델보다 더 현실적이고 안전하다는 것을 확인할 수 있었기 때문에 OpenAI는 출시를 계속하기로 결정했습니다.

런칭 후 피드백

ChatGPT가 출시된 후 OpenAI는 사용자가 어떻게 사용하는지 관찰해 왔습니다.

수천만 명의 사용자에게 대규모 언어 모델이 제공되는 것은 이번이 처음입니다.

사용자들도 열광하고 있으며 ChatGPT의 한계와 버그가 어디에 있는지 테스트하고 싶어합니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

ChaatGPT의 인기로 인해 편견 문제, 프롬프트를 통해 유발되는 문제 등 많은 문제가 발생했습니다.

Jan Leike는 트위터에서 입소문이 난 것 중 일부가 실제로 OpenAI에 의해 조용히 처리되었다고 말했습니다.

예를 들어 탈옥 문제는 확실히 해결해야 할 문제입니다. 사용자는 약간의 우여곡절을 통해 모델이 나쁜 말을 하게 만드는 것을 좋아합니다. 이는 OpenAI의 예상 범위 내에 있으며 또한 갈 수 있는 유일한 방법이기도 합니다.

탈옥이 발견되면 OpenAI는 이러한 조건을 교육 및 테스트 데이터에 추가하고 모든 데이터는 향후 모델에 통합됩니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

Jan Leike는 더 나은 모델이 있을 때마다 그것을 꺼내 테스트하고 싶어할 것이라고 말했습니다.

그들은 일부 표적화된 적대 훈련이 탈옥 상황을 크게 개선할 수 있다고 매우 낙관하고 있습니다. 이러한 문제가 완전히 사라질지는 확실하지 않지만, 그들은 많은 탈옥을 어렵게 만들 수 있다고 믿습니다.

시스템이 "공식적으로 데뷔"할 때 실제로 일어날 모든 일을 예측하기는 어렵습니다.

그래서 그들은 사람들이 시스템을 어떤 용도로 사용하는지 모니터링하고 무슨 일이 일어나는지 확인한 다음 이에 반응하는 데에만 집중할 수 있습니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

이제 Microsoft는 많은 사람들이 OpenAI가 공식적으로 발표하지 않은 GPT-4 버전이라고 믿고 있는 Bing Chat을 출시했습니다.

이 전제하에 산디니 아가르왈은 그들이 지금 직면하고 있는 상황은 확실히 6개월 전보다 훨씬 높지만 1년이 지난 수준보다는 여전히 낮다고 말했습니다.

이러한 모델이 사용되는 맥락은 매우 중요합니다.

구글, 마이크로소프트 같은 대기업의 경우, 한 가지 사실이 아니더라도 검색엔진 그 자체이기 때문에 큰 문제가 됩니다.

정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.

Gmail을 만든 Google의 23번째 직원인 Paul Buchheit는 Google에 대해 비관적인 태도를 가지고 있습니다.

검색 엔진을 위한 대규모 언어 모델로서 단지 재미를 위한 챗봇과는 완전히 다릅니다. OpenAI 연구원들은 또한 다양한 용도 사이를 이동하고 사용자에게 진정으로 유용한 것을 만드는 방법을 알아내기 위해 열심히 노력하고 있습니다.

John Schulman은 OpenAI가 ChatGPT에서 사람들이 정치적 문제에 관심을 갖는 정도를 과소평가했다고 인정했습니다. 이를 위해 그들은 훈련 데이터를 수집할 때 이 영역의 문제를 줄이기 위해 더 나은 결정을 내리기를 희망합니다.

Jan Leike는 자신의 관점에서 ChatGPT가 종종 실패한다고 말했습니다. 해결해야 할 문제가 너무 많지만 OpenAI는 이를 해결하지 않습니다. 그는 이를 솔직하게 인정했다.

언어 모델이 등장한지는 꽤 되었지만 아직 초기 단계입니다.

다음으로 OpenAI는 더 많은 일을 해야 합니다.

위 내용은 정말 베르사유가 아니군요! ChatGPT는 매우 성공적이어서 OpenAI도 이해하지 못합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

핫 AI 도구

뜨거운 도구

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.