>기술 주변기기 >일체 포함 >OpenAI 회장: GPT-4는 완벽하지는 않지만 확실히 다릅니다

OpenAI 회장: GPT-4는 완벽하지는 않지만 확실히 다릅니다

WBOY
WBOY앞으로
2023-04-10 16:11:031504검색

OpenAI 회장: GPT-4는 완벽하지는 않지만 확실히 다릅니다

3월 16일 소식, 인공지능 연구회사 오픈AI(OpenAI)가 어제 많은 기대를 모았던 텍스트 생성 AI 모델 GPT-4를 출시했습니다. OpenAI의 공동 창립자이자 회장인 Greg Brockman은 인터뷰에서 GPT-4가 완벽하지는 않지만 확실히 다르다고 말했습니다.

GPT-4는 보다 진실된 표현을 제공하고 개발자가 스타일과 동작을 보다 쉽게 ​​제어할 수 있도록 하는 등 다양한 주요 방식으로 이전 GPT-3을 개선합니다. GPT-4는 또한 이미지를 이해하고, 사진에 주석을 추가하고, 사진에 있는 내용을 자세히 설명할 수 있다는 점에서 다중 모드입니다.

하지만 GPT-4에도 ​​심각한 결함이 있습니다. GPT-3과 마찬가지로 모델은 "환상"(즉, 모델에 의해 집계된 텍스트가 소스 텍스트와 관련이 없거나 부정확함)에 시달리고 기본적인 추론 오류를 범합니다. OpenAI는 블로그에서 "엘비스 프레슬리(Elvis Presley)"를 "배우의 아들"이라고 묘사했지만 실제로는 그의 부모 중 누구도 배우가 아니었습니다.

GPT-4와 GPT-3을 비교하라는 질문에 Brockman은 다르다는 4단어로만 대답했습니다. 그는 "GPT-4는 여전히 문제와 버그가 많지만 확실히 다르다. 하지만 미적분이나 법과 같은 과목에서는 실력이 비약하는 것을 볼 수 있다. 일부 분야에서는 매우 부진한 성적을 냈지만 지금은 일반인을 뛰어 넘는 수준에 도달했습니다.”

테스트 결과는 Brockman의 견해를 뒷받침합니다. 대학입시 미적분학 시험에서는 GPT-4가 4점(5점 만점), GPT-3이 1점, GPT-3과 GPT-4의 중간인 GPT-3.5도 4점을 받는다. . 모의고사에서는 GPT-4 점수가 상위 10%에 진입했고, GPT-3.5 점수는 하위 10% 안팎을 맴돌았다.

동시에 GPT-4에서 더욱 눈길을 끄는 것은 위에서 언급한 멀티 모드입니다. "기린에 대한 기사를 작성해 달라"는 요청과 같은 텍스트 프롬프트만 허용할 수 있는 GPT-3 및 GPT-3.5와 달리 GPT-4는 이미지에서 사람을 식별하는 등 특정 작업을 수행하기 위해 이미지와 텍스트 프롬프트를 모두 허용할 수 있습니다. 세렝게티에서 포획한 기린의 내용과 기본적인 내용 설명입니다.

이전 버전은 텍스트만 학습한 반면 GPT-4는 이미지와 텍스트 데이터에 대해 학습했기 때문입니다. OpenAI는 훈련 데이터가 "공개적으로 이용 가능한 개인 정보를 포함할 수 있는 법적으로 승인되고 공개적으로 이용 가능한 다양한 데이터 소스"에서 나온 것이라고 밝혔지만, 세부 정보를 제공하라는 요청에 브록먼은 이를 거부했습니다. 훈련 데이터는 이전에 OpenAI를 법적인 문제에 빠뜨렸습니다.

GPT-4의 이미지 이해 능력은 상당히 인상적입니다. 예를 들어 "이 이미지가 뭐가 그렇게 재밌나요?"라고 입력하면 GPT-4가 전체 이미지를 분석하여 농담의 핵심을 정확하게 해석합니다.

현재 한 파트너만 GPT-4의 이미지 분석 기능에 액세스할 수 있습니다. Be My Eyes라는 ​​시각 장애자를 위한 보조 앱은 위험과 장단점을 평가하는 과정에서 더 넓은 출시가 "느리게" 이루어질 것이라고 Brockman은 말합니다."

그는 또한 다음과 같이 말했습니다. 얼굴 인식, 인물 이미지 처리 등 해결해야 할 정책적 문제도 있다. 위험 구역이 어디인지, 빨간색 선이 어디에 있는지 알아낸 다음 시간이 지남에 따라 해결책을 찾아야 합니다. ”

OpenAI는 텍스트-이미지 변환 시스템인 Dall-E 2와 비슷한 윤리적 딜레마에 직면했습니다. 처음에 이 기능을 비활성화한 후 OpenAI는 고객이 AI 기반 이미지 생성 시스템을 사용하여 편집할 얼굴을 업로드할 수 있도록 허용했습니다. 당시 OpenAI는 보안 시스템 업그레이드를 통해 딥페이크와 포르노, 정치, 폭력적인 콘텐츠 제작 시도의 잠재적인 피해를 최소화했기 때문에 얼굴 편집 기능이 가능해졌다고 주장했습니다.

또 다른 장기적인 문제는 GPT-4의 사용을 막는 것입니다. 모델이 출시된 지 몇 시간 후, 이스라엘 사이버 보안 스타트업 Adversa AI는 OpenAI의 콘텐츠 필터를 우회하고 GPT-4가 이메일, 동성애자에 대한 공격적인 설명 및 기타 불쾌한 텍스트를 생성하도록 하는 방법을 시연하는 블로그 게시물을 게시했습니다. 언어 모델 세계의 새로운 문제 Facebook 모회사인 Meta의 챗봇 BlenderBot과 OpenAI의 ChatGPT도 부적절한 콘텐츠를 출력하고 심지어 내부 작업의 민감한 세부 사항을 공개하려는 유혹을 받았지만 언론인을 포함한 많은 사람들은 GPT-4를 기대했습니다.

GPT-4의 견고성에 대해 물었을 때 Brockman은 이 모델이 6개월의 보안 교육을 거쳤으며 내부 테스트에서 GPT-3.5에 비해 응답 가능성이 82% 적다고 강조했습니다. OpenAI의 사용 정책에서 허용되지 않는 콘텐츠를 요청하여 "사실"을 생성합니다. "응답 가능성은 GPT-3.5보다 40% 높습니다.

GPT-4가 무엇을 할 수 있는지 이해하려고 많은 시간을 보냈습니다." 브록먼이 말했다. 우리는 사람들이 원하는 성격이나 모드에 맞게 모델의 확장성을 높일 수 있도록 다양한 개선 사항을 포함하도록 지속적으로 업데이트하고 있습니다. ”

솔직히 초기 실제 테스트 결과는 그다지 만족스럽지 않습니다. Adversa AI 테스트 외에도 Microsoft의 챗봇 Bing Chat도 탈옥이 매우 쉬운 것으로 입증되었습니다. 신중하게 제작된 입력을 사용하여 사용자는 챗봇에게 애정 표현, 해를 끼칠 위협, 대량 살인을 정당화하고 음모 이론을 고안하도록 지시할 수 있습니다.

Brockman은 GPT-4가 이 영역에서 부족하다는 점을 부인하지 않았지만 "시스템" 메시지라는 API 수준 기능을 포함하여 모델의 새로운 제한 도구를 강조했습니다. 시스템 메시지는 본질적으로 GPT-4와의 상호 작용을 위한 분위기를 설정하고 경계를 설정하는 지침입니다. 예를 들어, 시스템 메시지는 다음과 같습니다. "당신은 항상 소크라테스 스타일로 질문에 답하는 교사입니다. 학생들에게 절대 답을 주지 않지만 항상 학생들이 독립적으로 사고하는 것을 배울 수 있도록 올바른 질문을 하려고 노력합니다."

아이디어 시스템 메시지는 GPT-4가 궤도를 벗어나는 것을 방지하는 가드레일 역할을 한다는 것입니다. Brockman은 "GPT-4의 톤, 스타일 및 내용을 실제로 파악하는 것이 우리의 큰 초점이었습니다. 엔지니어링을 수행하는 방법과 이를 가능하게 하는 반복 가능한 프로세스를 갖는 방법에 대해 더 많이 이해하기 시작한 것 같습니다."라고 말했습니다. 사람들에게 실제로 유용한 예측 가능한 결과를 얻을 수 있습니다."

Brockman은 또한 AI 모델의 성능을 평가하기 위한 OpenAI의 최신 오픈 소스 소프트웨어 프레임워크인 Evals에 대해 언급했는데, 이는 OpenAI가 모델을 "향상"하기 위해 노력하고 있는 것입니다. 의. Evals를 사용하면 사용자는 GPT-4와 같은 모델을 평가하는 동시에 성능을 확인하는 벤치마크를 개발하고 실행할 수 있습니다. 이는 모델 테스트에 대한 크라우드소싱 접근 방식입니다.

Brockman은 다음과 같이 말했습니다. "Evals를 사용하면 사용자가 관심을 갖는 사용 사례를 더 잘 확인하고 테스트할 수 있습니다. 우리가 이 프레임워크를 오픈 소스로 만드는 이유 중 하나는 더 이상 3개월마다 소스를 오픈하지 않기 때문입니다. 계속 개선하세요. 측정할 수 없는 것을 만들 수는 없겠죠? 하지만 새 버전의 모델을 출시하면 최소한 무엇이 변경되었는지 알 수 있습니다." Evals로 모델을 테스트하시나요? 그는 이를 약속하기를 꺼렸지만 제한된 시간 동안 OpenAI가 이를 요청하는 Eevals 사용자에게 GPT-4 API에 대한 조기 액세스를 허용한다는 점을 언급했습니다.

Brockman은 추가 텍스트를 생성하기 전에 모델이 고려할 수 있는 텍스트를 가리키는 GPT-4의 컨텍스트 창에 대해서도 이야기했습니다. OpenAI는 약 50페이지의 콘텐츠를 "기억"할 수 있는 GPT-4 버전을 테스트하고 있습니다. 이는 일반 GPT-4의 "메모리"의 5배, GPT-3의 "메모리"의 8배입니다.

Brockman은 확장된 컨텍스트 창이 특히 기업에서 이전에 탐구되지 않은 새로운 사용 사례로 이어질 것이라고 믿습니다. 그는 부서 전체의 직원을 포함하여 다양한 소스의 배경과 지식을 사용하여 매우 지식이 풍부하면서도 대화적인 방식으로 질문에 답변할 수 있는 기업을 위해 구축된 AI 챗봇을 구상했습니다.

이것은 새로운 개념이 아닙니다. 그러나 Brockman은 GPT-4의 답변이 현재 다른 챗봇 및 검색 엔진에서 제공하는 답변보다 훨씬 더 유용할 것이라고 믿습니다. "이전에는 모델이 당신이 누구인지, 무엇에 관심이 있는지 등을 전혀 몰랐습니다. 그리고 더 큰 컨텍스트 창이 있으면 확실히 더 강력해지고 사람들에게 제공할 수 있는 지원이 크게 향상됩니다."라고 Xiaoxiao는 말했습니다.

위 내용은 OpenAI 회장: GPT-4는 완벽하지는 않지만 확실히 다릅니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제