OpenAI는 최근 텍스트 생성 모델 GPT-4를 출시해 많은 관심을 받았습니다. 그러나 회사는 API가 아직 대기자 명단에 있기 때문에 개발자가 아직 제품이나 서비스를 구축할 수 없다고 말했습니다.
이는 소수의 사용자만이 OpenAI의 최신 대규모 언어 모델을 사용할 기회를 갖는다는 것을 의미합니다. 그러한 회사 중 하나가 인공 지능 스타트업인 Miðeind ehf입니다. 이 회사는 GPT-4 테스트를 위해 선택된 6개 회사 중 하나였습니다.
회사의 12명으로 구성된 팀은 아이슬란드어로 GPT-4를 교육하고 싶었고, 지난 5월 GPT-4를 테스트하기 위해 베이 지역을 여행한 후 실리콘 밸리에서 가장 인기 있는 제품의 초기 테스터 중 하나가 되었습니다. Miðeind의 CEO는 아이슬란드 정부 대표단과 함께 기술을 사용하여 국가의 언어를 보존하는 데 어떻게 도움이 될 수 있는지 탐구합니다.
Miðeind의 CEO는 OpenAI의 Sam Altman과 GPT-4가 아이슬란드어와 같은 자원이 적은 언어를 어떻게 채택하고 개발할 수 있는지에 대해 이야기합니다. 이러한 언어는 모델을 훈련하기 위해 수집되는 데이터가 훨씬 적기 때문에 대규모 모델 언어를 전 세계적으로 적용하는 데 어려움을 겪습니다.
Miðeind 팀은 GPT-4를 어떻게 개선할 수 있는지, 아이슬란드 퍼페추얼 캘린더를 보존하는 데 사용되는 인공 지능, 그리고 어떻게 GPT-4가 고양이를 지칭하는 매우 흥미로운 새 용어를 만들었는지에 대한 생각을 제시합니다.
Miðeind의 이 팀은 GPT-4에 아이슬란드 강화 학습 데이터(초기 훈련 이후 단계) 성능을 제공하여 언어 응용 및 처리 측면에서 개선될 수 있는지 여부를 학습하는 임무를 맡았습니다.
Miðeind의 기계 학습 팀원 중 한 명인 Pétur Orri Ragnarsson은 결과가 GPT-3.5에 비해 확실히 개선되었지만 아이슬란드어 사용에 있어서는 모델이 여전히 완벽하지 않다고 말했습니다. 그는 "아이슬란드어로 생성되는 텍스트는 이해하기 쉬운 경향이 있지만 여전히 문법 오류가 있습니다."라고 말했습니다.
Ragnarsson은 GPT-3.5를 사용하면 일반적인 추론이 크게 향상될 수 있다고 말했습니다.
그는 이렇게 말했습니다. “가장 흥미로운 점은 무언가를 하도록 요청하고 왜 이 결과가 나오는지 설명할 수 있다는 것입니다. GPT-3.5는 그것을 할 수 있고, 사람들이 그렇게 느끼게 하기 때문에 GPT-4가 더 좋습니다. 설명이 더 좋습니다. 사람들이 자주 시도하는 것 중 하나는 GPT-4가 작업을 수행하고 프로세스의 모든 단계를 설명하도록 하는 것입니다. "설명 가능성"은 인공 지능 분야의 사람들이 직면한 큰 문제입니다. 대규모 언어 모델이 작동하는 방식은 출력이 "블랙 박스"에서 생성된다는 것을 의미하기 때문에 해결하려고 합니다. 이는 GPT-4를 구축하는 개발자조차도 이것이 질문에 어떻게 대답하는지 모른다는 것을 의미하며, 이는 이러한 모델이 어떻게 작동하는지 보여주기가 어렵다는 것을 의미합니다.
생성 AI가 의학, 법률 등의 산업에서 널리 사용되려면 해당 분야에 종사하는 사람들이 모델의 출력을 신뢰할 수 있어야 합니다.
Higher Order Thinking
Ragnarsson은 "상당히 중립적이라고 생각되는 문장을 입력했습니다. 즉, 고객이 고객 서비스에 무엇인가를 질문했다는 것입니다."라고 말했습니다. 그는 GPT-4가 이 문장을 약간 긍정적으로 평가한 것을 보고 놀랐습니다.
'설명해주세요'라고 물었더니 '문장 자체는 중립적이지만 고려 중인 행동은 그들의 삶을 개선할 것이기 때문에 전체적으로 이 문장은 약간 의외다'고 하더군요. 그는 이것이 GPT-4가 텍스트의 "표면적 의미"를 넘어서는 방법을 배웠음을 보여준다고 믿습니다.
Miðeind COO Linda Heimisdottir는 GPT-4의 이러한 기능이 특히 인상적이라고 말했습니다. 그녀가 아는 바로는 이 모델이 감정 분석을 위해 특별히 훈련되지 않았기 때문입니다.
그녀는 다음과 같이 말했습니다. “연구원들이 수년 동안 해오던 일을 이런 모델이 해내는 것을 보는 것은 놀랍습니다. 그리고 그것이 수행하도록 특별히 훈련받지도 않았죠. 결과와 사람들이 어떻게 생각하는지 보는 것은 정말 흥미롭습니다.
열심히 일하는 고양이
GPT-4가 아이슬란드어에서 어떻게 채택되었는지 보여주는 한 가지 예는 언어에서 다양한 개념의 조합인 복합어를 사용하는 것입니다. 한마디로.
그녀는 다음과 같이 설명했습니다. "첫 번째 부분 'katta'는 '고양이'를 의미하지만 두 번째 부분 'fræðilega'는 '이론과 관련됨'을 의미합니다. GPT-4는 고양이를 'kattafræðilega duglegur'로 묘사합니다. duglegur는 부지런함을 의미하는 아이슬란드어 단어입니다. 열심히
GPT-4에게 그 의미를 설명해 달라고 요청했을 때 'kattafræðilega duglegur'는 이 고양이가 특히 열심히 일하는 것을 의미한다고 했습니다. 즉, 긁기, 조사하기, 곤충 추적하기, 먹이 찾기 등을 잘하며, 에너지가 넘치고 주변 환경에 관심이 많다. 고양이가 되는 것은 매우 좋은 일입니다. ”
Miðeind는 “대규모 언어 모델이 덜 일반적으로 사용되는 언어에서 실제로 높은 성능을 달성하려면 초기 학습에 우수한 다국어 데이터세트가 포함되어야 하며 다음 단계로 사전 학습에 들어가기를 희망합니다.
실리콘 밸리의 거대 기술 기업이 이미 대규모 언어 모델 분야를 장악하고 있기 때문에 이와 같은 연구는 차세대 AI가 영어권 세계에 더욱 초점을 맞춘 혁신적인 발전이 아니라는 것을 확인하는 데 중요합니다. OpenAI가 Miðeind를 선택했습니다. GPT-4의 초기 테스터라는 점은 적어도 회사가 상업적인 동기가 있더라도 생성 인공 지능에 대한 글로벌 비전을 가지고 있음을 보여줍니다.
위 내용은 GPT-4를 테스트하는 스타트업들은 그 힘이 놀랍다고 말합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!