OpenAI o1과 o1-mini가 출시되었습니다. 이러한 AI LLM은 생각하는 데 더 많은 시간을 투자함으로써 GPT-4o와 같은 이전 모델보다 코딩, 수학, 과학 문제 및 작업에서 훨씬 더 나은 성능을 발휘합니다.
STEM의 복잡한 문제에는 정답을 찾기 위한 빠른 온라인 검색 이상의 것이 필요한 경향이 있습니다. o1 AI에게 생각할 시간을 더 많이 줌으로써 AI는 더 신중하고 정확하게 추론할 수 있습니다. o1-mini 모델은 더 빠른 속도와 더 낮은 컴퓨터 리소스 수요로 STEM 질문에 답할 수 있도록 특별히 조정되었으며, o1 모델보다 코딩 능력이 눈에 띄게 뛰어납니다.
o1 모델은 LLM을 위한 다양한 표준화된 AP 시험과 STEM 테스트에서 높은 정확도를 발휘합니다. 특히 AP Calculus, AP Chemistry, AP Physics 2, LSAT 및 SAT 증거 기반 읽기 및 쓰기 테스트에서 o1 모델은 B등급 수준(~80% 이상) 이상을 수행합니다. 모델은 박사 수준 물리학 문제에 대해 A등급 수준, 까다로운 2024 미국 초대 수학 시험 수학 문제에 대해 B등급 수준, Codeforces 코딩 문제에 대해 높은 B등급 수준에서 정확하게 답변합니다. o1은 STEM 질문에 답하도록 조정되었기 때문에 AP 영어 및 AP 영어 문학 성적은 C등급 수준 이하입니다.
옷장 악당들은 검열되지 않은 o1 모델이 골치 아픈 답변을 하기 쉽지만 OpenAI가 출시를 위해 이러한 모델을 중성화했다는 사실을 알고 싶어할 것입니다. o1 모델은 생물 무기 제조, 음란한 이미지 생성, 자체 탈옥, 괴롭힘 및 위협에 대한 질문에 대답하지 않도록 테스트되었습니다. 불행하게도 OpenAI o1 모델은 조정 노력에도 불구하고 테스트 시 성별 및 인종 편향을 유지합니다.
ChatGPT Plus 및 Team 사용자와 API 사용 계층 5 개발자는 즉시 o1 모델에 액세스할 수 있으며 ChatGPT Edu 및 Enterprise 사용자는 9월 16일 주에 액세스할 수 있습니다. ChatGPT Free 사용자는 o1에 액세스할 수 있습니다. 가까운 미래에 미니. o1 모델은 웹을 탐색하거나 업로드된 파일 및 이미지를 수락하여 질문에 답할 수 없으므로 OpenAI는 사용자가 일반적인 질문에 GPT-4o 모델을 계속 사용할 것을 권장합니다.
AI에 질문하고 싶은 사용자는 이제 Anthropic Claude, Microsoft CoPilot, Google Gemini, X Grok 등 OpenAI 모델 외에도 상호 작용할 수 있는 다양한 LLM 모델을 보유하고 있습니다. 모든 AI에는 특정한 장점이 있으므로 여러 AI 모델을 테스트하여 개인의 요구에 가장 적합한 모델을 찾는 것이 좋습니다. 이러한 AI 중 일부는 스마트 안경(Amazon의 것과 같은)과 음성 녹음기(Amazon의 것과 같은)에 내장되어 있으며, 곧 출시될 일부 자율 휴머노이드 로봇은 독점 AI를 사용하여 요리하고 청소합니다.
위 내용은 OpenAI o1 및 o1-mini는 이전 모델보다 STEM 문제를 더 잘 처리하는 AI로 등장합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!