AI2의 획기적인 OLMO 2 언어 모델은 완전히 오픈 소스이며 LLM (Lange Language Models) 분야의 성능과 투명성에 대한 새로운 벤치 마크를 설정합니다. 이자가 회귀 모델은 최적화 된 교육, 혁신적인 데이터 혼합물 및 고급 교육 튜닝 기술을 자랑합니다. 세부 사항을 탐구합시다.
"모든 사람은 오픈 소스 언어 모델을 원하지만 아무도이 무거운 엉덩이 무게를 들어 올리기를 원하지 않습니다." -Nathan Lambert (@Natolambert)
이 트윗은 AI2가 극복 한 도전을 완벽하게 캡슐화합니다. 그들의 "2 Olmo 2 Furious"논문은 그들의 성공에 대해 자세히 설명합니다.
목차
- 2 Olmo 2 Furious : 깊은 다이빙
- Olmo 2의 주요 특징
- 강력한 훈련 안정성
- 최적화 된 데이터 블렌드
- 건축 개선
- 훈련 후 개선
- 인프라 : 주요 성분
- OLMO 2 벤치마킹 : 성능 비교
- Olmo 경험 2
- OLMO 2에 액세스 : 키 링크
- 결론
2 Olmo 2 Furious : 깊은 다이빙
7b 및 13b 매개 변수 크기로 제공되는 OLMO 2는 완전한 투명성을 통해 자체적으로 구별됩니다. AI2는 교육 데이터, 코드, 레시피 및 중간 체크 포인트까지 공개적으로 공개되어 협업을 촉진하고 연구 가속화되었습니다. 이 모델은 LLAMA 3.1 및 Qwen 2.5와 같은 업계 리더와 비교할 수있는 성능을 제공하지만 효율성이 크게 향상되었습니다.
"2 Olmo 2 Furious"연구 논문은 포괄적 인 세부 사항을 제공합니다.
Olmo 2의 주요 특징
강력한 훈련 안정성
OLMO 2는 일반적인 훈련 불안정 (손실 스파이크)을 사용하여 다음을 수행합니다.
- 데이터 정제 : 여분의 N-Grams 필터링.
- 개선 된 초기화 : 표준화 된 초기화 체계.
- 정규화 : 출력 로짓을 안정화하기 위해 Z-loss를 사용합니다.
이러한 개선으로 인해 더 큰 교육 및 더 큰 데이터 세트의 효율적인 처리가 가능합니다.
최적화 된 데이터 블렌드
OLMO 2는 2 단계 전 사전 조정 접근법을 사용합니다.
- 초기 전 사전 조정 : 고품질 웹 데이터의 5 조 5 조 토큰을 활용합니다.
- 중간 훈련 향상 : Dolmino Mix 1124 데이터 세트에 의해 예시 된 도메인 별 데이터 세트 (Math, STEM) 통합.
건축 개선
Olmo 2의 아키텍처는 다음과 같습니다.
- RMSNorm : 안정적인 활성화 정규화를 위해.
- 재정렬 층 표준 : 주의 및 피드 포워드 층 출력을 정상화하여 안정성 향상.
- 고해상도 위치 인코딩 : 해상도가 증가한 로터리 위치 임베딩.
이러한 건축 선택은 확장 성과 효율성에 기여합니다.
훈련 후 개선
Olmo 2의 훈련 사후 훈련은 다음에 중점을 둔 Tülu 3 레시피를 활용합니다.
- 감독 된 미세 조정 (SFT) : 교육 교육 능력을 정제합니다.
- 검증 가능한 보상 (RLVR)을 사용한 강화 학습 : 특정 작업에서 성과 최적화 (수학, 사실 추론).
이로 인해 GSM8K 및 MMLU와 같은 벤치 마크에서 우수한 OLMO 2 가지 구조 모델이 발생합니다.
인프라 : 주요 성분
AI2의 고급 인프라는 OLMO 2의 성공에 중요합니다.
- 고성능 컴퓨팅 클러스터 : 여러 데이터 센터에서 NVIDIA H100 GPU 사용.
- 비이커 워크로드 관리 : 효율적인 워크로드 배포 및 모니터링.
이 강력한 인프라는 교육 중단을 최소화하고 자원 활용을 극대화합니다.
OLMO 2 벤치마킹 : 성능 비교
OLMO 2는 특히 Dolmino Mix 1124를 포함함에 따라 특정 작업에 대한 Qwen 2.5 및 Llama 3.1을 자주 성능이 우수합니다. 또한 현저한 효율성을 보여 주어 최대 20% 적은 플로프로 비슷하거나 우수한 결과를 달성합니다.
Olmo 경험 2
모델에 액세스하고 직접 시도하십시오! 현지 사용 지침도 제공됩니다.
OLMO 2에 액세스 : 키 링크
- 종이 : https://www.php.cn/link/cb14acf78723becd7023f4f56027cece
- 블로그 : https://www.php.cn/link/96b054861234c39ac2a02872f8cfcb2
- 데모 : https://www.php.cn/link/3eebaed369eb3ae36a90f310fc33638c
- 컬렉션 : https://www.php.cn/link/ae3b166c302150f4def9a8176fd36460
결론
OLMO 2는 오픈 소스 AI의 상당한 발전으로 투명성과 혁신을 우선시합니다. AI2는 자원을 공개적으로 공유함으로써 협업을 조성하고 현장의 진보를 가속화하여 AI 응용 프로그램의 미래를 주도합니다.
위 내용은 OLMO 2 : 완전 오픈 소스 재단 모델의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!
![chatgpt를 사용할 수 없습니다! 즉시 테스트 할 수있는 원인과 솔루션 설명 [최신 2025]](https://img.php.cn/upload/article/001/242/473/174717025174979.jpg?x-oss-process=image/resize,p_40)
chatgpt에 액세스 할 수 없습니까? 이 기사는 다양한 실용적인 솔루션을 제공합니다! 많은 사용자가 매일 chatgpt를 사용할 때 액세스 할 수 없거나 느린 응답과 같은 문제가 발생할 수 있습니다. 이 기사는 다양한 상황에 따라 이러한 문제를 단계별로 해결하도록 안내합니다. Chatgpt의 접근성 및 예비 문제 해결의 원인 먼저 문제가 OpenAI 서버 측 또는 사용자의 네트워크 또는 장치 문제에 있는지 확인해야합니다. 문제 해결을 위해 아래 단계를 따르십시오. 1 단계 : OpenAI의 공식 상태를 확인하십시오 chatgpt 서비스가 정상적으로 실행 중인지 확인하려면 OpenAi 상태 페이지 (status.openai.com)를 방문하십시오. 빨간색 또는 노란색 알람이 표시되면 열린 것을 의미합니다.

2025 년 5 월 10 일, MIT 물리학 자 Max Tegmark는 AI Labs가 인공 초 지능을 방출하기 전에 Oppenheimer의 삼위 일체 테스트 미적분학을 모방해야한다고 Guardian에게 말했다. “내 평가는 'Compton Constant', 인종이

AI 음악 제작 기술은 매일 매일 변화하고 있습니다. 이 기사는 Chatgpt와 같은 AI 모델을 예로 사용하여 AI를 사용하여 음악 제작을 지원하고 실제 사례에 대해 설명하는 방법을 자세히 설명합니다. 우리는 Sunoai, Hugging Face의 AI Jukebox 및 Python 's Music21 Library를 통해 음악을 만드는 방법을 소개합니다. 이러한 기술을 통해 모든 사람은 독창적 인 음악을 쉽게 만들 수 있습니다. 그러나 AI 생성 컨텐츠의 저작권 문제는 무시할 수 없으며 사용할 때는 신중해야합니다. 음악 분야에서 AI의 무한한 가능성을 모색 해 봅시다! OpenAi의 최신 AI 에이전트 "OpenAi Deep Research"가 소개됩니다. [chatgpt] ope

ChatGpt-4의 출현은 AI 응용 프로그램의 가능성을 크게 확장했습니다. GPT-3.5와 비교하여 ChatGpt-4는 상당히 개선되었습니다. 강력한 맥락 이해력이 있으며 이미지를 인식하고 생성 할 수도 있습니다. 그것은 보편적 인 AI 조수입니다. 비즈니스 효율성 향상 및 창출 지원과 같은 많은 분야에서 큰 잠재력을 보여주었습니다. 그러나 동시에, 우리는 또한 사용의 예방 조치에주의를 기울여야합니다. 이 기사에서는 ChatGpt-4의 특성을 자세히 설명하고 다양한 시나리오에 대한 효과적인 사용 방법을 소개합니다. 이 기사에는 최신 AI 기술을 최대한 활용하는 기술이 포함되어 있습니다. OpenAi의 최신 AI 에이전트, "OpenAi Deep Research"에 대한 자세한 내용은 아래 링크를 클릭하십시오.

chatgpt 앱 : AI 조수와 함께 창의력을 발휘하십시오! 초보자 가이드 Chatgpt 앱은 쓰기, 번역 및 질문 답변을 포함하여 광범위한 작업을 처리하는 혁신적인 AI 어시스턴트입니다. 창의적인 활동과 정보 수집에 유용한 끝없는 가능성이있는 도구입니다. 이 기사에서는 초보자를위한 이해하기 쉬운 방법, ChatGpt 스마트 폰 앱을 설치하는 방법, 음성 입력 기능 및 플러그인과 같은 앱의 고유 한 기능 및 앱을 사용할 때 염두에 두는 포인트에 이르기까지 설명합니다. 또한 플러그인 제한 및 장치 간 구성 동기화를 자세히 살펴 보겠습니다.

Chatgpt Chinese 버전 : 중국 AI 대화의 새로운 경험 잠금 해제 Chatgpt는 전 세계적으로 인기가 있습니다. 중국어 버전도 제공한다는 것을 알고 있습니까? 이 강력한 AI 도구는 일상적인 대화를 지원할뿐만 아니라 전문적인 콘텐츠를 처리하며 단순화되고 전통적인 중국어와 호환됩니다. 중국의 사용자이든 중국어를 배우는 친구이든 상관없이 혜택을 누릴 수 있습니다. 이 기사는 계정 설정, 중국 신속한 단어 입력, 필터 사용 및 다양한 패키지 선택을 포함하여 ChatGpt 중국어 버전을 사용하는 방법을 자세히 소개하고 잠재적 위험 및 응답 전략을 분석합니다. 또한 ChatGpt 중국어 버전을 다른 중국 AI 도구와 비교하여 장점과 응용 프로그램 시나리오를 더 잘 이해할 수 있도록 도와줍니다. Openai의 최신 AI 인텔리전스

이것들은 생성 AI 분야의 다음 도약으로 생각 될 수 있으며, 이는 우리에게 Chatgpt 및 기타 대규모 모델 챗봇을 제공했습니다. 단순히 질문에 대답하거나 정보를 생성하는 대신, 우리를 대신하여 조치를 취할 수 있습니다.

ChatGpt를 사용한 효율적인 다중 계정 관리 기술 | 비즈니스와 사생활 사용 방법에 대한 철저한 설명! Chatgpt는 다양한 상황에서 사용되지만 일부 사람들은 여러 계정 관리에 대해 걱정할 수 있습니다. 이 기사는 ChatGpt에 대한 여러 계정을 만드는 방법, 사용할 때 수행 할 작업 및 안전하고 효율적으로 작동하는 방법을 자세히 설명합니다. 또한 비즈니스와 개인 사용의 차이, OpenAI의 이용 약관을 준수하는 것과 같은 중요한 점을 다루며 여러 계정을 안전하게 활용하는 데 도움이되는 안내서를 제공합니다. Openai


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

ZendStudio 13.5.1 맥
강력한 PHP 통합 개발 환경