인과 적 언어 모델링을 넘어서-일체 포함-php.cn

집

기술 주변기기

일체 포함

인과 적 언어 모델링을 넘어서

PHPz

Feb 25, 2025 pm 06:28 PM

Neurips 2024 스포트라이트 : 선택적 언어 모델링 (SLM)으로 사전 조정을 최적화합니다. 최근에, 나는 Neurips 2024의 매혹적인 종이를 발표했다. 이 논문은 놀랍도록 단순하면서도 영향력있는 질문을 다룹니다. 언어 모델 사전 레이팅 중에

의 모든 토큰에 필요한 다음 점토 예측이 필요합니까? 표준 접근법에는 대규모 웹 스프레이링 데이터 세트가 포함되며 인과 적 언어 모델링 (CLM)을 보편적으로 적용합니다. 이 논문은 그 가정에 도전하여 일부 토큰이 학습 과정보다는 도움보다는 방해를 제안합니다. 저자는 "유용한"토큰에 대한 교육에 초점을 맞추면 데이터 효율성과 다운 스트림 작업 성능이 크게 향상됨을 보여줍니다. 이 게시물은 핵심 아이디어와 주요 실험 결과를 요약합니다. 문제 : 소음과 비효율적 인 학습 대형 웹 코퍼는 필연적으로 소음이 포함되어 있습니다. 문서 수준 필터링은 도움이되지만 노이즈는 종종 개별 문서 내에 있습니다. 이 시끄러운 토큰은 계산 자원을 폐기하고 잠재적으로 모델을 혼동합니다.

저자는 토큰 수준의 학습 역학을 분석하여 교차 엔트로피 손실 궤적을 기반으로 토큰을 분류했습니다. l → L (낮은 ~ 낮음) : 신속하게 배웠으며 최소한의 추가 혜택을 제공합니다. h → L (높음에서 낮음) :

처음에는 어렵지만 결국 배웠습니다. 귀중한 학습 기회를 대표합니다.

지속적으로 어렵습니다. l → h (낮은 ~ 높음) : 처음 배웠지 만 나중에 컨텍스트 변화 나 소음으로 인해 문제가됩니다. ~~그들의 분석은 소량의 토큰만이 의미있는 학습 신호를 제공한다는 것을 보여줍니다. 솔루션 : 선택적 언어 모델링 (SLM)~~

제안 된 솔루션 인 SLM (Selective Language Modeling)은보다 목표로하는 접근 방식을 제공합니다.

참조 모델 (RM) 교육 : 데이터의 고품질 하위 집합은 미리 훈련 된 기본 모델을 미세 조정하여 참조 모델 (RM)을 생성하는 데 사용됩니다. 이 RM은 "유용성"토큰의 벤치 마크 역할을합니다

초과 손실 계산 : 큰 코퍼스의 각 토큰에 대해 RM의 손실과 현재 교육 모델의 손실 ( "초과 손실")의 차이가 계산됩니다. 초과 손실이 높을수록 개선 가능성이 커집니다
전체 포워드 패스는 모든 토큰에 대해 수행되지만 역설은 초과 손실이 가장 높은 토큰의 상단 k%에 대해서만 발생합니다. 이것은 동적으로 가장 귀중한 토큰에 대한 훈련에 중점을 둡니다

실험 결과 : 상당한 이득 SLM은 다양한 실험에서 중요한 이점을 보여줍니다

Math Domain : openwebmath Beyond Causal Language Modeling , SLM은 표준 CLM과 비교하여 GSM8K 및 수학 벤치 마크에서 최대 10%의 성능을 달성하여 기준 성능에 5-10 배 더 빠르게 도달했습니다. 7B 모델은 훈련 토큰의 3% 만 사용하여 최첨단 모델과 일치했습니다. 1B 모델의 경우 미세 조정 성능을 40% 이상 늘 렸습니다.

일반 도메인 :
강력한 미리 훈련 된 기본 모델에서도 SLM은 15 개의 벤치 마크에서 약 5.8%의 평균 개선을 산출했습니다. 자체 참조 : RAW 코퍼스에서 빠르게 훈련 된 RM조차도 2-3%의 정확도 부스트와 사용 된 토큰의 30-40% 감소를 제공했습니다.
결론과 미래의 작업
이 백서는 토큰 수준의 학습 역학에 대한 귀중한 통찰력을 제공하고 언어 모델 사전 레이팅을 최적화하는 매우 효과적인 기술인 SLM을 소개합니다. 향후 연구 방향에는 SLM을 더 큰 모델로 스케일링, API 기반 참조 모델 탐색, 강화 학습 통합, 여러 참조 모델 사용 및 SLM을 안전 및 진실성 고려 사항과 정렬하는 것이 포함됩니다. 이 작업은 효율적이고 효과적인 언어 모델 교육의 중요한 발전을 나타냅니다.

위 내용은 인과 적 언어 모델링을 넘어서의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

Huggingface Smollm으로 개인 AI 조수를 만드는 방법Apr 18, 2025 am 11:52 AM

ON-DEVICE AI의 힘을 활용 : 개인 챗봇 CLI 구축 최근에 개인 AI 조수의 개념은 공상 과학처럼 보였다. 기술 애호가 인 Alex, 똑똑하고 현지 AI 동반자를 꿈꾸는 것을 상상해보십시오.

정신 건강을위한 AI는 스탠포드 대학교의 흥미로운 새로운 이니셔티브를 통해주의 깊게 분석됩니다.Apr 18, 2025 am 11:49 AM

AI4MH의 첫 출시는 2025 년 4 월 15 일에 열렸으며, 유명한 정신과 의사이자 신경 과학자 인 Luminary Dr. Tom Insel 박사는 킥오프 스피커 역할을했습니다. Insel 박사는 정신 건강 연구 및 테크노에서 뛰어난 작업으로 유명합니다.

2025 WNBA 드래프트 클래스는 리그가 성장하고 온라인 괴롭힘과 싸우고 있습니다.Apr 18, 2025 am 11:44 AM

Engelbert는 "WNBA가 모든 사람, 플레이어, 팬 및 기업 파트너가 안전하고 가치가 있으며 권한을 부여받는 공간으로 남아 있기를 원합니다. 아노

파이썬 내장 데이터 구조에 대한 포괄적 인 가이드 - 분석 VidhyaApr 18, 2025 am 11:43 AM

소개 Python은 특히 데이터 과학 및 생성 AI에서 프로그래밍 언어로 탁월합니다. 대규모 데이터 세트를 처리 할 때 효율적인 데이터 조작 (저장, 관리 및 액세스)이 중요합니다. 우리는 이전에 숫자와 st를 다루었습니다

대안과 비교하여 OpenAi의 새로운 모델의 첫인상Apr 18, 2025 am 11:41 AM

다이빙하기 전에 중요한 경고 : AI 성능은 비 결정적이며 고도로 사용하는 것이 중요합니다. 간단히 말하면 마일리지는 다를 수 있습니다. 이 기사 (또는 다른) 기사를 최종 단어로 취하지 마십시오. 대신 에이 모델을 자신의 시나리오에서 테스트하십시오.

AI 포트폴리오 | AI 경력을위한 포트폴리오를 구축하는 방법은 무엇입니까?Apr 18, 2025 am 11:40 AM

뛰어난 AI/ML 포트폴리오 구축 : 초보자 및 전문가를위한 안내서 인공 지능 (AI) 및 머신 러닝 (ML)의 역할을 확보하는 데 강력한 포트폴리오를 만드는 것이 중요합니다. 이 안내서는 포트폴리오 구축에 대한 조언을 제공합니다

보안 운영에 대한 에이전트 AI가 무엇을 의미 할 수 있는지Apr 18, 2025 am 11:36 AM

결과? 소진, 비 효율성 및 탐지와 동작 사이의 넓은 차이. 이 중 어느 것도 사이버 보안에서 일하는 사람에게는 충격이되지 않습니다. 그러나 에이전트 AI의 약속은 잠재적 인 전환점으로 부상했다. 이 새로운 수업

Google 대 Openai : AI 학생들을위한 AI 싸움Apr 18, 2025 am 11:31 AM

장기 파트너십 대 즉각적인 영향? 2 주 전 Openai는 2025 년 5 월 말까지 미국과 캐나다 대학생들에게 Chatgpt Plus에 무료로 이용할 수있는 강력한 단기 제안으로 발전했습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.