칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시-일체 포함-php.cn

집

기술 주변기기

일체 포함

칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시

PHPz

Apr 09, 2023 am 08:41 AM

기계 학습오픈 소스

기계 학습의 개발 과정에서 인간의 학습 방법은 종종 다양한 알고리즘의 설계에 영감을 줍니다. 인간 학습의 중요한 패러다임으로서 강좌를 통한 학습은 기계 학습에서 차용되어 커리큘럼 학습(Curriculum Learning)이라는 연구 방향을 형성했습니다.

일반적으로 인간 교육은 고도로 조직화된 과정을 통해 완성됩니다. 각 코스나 과목은 간단한 내용으로 시작하여 점차 학생들에게 더욱 복잡한 개념을 제시합니다. 예를 들어, 대학에서 미적분학의 개념을 받아들이기 전에 학생은 초등학교에서는 산수, 중학교에서는 함수, 고등학교에서는 도함수를 먼저 배워야 합니다. 그러나 인간 교육과 달리 기존 기계 학습 모델의 교육에는 데이터 샘플과 모델의 현재 학습 상태 간의 다양한 복잡성을 무시하고 데이터 샘플을 모델에 무작위로 입력하는 작업이 포함됩니다. 따라서 머신러닝 분야에서는 인간의 학습을 쉬운 것부터 어려운 것까지 정확하게 모방하고, 모델에 대한 더 나은 훈련 전략을 제공하여 모델의 성능을 향상시키기 위해 커리큘럼 학습을 제안했습니다.

칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시

강좌 학습 개념도

현재 강좌 학습은 이미지 분류, 대상 탐지, 의미 분할, 기계 번역, 오디오 인식, 오디오 등 기계 학습의 다양한 작업에 널리 사용되고 있습니다. 향상, 영상 질의 응답 등은 지도 학습, 비지도 학습, 준지도 학습 및 강화 학습과 같은 시나리오에서도 많은 관심과 연구를 받아왔습니다.

강좌 학습의 적용 및 시나리오가 점점 풍부해짐에 따라 연구자의 심층적인 탐구를 촉진하고 사용자의 적용 경험을 향상시키기 위해서는 이 분야에서 상세한 정렬 및 요약을 수행하는 것이 특히 필요합니다.

이에 칭화대학교 주웬우(Zhu Wenwu) 교수가 이끄는 미디어 및 네트워크 빅데이터 연구실에서는 커리큘럼 학습에 관한 수많은 학술 논문의 축적과 기반을 바탕으로 연구실 구성원인 왕신(Wang Xin)이 커리큘럼 학습에 관한 논문을 에서 발표했습니다. IEEE TPAMI 리뷰 논문에서 연구소는 세계 최초의 강좌 학습용 오픈 소스 라이브러리인 CurML(Curriculum Machine Learning)을 추가로 출시했습니다.

주원우(Zhu Wenwu) 교수와 왕신(Wang Xin) 보조연구원의 코스 학습 연구에는 도시 관심 위치 추천에 적용된 코스 메타러닝 기법, 시끄러운 다중 피드백 정보를 기반으로 한 코스 디커플링 제품 추천, 코스 학습 기반 공유 매개변수 신경망이 포함된다. 검색, 코스 난이도 적응 기반 조합 최적화 문제 해결 등 연구 결과는 SIGKDD, NeurIPS, ACM MM 등 수준 높은 국제 머신러닝 컨퍼런스에서 발표되었습니다.

칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시

일부 연구 결과의 프레임워크 다이어그램

강좌 학습 검토 논문은 강좌 학습의 출현, 정의, 이론 및 적용을 종합적으로 검토하고 이에 따라 통일된 강좌 학습 프레임워크를 설계합니다. 프레임워크 내의 핵심 구성 요소에 대해 코스 학습 알고리즘은 두 가지 주요 범주와 여러 하위 범주로 나누어 코스 학습과 기타 기계 학습 개념 간의 차이점과 상관 관계를 구별하고 이 분야가 직면한 과제와 미래를 지적합니다. 가능한 연구 방향.

칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시

강의 학습 방법 분류

오픈 소스 라이브러리 CurML은 10개 이상의 강의 학습 알고리즘을 통합하여 노이즈 및 비-수업 알고리즘을 모두 지원합니다. 시끄러운 연구원과 사용자가 코스 학습 알고리즘을 재현, 평가, 비교 및 선택할 수 있도록 하는 애플리케이션 시나리오입니다.

CurML의 주요 모듈은 CL Trainer로, 두 개의 하위 모듈인 Model Trainer와 CL Algorithm으로 구성됩니다. 두 모듈은 5가지 인터페이스 기능을 통해 상호 작용하여 강좌 학습 지도의 머신러닝 과정을 구현합니다.

칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시

CurML 프레임워크 다이어그램

메인 모듈: CL Trainer

이 모듈은 전체 오픈 소스 라이브러리의 주요 부분입니다. 이 모듈을 호출하면 사용자는 단 몇 줄의 코드만으로 강좌 학습 알고리즘을 구현할 수 있습니다. 데이터 세트, 모델 및 하이퍼파라미터가 제공된 후 모듈은 일정 기간 동안 훈련하고 훈련된 모델 매개변수와 작업 테스트 결과를 출력합니다. 이 모듈은 주로 사용 편의성 요구 사항을 충족하도록 설계되었으므로 강좌 학습 알고리즘을 사용하고 싶지만 구체적인 구현 세부 사항에는 신경 쓰지 않는 사용자에게 고도로 캡슐화되어 제공됩니다.

하위 모듈 1: 모델 트레이너

이 모듈은 이미지 분류기 또는 언어 모델 교육과 같은 일반적인 기계 학습 프로세스를 완료하는 데 사용됩니다. 동시에 두 번째 하위 모듈 CL 알고리즘과 상호 작용하기 위해 5개의 인터페이스 기능에 대한 위치를 예약하고 사용자 정의 입력 기능도 지원합니다.

하위 모듈 2: CL Algorithm

이 모듈은 다음 표에 표시된 대로 CurML에서 지원하는 모든 강좌 학습 알고리즘을 캡슐화합니다.

칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시

모듈은 5개의 인터페이스를 통해 구현됩니다. 아래 그림과 같이 기계 학습 과정에서 데이터 및 모델 정보를 얻고 모델의 학습 전략을 안내하는 데 사용됩니다. Curml Flow Chartsface Function : Data_prepare

칭화대학교, 강좌 학습을 위한 최초의 오픈 소스 라이브러리인 CurML 출시

이 기능은 모델 트레이너 모듈에서 CL 알고리즘 모듈로 데이터 세트 정보를 제공하는 데 사용됩니다. 많은 강좌 학습 알고리즘은 데이터 샘플의 난이도를 더 잘 판단하기 위해 데이터 세트에 대한 전반적인 이해가 필요하므로 이 인터페이스 기능이 필요합니다.

인터페이스 함수: model_prepare

이 함수는 data_prepare와 매우 유사하지만, 모델 아키텍처, 매개변수 최적화, 학습 등 모델 학습과 관련된 정보를 전송한다는 점이 다릅니다. 속도 조정기 등 많은 코스 학습 알고리즘은 이러한 요소를 조정하여 기계 학습을 안내합니다.

인터페이스 함수: data_curriculum

이 함수는 데이터 샘플의 난이도를 계산하고, 데이터 난이도와 현재 모델 상태를 기반으로 모델에 적합한 데이터를 제공하는 데 사용됩니다. 대부분의 강좌 연구는 유사한 아이디어를 가지고 있습니다. .

인터페이스 기능: model_curriculum

이 기능은 모델을 업데이트하고, 모델이 데이터 샘플에서 얻는 정보의 양을 조정하고, 모델의 학습을 간접적으로 안내하는 데 사용됩니다. 알고리즘은 여전히 작지만 CurML은 이러한 알고리즘의 구현도 지원합니다.

인터페이스 함수: loss_curriculum

이 함수는 손실 함수 값에 다시 가중치를 부여하고 모델에 대한 다양한 데이터의 영향을 간접적으로 조정하는 데 사용됩니다. 이러한 유형의 알고리즘은 손실이 발생하기 때문에 강좌 학습에서 더 일반적입니다. value 가중치 부여는 기본적으로 데이터의 소프트 샘플링입니다.

최근 몇 년간 10개 이상의 강좌 학습 방법을 요약하여, 위의 모듈과 인터페이스 매개변수를 사용하여 다양한 유형의 강좌 학습 알고리즘을 통합하고 구현할 수 있으므로 강좌 학습 알고리즘을 공정한 시나리오에서 평가할 수 있으며 작업을 비교하고 선택하세요.

미래 전망

CurML의 R&D 팀은 코스 학습의 개발 및 적용에 대한 추가 지원을 제공하기 위해 앞으로도 이 오픈 소스 라이브러리를 계속 업데이트할 것이라고 밝혔습니다.

관련 기사

AI Index 2025 읽기 : AI는 친구, 적 또는 부조종사입니까?Apr 11, 2025 pm 12:13 PM

Stanford University Institute for Human-Oriented Intificial Intelligence가 발표 한 2025 인공 지능 지수 보고서는 진행중인 인공 지능 혁명에 대한 훌륭한 개요를 제공합니다. 인식 (무슨 일이 일어나고 있는지 이해), 감사 (혜택보기), 수용 (얼굴 도전) 및 책임 (우리의 책임 찾기)의 네 가지 간단한 개념으로 해석합시다. 인지 : 인공 지능은 어디에나 있고 빠르게 발전하고 있습니다 인공 지능이 얼마나 빠르게 발전하고 확산되고 있는지 잘 알고 있어야합니다. 인공 지능 시스템은 끊임없이 개선되어 수학 및 복잡한 사고 테스트에서 우수한 결과를 얻고 있으며 1 년 전만해도 이러한 테스트에서 비참하게 실패했습니다. AI 복잡한 코딩 문제 또는 대학원 수준의 과학적 문제를 해결한다고 상상해보십시오-2023 년 이후

Meta Llama 3.2- 분석 Vidhya를 시작합니다Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등Apr 11, 2025 pm 12:01 PM

이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

기계와 대화하는 사람의 비용 : 챗봇이 실제로 신경 쓰일 수 있습니까?Apr 11, 2025 pm 12:00 PM

연결의 편안한 환상 : 우리는 AI와의 관계에서 진정으로 번성하고 있습니까? 이 질문은 MIT Media Lab의 "AI (AI)를 사용하여 인간의 발전"심포지엄의 낙관적 톤에 도전했습니다. 이벤트는 절단 -EDG를 보여주었습니다

파이썬의 Scipy 라이브러리 이해Apr 11, 2025 am 11:57 AM

소개 차등 방정식, 최적화 문제 또는 푸리에 분석과 같은 복잡한 문제를 해결하는 과학자 또는 엔지니어라고 상상해보십시오. Python의 사용 편의성 및 그래픽 기능은 매력적이지만 이러한 작업에는 강력한 도구가 필요합니다.

LLAMA 3.2를 실행하는 3 가지 방법 분석 VidhyaApr 11, 2025 am 11:56 AM

메타의 라마 3.2 : 멀티 모달 AI 강국 Meta의 최신 멀티 모드 모델 인 LLAMA 3.2는 AI의 상당한 발전으로 향상된 언어 이해력, 개선 된 정확도 및 우수한 텍스트 생성 기능을 자랑합니다. 그것의 능력 t

Dagster와 데이터 품질 검사 자동화Apr 11, 2025 am 11:44 AM

데이터 품질 보증 : Dagster로 점검 자동화 및 큰 기대치 데이터 품질이 높다는 것은 데이터 중심 비즈니스에 중요합니다. 데이터 볼륨 및 소스가 증가함에 따라 수동 품질 관리는 비효율적이며 오류가 발생하기 쉽습니다.

메인 프레임은 AI 시대에 역할을합니까?Apr 11, 2025 am 11:42 AM

메인 프레임 : AI 혁명의 이름없는 영웅 서버는 일반 목적 애플리케이션 및 여러 클라이언트를 처리하는 데 탁월하지만 메인 프레임은 대량의 미션 크리티컬 작업을 위해 구축됩니다. 이 강력한 시스템은 자주 무거움에서 발견됩니다

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.