찾다
기술 주변기기일체 포함NTU Zhou Zhihua팀의 8년간의 걸작! '러닝웨어' 시스템은 머신러닝 재사용 문제를 해결하고, '모델 융합'은 과학 연구의 새로운 패러다임을 제시합니다.

HuggingFace는 300,000개의 다양한 기계 학습 모델과 100,000개의 사용 가능한 애플리케이션을 갖춘 가장 인기 있는 오픈 소스 기계 학습 커뮤니티입니다.

HuggingFace의 30만 모델이 자유롭게 결합되어 새로운 학습 작업을 함께 완료할 수 있다면 어떤 모습일까요?

실제로 2016년 허깅페이스(HuggingFace)가 나왔을 때 난징대학교 저우즈화(Zhou Zhihua) 교수가 '런웨어(Learnware)' 개념을 제안하고 이런 청사진을 그렸습니다.

최근 난징대학교 Zhou Zhihua 교수팀이 Beimingwu라는 플랫폼을 출시했습니다.

주소: https://bmwu.cloud/

Beimingwu는 연구원과 사용자에게 자신의 모델을 업로드할 수 있는 기능을 제공할 뿐만 아니라 사용자의 요구에 따라 모델 매칭 및 협업 융합을 수행하여 학습을 효율적으로 처리합니다. 작업.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

논문 주소: https://arxiv.org/abs/2401.14427

Beimingwu 시스템 창고: https://www.gitlink.org.cn/beimingwu/beimingwu

과학 연구 툴킷 웨어하우스: https://www.gitlink.org.cn/beimingwu/learnware

이 플랫폼의 가장 큰 특징은 런웨어 시스템을 도입하여 사용자 요구에 따른 모델을 실현하는 데 획기적인 발전을 이룬 것입니다. 적응형 매칭 및 협업 기능.

러닝웨어는 머신러닝 모델과 모델을 설명하는 사양, 즉 "러닝웨어 = 모델 + 사양"으로 구성됩니다.

학습 소프트웨어의 사양은 "의미론적 사양"과 "통계적 사양"의 두 부분으로 구성됩니다.

  • 의미론적 사양은 텍스트를 통해 모델의 유형과 기능을 설명합니다.
  • 통계 사양은 다양한 기계 학습을 사용합니다. 기술, 모델에 포함된 통계 정보를 나타냅니다.

학습웨어의 사양은 모델의 기능을 설명하므로 사용자 요구 사항을 충족하기 위해 사용자가 학습웨어에 대해 미리 알지 않고도 향후 모델을 완전히 인식하고 재사용할 수 있습니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

프로토콜은 러닝웨어 업로드, 구성, 검색, 배포 및 재사용을 포함하여 시스템의 모든 러닝웨어 프로세스를 연결하는 러닝웨어 기반 시스템의 핵심 구성 요소입니다.

'드래곤'의 연자우가 많은 작은 섬으로 이루어진 것처럼, 북명우의 규정도 작은 섬과 같습니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

다양한 기능/마커 공간의 학습웨어는 수많은 프로토콜 섬을 구성하며, 모든 프로토콜 섬은 함께 학습웨어 기반 시스템의 프로토콜 세계를 구성합니다. 프로토콜 세계에서 서로 다른 섬 간의 연결을 발견하고 설정할 수 있다면 해당 프로토콜 섬을 병합할 수 있습니다.

러닝웨어 패러다임 하에서 전 세계 개발자는 러닝웨어 기반 시스템에 모델을 공유할 수 있습니다. 이 시스템은 사용자가 처음부터 머신러닝 모델을 구축하지 않고도 러닝웨어를 효과적으로 검색하고 재사용하여 머신러닝 작업을 효율적으로 해결할 수 있도록 도와줍니다.

Beimingwu는 학술 소프트웨어의 최초의 체계적인 오픈 소스 구현으로 학술 소프트웨어 관련 연구를 위한 예비 과학 연구 플랫폼을 제공합니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

공유하려는 개발자는 자유롭게 모델을 제출할 수 있으며 학습 창고는 학습 소프트웨어를 구성하고 학습 창고에 저장하기 위한 사양을 생성하는 데 도움을 줍니다. 이 과정에서 개발자는 자신의 교육 내용을 공개할 필요가 없습니다. 학습 창고에 데이터를 보냅니다.

향후 사용자는 학습 창고에 요구 사항을 제출하고 학습 창고의 도움으로 재사용 학습 자료를 검색하여 기계 학습 작업을 완료할 수 있으며 사용자는 자신의 데이터를 학습 창고에 공개할 필요가 없습니다.

그리고 미래에는 학습 도크에 수백만 개의 학습 조각이 있으면 "긴급" 동작이 발생할 가능성이 높습니다. 과거에 특별히 개발된 모델이 없는 기계 학습 작업은 여러 기존 학습 조각을 재사용하여 재사용될 수 있습니다. .그리고 해결하세요.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

러닝웨어 기반 시스템

머신러닝은 여러 분야에서 큰 성공을 거두었지만, 여전히 많은 양의 훈련 데이터와 뛰어난 훈련 기술의 필요성, 지속적인 학습의 어려움, 치명적인 망각. 데이터 프라이버시/소유권 등의 위험 및 유출.

위의 각 문제에는 상응하는 연구가 있지만 문제가 서로 결합되어 있기 때문에 하나의 문제를 해결하면 다른 문제가 더 심각해질 수 있습니다.

학습 기반 시스템은 전반적인 프레임워크를 통해 위의 많은 문제를 동시에 해결하기를 희망합니다.

  • 훈련 데이터/기술 부족: 훈련 기술이 부족하거나 적은 양의 일반 사용자에게도 적용됩니다. 사용자가 처음부터 모델을 직접 구축하는 대신 학습웨어 기반 시스템에서 고성능 학습웨어를 가져와 추가로 조정하거나 개선할 수 있기 때문에 강력한 기계 학습 모델을 얻을 수 있습니다.
  • 지속학습: 다양한 업무에 대해 훈련된 성능이 뛰어난 학습 소프트웨어가 지속적으로 제출되면서 학습 소프트웨어 기반 시스템의 지식이 계속 풍부해지면서 자연스럽게 지속적이고 평생학습을 실현하게 된다.
  • 재앙적인 망각: 일단 학습 작품을 받으면 해당 기능의 모든 측면을 다른 학습 작품으로 대체할 수 없는 한 학습 작품 기반 시스템에 항상 수용됩니다. 따라서 학습 기반 시스템의 오래된 지식은 항상 유지되고 결코 잊혀지지 않습니다.
  • 데이터 개인 정보 보호/소유권: 개발자는 개인 데이터를 공유하지 않고 모델만 제출하므로 데이터 개인 정보 보호/소유권이 잘 보호될 수 있습니다. 모델의 리버스 엔지니어링 가능성을 완전히 배제할 수는 없지만, 학습 기반 시스템의 개인정보 유출 위험은 다른 많은 개인정보 보호 방식에 비해 매우 적습니다.

러닝웨어 기반 시스템 구성

아래 그림과 같이 시스템 워크플로는 다음 두 단계로 구분됩니다.

  • 제출 단계: 개발자가 다양한 러닝웨어를 A 기반 시스템에 자발적으로 제출 품질 검사 및 추가 구성을 수행하는 학습 자료입니다.
  • 배포 단계: 사용자가 작업 요구 사항을 제출하면 러닝웨어 기반 시스템은 러닝웨어 사양에 따라 사용자의 작업에 도움이 되는 러닝웨어를 추천하고 사용자가 이를 배포하고 재사용하도록 안내합니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

프로토콜 월드

프로토콜은 러닝웨어 업로드, 구성, 검색, 배포 및 재사용을 포함하여 시스템의 모든 러닝웨어 프로세스를 연결하는 러닝웨어 기반 시스템의 핵심 구성 요소입니다.

다양한 기능/마커 공간의 학습웨어는 수많은 프로토콜 아일랜드를 구성하며, 모든 프로토콜 아일랜드는 함께 학습웨어 기반 시스템의 프로토콜 세계를 구성합니다. 프로토콜 세계에서 서로 다른 섬 간의 연결을 발견하고 설정할 수 있다면 해당 프로토콜 섬을 병합할 수 있습니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

검색 시 학습 기반 시스템은 먼저 사용자 요구 사항의 의미 사양을 통해 특정 프로토콜 아일랜드를 찾은 다음 사용자 요구 사항의 통계 사양을 통해 프로토콜 아일랜드의 학습 자료를 정확하게 식별합니다. 서로 다른 프로토콜 아일랜드를 병합한다는 것은 해당 학습 소프트웨어가 서로 다른 기능/마커 공간의 작업에 사용될 수 있음을 의미합니다. 즉, 원래 목적을 넘어서는 작업에 재사용될 수 있습니다.

러닝웨어 패러다임은 커뮤니티에서 공유하는 머신러닝 모델의 기능을 최대한 활용하여 통일된 사양 공간을 구축하고, 신규 사용자의 머신러닝 작업을 통일된 방식으로 효율적으로 해결합니다. 학습 조각의 수가 증가함에 따라 학습 조각 구조를 효과적으로 구성함으로써 학습 조각 기반 시스템의 전반적인 과제 해결 능력이 크게 향상됩니다.

Beimingwu의 아키텍처

아래 그림과 같이 Beimingwu의 시스템 아키텍처는 러닝웨어 저장 계층부터 사용자 상호 작용 계층까지 4단계로 구성됩니다. 상향식. 네 가지 레벨의 구체적인 기능은 다음과 같습니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

  • 학습웨어 저장 계층: zip 패키지 형식으로 저장된 학습웨어를 관리하고, 학습웨어 데이터베이스를 통해 관련 정보에 대한 액세스를 제공합니다.
  • 시스템 엔진 계층: 학습웨어 업로드, 감지, 구성, 검색, 배포를 포함한 학습웨어 패러다임의 모든 프로세스를 포함합니다. 재사용하고, 런웨어 Python 패키지 형태로 백엔드 및 프런트엔드와 독립적으로 실행하여 런웨어 관련 작업 및 과학 연구 탐색을 위한 풍부한 알고리즘 인터페이스를 제공합니다.
  • 시스템 백엔드 계층: 구현 Beimingwu의 산업급 배포는 안정적인 시스템 온라인 서비스를 제공하고 풍부한 백엔드 API를 제공하여 프런트엔드와 클라이언트 간의 사용자 상호 작용을 지원합니다.
  • 사용자 상호 작용 레이어: 웹 기반 프런트 엔드 및 명령을 구현합니다. 라인 기반 클라이언트는 사용자 상호 작용을 위한 풍부하고 편리한 방법을 제공합니다.

실험 평가

논문에서 연구팀은 프로토콜 생성, 아티팩트 인식 학습 및 테이블, 이미지 및 텍스트 데이터에 대한 재사용을 위한 벤치마크 알고리즘을 평가하기 위해 다양한 유형의 기본 실험 시나리오도 구성했습니다.

테이블 형식 데이터 실험

다양한 테이블 형식 데이터 세트에서 팀은 먼저 사용자 작업과 동일한 기능 공간을 갖는 러닝웨어 시스템에서 러닝웨어를 식별하고 재사용하는 성능을 평가했습니다.

또한 양식 작업은 일반적으로 다양한 기능 공간에서 발생하므로 연구팀은 다양한 기능 공간에서 학습 조각의 식별 및 재사용도 평가했습니다.

동질적 사례

동질적 사례에서 PFS 데이터세트의 53개 매장은 53명의 독립 사용자 역할을 합니다.

각 매장은 자체 테스트 데이터를 사용자 작업 데이터로 활용하고 통합된 기능 엔지니어링 접근 방식을 채택합니다. 그러면 이러한 사용자는 자신의 작업과 동일한 기능 공간을 공유하는 동종 학습 항목에 대한 기본 시스템을 검색할 수 있습니다.

사용자에게 레이블이 지정된 데이터가 없거나 레이블이 지정된 데이터의 양이 제한되어 있는 경우 팀에서는 다양한 벤치마크 알고리즘을 비교했으며 모든 사용자의 평균 손실은 아래 그림과 같습니다. 왼쪽 표는 시장에서 런웨어를 무작위로 선택하고 배포하는 것보다 데이터 없는 접근 방식이 훨씬 낫다는 것을 보여줍니다. 오른쪽 차트는 사용자가 제한된 훈련 데이터를 가지고 있는 경우 단일 또는 다중 런웨어를 식별하고 재사용하는 것이 사용자가 훈련한 것보다 낫다는 것을 보여줍니다. 모델. 더 나은 성능.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

왼쪽 표는 시장에서 학습웨어를 무작위로 선택하고 배포하는 것보다 데이터 없는 접근 방식이 훨씬 낫다는 것을 보여줍니다. 오른쪽 그림은 사용자가 제한된 훈련 데이터를 가지고 있을 때 단일 또는 다중을 식별하고 재사용한다는 것을 보여줍니다. learnware 소프트웨어는 사용자 교육 모델보다 성능이 뛰어납니다.

이기종 사례

시장 소프트웨어와 사용자 작업 간의 유사성을 기반으로 이기종 사례는 다양한 기능 엔지니어링과 다양한 작업 시나리오로 더 나눌 수 있습니다.

다양한 기능 엔지니어링 시나리오:

아래 그림의 왼쪽에 표시된 결과는 사용자에게 주석 데이터가 부족하더라도 시스템의 학습 소프트웨어가 특히 다중 학습 소프트웨어인 경우 여전히 강력한 성능을 보여줄 수 있음을 보여줍니다. AverageEnsemble 메서드를 재사용합니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

다양한 작업 시나리오:

위 그림의 오른쪽은 사용자 자가 훈련 모델의 손실 곡선과 여러 런웨어 재사용 방법을 보여줍니다.

분명히 이질적인 학습 구성 요소에 대한 실험적 검증은 사용자가 주석을 추가한 데이터의 양이 제한되어 있을 때 유익하고 사용자의 기능 공간에 더 잘 맞추는 데 도움이 됩니다.

이미지 및 텍스트 데이터 실험

또한 연구팀은 이미지 데이터 세트에 대한 시스템 기본 평가를 수행했습니다.

아래 그림은 사용자가 주석이 달린 데이터가 부족하거나 데이터 양이 제한적(인스턴스 2000개 미만)인 경우 학습 기반 시스템을 활용하면 좋은 성능을 얻을 수 있음을 보여줍니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

팀은 또한 벤치마크 텍스트 데이터 세트에 대한 시스템 기본 평가를 수행했습니다. 통합 특징 추출기를 통한 특징 공간 정렬.

아래 그림과 같이 주석 데이터가 제공되지 않더라도 러닝웨어 식별 및 재사용을 통해 얻은 성능은 시스템 내 최고의 러닝웨어와 맞먹습니다.

또한, 학습 기반 시스템을 사용하면 모델을 처음부터 학습시키는 것에 비해 약 2000개의 샘플을 줄일 수 있습니다.

NTU Zhou Zhihua팀의 8년간의 걸작! 러닝웨어 시스템은 머신러닝 재사용 문제를 해결하고, 모델 융합은 과학 연구의 새로운 패러다임을 제시합니다.

위 내용은 NTU Zhou Zhihua팀의 8년간의 걸작! '러닝웨어' 시스템은 머신러닝 재사용 문제를 해결하고, '모델 융합'은 과학 연구의 새로운 패러다임을 제시합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
모두가 AI 사용에 더 나아지고 있습니다 : Vibe 코딩에 대한 생각모두가 AI 사용에 더 나아지고 있습니다 : Vibe 코딩에 대한 생각Apr 19, 2025 am 11:17 AM

컨퍼런스와 전시회에서 무슨 일이 일어나고 있는지 볼 수 있습니다. 엔지니어에게 자신이하고있는 일을 물어 보거나 CEO와 상담 할 수 있습니다. 당신이 보는 곳마다, 상황은 졸린 속도로 변화하고 있습니다. 엔지니어 및 비 엔지니어 차이점은 무엇입니까?

Rocketpy -Analytics Vidhya를 사용한 로켓 런칭 시뮬레이션 및 분석Rocketpy -Analytics Vidhya를 사용한 로켓 런칭 시뮬레이션 및 분석Apr 19, 2025 am 11:12 AM

Rocketpy : 포괄적 인 가이드로 로켓 발사 시뮬레이션 이 기사는 강력한 파이썬 라이브러리 인 Rocketpy를 사용하여 고출력 로켓 런칭을 시뮬레이션하는 것을 안내합니다. 로켓 구성 요소 정의에서 Simula 분석에 이르기까지 모든 것을 다룰 것입니다.

5 무료 데이터 분석 과정 - 분석 Vidhya5 무료 데이터 분석 과정 - 분석 VidhyaApr 19, 2025 am 11:11 AM

은행을 깨지 않고 데이터 중심의 경력 여행을 시작하십시오! 이 기사는 5 개의 탁월한 무료 데이터 분석 과정을 강조하며, 스킬 셋을 확장하려는 노련한 전문가 모두에게 적합하고 T를 탐구하고 싶어하는 호기심 많은 신입생에게 적합합니다.

Openagi를 사용하여 자율 AI 에이전트를 구축하는 방법은 무엇입니까? - 분석 VidhyaOpenagi를 사용하여 자율 AI 에이전트를 구축하는 방법은 무엇입니까? - 분석 VidhyaApr 19, 2025 am 11:10 AM

Openagi로 AI 요원의 힘을 활용하십시오 : 포괄적 인 가이드 지칠 줄 모르는 조수를 상상해보십시오. 항상 작업을 간소화하고 통찰력있는 권장 사항을 제공 할 수 있습니다. 그것이 AI 요원의 약속이며 Openagi

GPT-4O MINI : OpenAi의 최신 모델이 어떻게 쌓이는가?GPT-4O MINI : OpenAi의 최신 모델이 어떻게 쌓이는가?Apr 19, 2025 am 11:09 AM

OpenAi의 최신 제품인 GPT-4O Mini는 저렴하고 접근 가능한 고급 AI를 향한 중요한 단계입니다. 이 작은 언어 모델 (SLM)은 Llama 3 및 Gemma 2와 같은 경쟁자에게 직접 도전하여 낮은 대기 시간, 비용 효율성 및

기술 혁신가에서 건강 관리 파이오니어까지 : Geetha Manjunath 박사 ' S AI Story기술 혁신가에서 건강 관리 파이오니어까지 : Geetha Manjunath 박사 ' S AI StoryApr 19, 2025 am 11:02 AM

"Deading with Data"의이 에피소드에는 Niramai Analytix의 창립자이자 CEO 인 Geetha Manjunath 박사가 있습니다. AI와 의료 분야에서 25 년 이상의 경험을 가진 Manjunath 박사는 인도 과학 연구소에서 박사 학위를 취득하고 MBA FRO

Ollama -Analytics Vidhya와의 로컬 LLM 배치 단순화Ollama -Analytics Vidhya와의 로컬 LLM 배치 단순화Apr 19, 2025 am 11:01 AM

Ollama와 함께 현지에서 오픈 소스 LLM의 힘을 활용하십시오 : 포괄적 인 가이드 LLM (Lange Language Models)을 실행하면 비교할 수없는 제어 및 투명성을 제공하지만 환경을 설정하면 어려울 수 있습니다. Ollama는이 과정을 단순화합니다

Monsterapi로 대형 언어 모델을 미세 조정하는 방법Monsterapi로 대형 언어 모델을 미세 조정하는 방법Apr 19, 2025 am 10:49 AM

Monsterapi와 함께 미세 조정 된 LLM의 힘을 활용 : 포괄적 인 가이드 가상 어시스턴트가 귀하의 요구를 완벽하게 이해하고 기대한다고 상상해보십시오. LLMS (Lange Models)의 발전 덕분에 이것은 현실이되고 있습니다. 그러나 a

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

안전한 시험 브라우저

안전한 시험 브라우저

안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.