>기술 주변기기 >일체 포함 >AutoML용 GitHub 저장소 10개

AutoML용 GitHub 저장소 10개

王林
王林앞으로
2023-04-12 11:43:091799검색

인공지능과 머신러닝의 혁신은 지난 20년 동안 가장 흥미로운 주제 중 두 가지입니다. 기계 학습 및 데이터 과학 엔지니어는 모델을 효과적으로 이해하고 실행하기 위해 광범위한 연구와 노력이 필요합니다.

AutoML용 GitHub 저장소 10개

사람마다 다를 수 있지만 기존 기계 학습 단계에는 다음이 포함됩니다.

  1. 데이터 수집
  2. 데이터 탐색
  3. 데이터 준비
  4. 특성 엔지니어링
  5. 선택
  6. 모델 교육
  7. 초매개변수 튜닝
  8. 예측

머신러닝 모델을 구축할 때 8단계가 별 것 아닌 것처럼 보일 수도 있지만, 위의 단계부터 시작하면 완벽해지는 데 꽤 오랜 시간이 걸립니다!

전문이 아닌 기계 학습 실무자가 처음으로 이러한 단계를 수행하면 문제가 더욱 악화됩니다. 프로세스를 완료하는 데 더 많은 시간과 리소스가 소요되는 경우가 많으며, 심지어 최종 결과가 예상과 다를 수도 있습니다.

AutoML은 전문가와 비전문가 모두를 위한 모델 생성 프로세스의 대부분을 자동화하여 유용합니다.

자동 기계 학습(AutoML)이란 무엇인가요?

AutoML이라고도 불리는 자동화된 기계 학습을 사용하면 기계 학습이 더 쉬워집니다. AutoML을 사용하면 특정 프레임워크에서 수행되는 자동화된 처리를 통해 머신러닝 전문가가 아닌 사람도 머신러닝에 더 쉽게 접근할 수 있습니다.

인공지능 연구를 가속화하고 기계 학습 모델의 효율성을 높이는 데 중점을 둡니다.

기존 기계 학습 프로세스는 앞서 언급한 8단계 모두에 초점을 맞추는 반면 AutoML은 두 단계를 다룹니다.

  1. 데이터 수집은 사용된 데이터를 데이터 웨어하우스에 저장하기 전에 수집, 필터링, 정리하는 프로세스입니다.
  2. 예측은 특정 모델에서 반환된 실제 출력을 나타내며, 훈련된 모델은 정확한 최종 예측을 반환할 가능성이 높습니다.

데이터 탐색, 데이터 준비, 기능 엔지니어링, 모델 선택, 모델 교육 및 최종 모델 조정의 프레임워크는 나머지 6단계를 다룹니다.

AutoML의 장점

  • 생산성 향상
  • 더 나은 최종 결과
  • 오류 최소화
  • 확장된 기계 학습

인기 있는 AutoML 프레임워크

이제 AutoML이 무엇인지 논의하고 장점 중 일부를 이해했으므로 상위 10개 AutoML 프레임워크를 소개하고 해당 프레임워크를 찾을 수 있는 위치와 제공되는 기능을 소개합니다.

1. Google AutoML

Google AutoML은 사용 가능한 가장 유명한 프레임워크 중 하나이며 목록에서 1위를 차지합니다. Google은 Google AutoML 비전, Google AutoML Natural Language 등과 같은 많은 AutoML 프레임워크를 출시했습니다.

2. 자동 SKLearn

이전에 머신러닝을 접해본 사용자라면 SKlearn이라는 이름이 익숙할 것입니다. 인기 있는 sci-kit-learn 라이브러리의 추가 기능인 Auto SKLearn은 기계 학습 작업 자동화를 처리하는 오픈 소스 기계 학습 프레임워크입니다.

Auto Sklearn 프레임워크는 Auto SKlearn 프레임워크의 고유한 기능인 모델 선택, 하이퍼 매개변수 조정 및 특성화를 수행할 수 있습니다.

Auto SKlearn은 모델 선택을 통해 사용자가 제시한 문제를 처리할 수 있는 최상의 알고리즘을 자동으로 검색합니다.

Auto SKlearn의 두 번째 기능으로 넘어가면 하이퍼파라미터 튜닝이 있습니다. 머신러닝 또는 딥러닝 모델의 마지막 단계 중 하나로 사용자는 결과를 최적화하기 위한 최상의 모델 매개변수를 찾아야 합니다. 이 작업에는 많은 시간이 필요하며 이러한 프레임워크를 통해 쉽게 자동화할 수 있습니다.

Auto SKlearn 사용의 독특하고 궁극적인 이점은 자동 특성화를 수행하는 능력입니다. Representation은 원시 데이터를 사용 가능한 정보로 변환하는 프로세스입니다.

3.TPot

TPOT은 트리 파이프라인 최적화 도구라고도 알려져 있으며, 최초의 Python 오픈 소스 autoML 소프트웨어 패키지 중 하나입니다. 유전 프로그래밍을 사용하여 기계 학습 파이프라인을 최적화하는 데 중점을 둡니다.

TPOT의 주요 목표는 파이프라인의 유연한 표현 트리 표현을 유전 프로그래밍과 같은 확률적 검색 알고리즘과 결합하여 ML 파이프라인을 자동으로 구축하는 것입니다.

TPOT은 먼저 설치해야 하는 sci-kit-learn 라이브러리 위에서 작동한다는 점에 유의하세요.

4.AutoKeras

AutoKeras는 원래 DATA Labs에서 개발한 AutoML 및 딥 러닝 모델용으로 구축된 오픈 소스 라이브러리입니다.

Auto Keras는 비전문가 기계 및 딥 러닝 애호가가 최소한의 노력으로 모델을 실행하고 훈련할 수 있도록 도와줍니다. Auto Keras는 모든 사람이 기계 학습에 접근할 수 있도록 하는 것을 목표로 하며 초보자에게 훌륭한 도구입니다

5. Ludwig

Ludwig은 주로 간단한 구성 파일 시스템을 사용하여 딥 러닝 모델을 조립하고 교육하는 데 중점을 둔 오픈 소스 autoML 프레임워크입니다.

사용자가 특정 모델의 입력과 출력 및 해당 데이터 유형을 정의하는 구성 파일을 제공함으로써 Ludwig 프레임워크는 이 데이터를 활용하여 앞서 언급한 속성을 기반으로 딥 러닝 모델을 구축합니다.

6. MLBOX

MLBOX는 최고의 자동화 기계 학습 프레임워크 도구 중 하나로 빠르게 성장하고 있습니다.

MLBOX 공식 문서에 따르면 다음과 같은 이점을 제공합니다.

  • 빠른 읽기 및 분산 데이터 전처리/정리/포맷.
  • 매우 강력한 기능 선택 및 누출 감지.
  • 고차원 공간에서 정밀한 하이퍼파라미터 최적화.
  • 최첨단 분류 및 회귀 예측 모델(딥 러닝, 스태킹, LightGBM 등).
  • 모델 설명을 사용하여 예측하세요.

7. AutoGloun

AutoGloun은 전문가 및 비전문가 기계 학습 실무자를 위한 것으로, 이미지, 텍스트 및 표 형식 데이터 전반에 걸친 자동화 스택 통합, 딥 러닝 및 실제 애플리케이션에 중점을 둡니다.

AutoGloun 온라인 문서에 따르면 AutoGLoun을 통해 사용자는 다음을 수행할 수 있습니다.

  • 단 몇 줄의 코드만으로 원시 데이터에 대한 딥 러닝 및 기존 ML 솔루션의 프로토타입을 빠르게 제작할 수 있습니다.
  • 전문 지식 없이도 (해당하는 경우) 최첨단 기술을 자동으로 활용합니다.
  • 자동 초매개변수 조정, 모델 선택/통합, 아키텍처 검색 및 데이터 처리를 활용합니다.
  • 사용자 지정 모델 및 데이터 파이프라인을 쉽게 개선/조정하거나 특정 사용 사례에 맞게 AutoGluon을 사용자 지정할 수 있습니다.

8. Microsoft Neural Network Intelligence(NNI)

Microsoft Neural Network Intelligence(NNI라고도 함)는 딥 러닝을 위한 기능 엔지니어링, 신경 아키텍처 검색, 하이퍼 매개 변수 조정 및 모델 압축을 자동화하도록 설계된 도구 키트입니다.

NNI 도구는 PyTorch, TensorFlow, Scikit-learn, XGBoost, LightGBM 및 기타 프레임워크를 지원합니다. Microsoft Neural Network 사용의 주요 이점은 신경 아키텍처 검색이며, NNI 도구는 다중 추적(그리드 검색, 정규화된 진화, 정책 기반 IRL 등) 및 원샷(DARTS, ENAS FBNet 등) 신경 아키텍처 검색을 지원합니다. .

이 도구는 베이지안 최적화, 완전 검색, 휴리스틱 검색 등 다양한 하이퍼파라미터 튜닝 알고리즘을 제공합니다. 이 도구가 제공하는 다른 기능에 대해 자세히 알아보려면 Github에서 NNI의 Readme 파일을 확인하세요.

9. TransmogrifAI

TransmogrifAI는 개발자가 기계 학습 생산성을 높일 수 있도록 설계되었습니다. TransmogrifAI는 Apache Spark에서 실행됩니다.

Transmogrif의 Github 추가 정보에서 간략하게 언급했듯이 "자동화를 통해 수동으로 조정된 모델에 가까운 정확도를 거의 100배 더 짧은 시간에 달성할 수 있습니다."

언급된 다른 autoML 프레임워크와 동일 마찬가지로 TransmogrifAI 도구 사용자가 선택한 데이터세트에 가장 적합한 알고리즘을 선택할 수 있습니다.

10. H2O 자동 기계 학습

H2O autoML은 H2O에서 만든 오픈 소스 프레임워크 도구이며 R 및 Python 프로그래밍을 모두 지원합니다.

그라디언트 부스팅 머신, 일반화 선형 모델, 딥러닝 등 가장 널리 사용되는 통계 및 머신러닝 알고리즘도 지원합니다.

H2O autoML 인터페이스는 가능한 한 적은 매개변수를 요구하여 새로운 기계 학습 사용자를 수용합니다. H2O 도구를 사용할 때 사용자의 주요 작업은 데이터 세트를 제공하는 것입니다.

기타 유용한 AutoML 도구

1. Hypertunity

Hypertunity는 경량 패키지를 사용하여 모델의 특정 하이퍼 매개변수를 최적화하도록 설계된 경량 도구입니다. 모듈형이고 단순하며 확장 가능하므로 원활한 일정 관리 구현이 가능합니다.

Hypertunity는 GPyOpt, Slurm 호환 스케줄러를 사용한 베이지안 최적화 및 Tensorboard를 사용한 실시간 시각화(HParams 플러그인을 통해)를 지원합니다.

2. Dragonfly

Dragonfly는 확장 가능한 베이지안 최적화를 위해 설계된 오픈 소스 autoML 도구입니다.

베이지안 최적화는 일반적인 최적화를 넘어서 매우 비용이 많이 드는 블랙박스 기능을 평가하는 데 사용됩니다.

Dragonfly를 사용하면 신규 사용자가 최소한의 지식으로 확장 가능한 베이지안 최적화 오류를 해결할 수 있습니다.

3. Ray Tune

두 번째 하이퍼파라미터 최적화 도구인 Ray Tune은 AI 및 Python 애플리케이션 확장을 위한 통합 프레임워크입니다.

분산 데이터 처리, 분산 훈련, 확장 가능한 하이퍼파라미터 튜닝, 확장 가능한 강화 학습, 확장 가능한 프로그래밍 가능 서비스를 통해 간단한 AI 워크로드 확장을 가능하게 합니다.

4. 자동 그래프 학습

자동 그래프 학습은 매우 쉽고 간단하게 그래프 데이터 세트의 기계 학습에 중점을 둔 독특한 autoML 프레임워크입니다.

Pytorch 기하학 또는 Deep Graph 라이브러리의 데이터 세트를 기반으로 그래프 기반 기계 학습을 위한 데이터 세트를 유지하기 위해 데이터 세트를 사용합니다.

자동화된 머신러닝을 위한 GitHub 리포지토리

머신러닝과 딥러닝 분야의 발전으로 머신러닝 전문가에 대한 수요가 눈에 띄게 늘어났습니다.

여기서 기계 학습 도구 및 기술을 사용한 자동화가 이루어지며, 이를 통해 신규 사용자는 그 어느 때보다 더 쉽게 완전한 기능을 갖추고 고도로 최적화된 모델을 구축할 수 있습니다.

간단히 말하면, 완벽한 자동화된 기계 학습 도구를 찾을 때는 주어진 모델을 통해 달성하려는 목표와 자동화하려는 기계 학습 프로세스의 정확한 부분에 집중해야 합니다. 위의 여러 autoML 도구를 직접 사용해 보고 효율적이고 사용하기 쉬운 도구만 사용하는 것이 좋습니다.

위 내용은 AutoML용 GitHub 저장소 10개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제