>기술 주변기기 >일체 포함 >LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!

LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!

王林
王林앞으로
2023-04-06 20:45:071557검색

이 문서에서는 LazyPredict를 사용하여 간단한 ML 모델을 만드는 방법을 설명합니다. LazyPredict의 머신러닝 모델 생성의 특징은 많은 코드가 필요하지 않음과 동시에 매개변수 수정 없이 여러 모델을 맞출 수 있어 많은 모델 중에서 가장 성능이 좋은 모델을 선택할 수 있다는 점입니다.

요약

이 문서에서는 LazyPredict를 사용하여 간단한 ML 모델을 만드는 방법을 설명합니다. LazyPredict의 머신러닝 모델 생성의 특징은 많은 코드가 필요하지 않고 매개변수 수정 없이 다중 모델 피팅을 수행할 수 있어 많은 모델 중에서 가장 성능이 좋은 모델을 선택할 수 있다는 점입니다.

LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!

이 문서에는 다음 내용이 포함되어 있습니다.

  • 소개
  • LazyPredict 모듈 설치
  • 분류 모델에서 LazyPredict 구현
  • 회귀 모델에서 구현
  • 요약

소개

LazyPredict는 가장 유명한 것으로 알려져 있습니다. Python 소프트웨어 패키지의 발전은 기계 학습 모델 개발 방식에 혁명을 일으키고 있습니다. LazyPredict를 사용하면 거의 코딩하지 않고도 다양한 기본 모델을 빠르게 생성할 수 있으므로 데이터에 가장 적합한 모델을 선택할 수 있는 시간이 확보됩니다.

LazyPredict의 가장 큰 장점은 모델의 광범위한 매개변수 조정 없이 모델 선택을 더 쉽게 한다는 것입니다. LazyPredict는 데이터에 가장 적합한 모델을 찾아 맞추는 빠르고 효율적인 방법을 제공합니다.

다음으로, 이 기사를 통해 LazyPredict의 사용법에 대해 자세히 알아보고 알아보겠습니다.

LazyPredict 모듈 설치

LazyPredict 라이브러리 설치는 매우 간단한 작업입니다. 다른 Python 라이브러리를 설치하는 것과 마찬가지로 코드 한 줄만큼 쉽습니다.

!pip install lazypredict

분류 모델에서 LazyPredict 구현

이 예에서는 Sklearn 패키지의 유방암 데이터 세트를 활용합니다.

이제 데이터를 로드해 보겠습니다.

from sklearn.datasets import load_breast_cancer
from lazypredict.Supervised import LazyClassifier

data = load_breast_cancer()
X = data.data
y= data.target

최고의 분류기 모델을 선택하기 위해 이제 "LazyClassifier" 알고리즘을 배포해 보겠습니다. 이러한 특성과 입력 매개변수는 이 클래스에 적합합니다.

LazyClassifier(
verbose=0,
ignore_warnings=True,
custom_metric=None,
predictions=False,
random_state=42,
classifiers='all',
)

그런 다음 로드된 데이터에 모델을 적용하고 피팅합니다.

from lazypredict.Supervised import LazyClassifier
from sklearn.model_selection import train_test_split

# split the data
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0)

# build the lazyclassifier
clf = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None)

# fit it
models, predictions = clf.fit(X_train, X_test, y_train, y_test)

# print the best models
print(models)

위 코드를 실행하면 다음과 같은 결과를 얻습니다.


LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!


LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!

그러면 다음 작업을 수행하여 모델의 세부 정보를 볼 수 있습니다.

model_dictionary = clf.provide_models(X_train,X_test,y_train,y_test)

다음으로 자세한 걸음 정보를 표시할 모델 이름을 설정해주세요.

model_dictionary['LGBMClassifier']


LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!

여기서 전체 데이터 세트에 SimpleImputer가 사용되고 숫자 기능에 StandardScaler가 사용되는 것을 볼 수 있습니다. 이 데이터 세트에는 범주형 또는 순서형 기능이 없지만, 있는 경우 OneHotEncoder 및 OrdinalEncoder가 각각 사용됩니다. LGBMClassifier 모델은 변환 및 분류 후 데이터를 수신합니다.

LazyClassifier의 내부 기계 학습 모델은 평가 및 피팅을 위해 sci-kit-learn 도구 상자를 사용합니다. LazyClassifier 함수가 호출되면 의사결정 트리, 랜덤 포레스트, 지원 벡터 머신 등을 포함하여 데이터에 다양한 모델을 자동으로 구축하고 적용합니다. 정밀도, 재현율, F1 점수 등 사용자가 제공하는 성능 지표 세트는 이러한 모델을 평가하는 데 사용됩니다. 학습 세트는 피팅에 사용되고 테스트 세트는 평가에 사용됩니다.

모델을 평가하고 피팅한 후 LazyClassifier는 평가 결과 요약(위 표 참조)과 상위 모델 목록 및 각 모델에 대한 성능 지표를 제공합니다. 수동으로 모델을 조정하거나 선택할 필요가 없으므로 여러 모델의 성능을 빠르고 쉽게 평가하고 데이터에 가장 적합한 모델을 선택할 수 있습니다.

회귀 모델에서 LazyPredict 구현

"LazyRegressor" 기능을 사용하면 회귀 모델에 대해 동일한 작업을 다시 수행할 수 있습니다. 회귀 작업에 적합한 데이터 세트를 가져옵니다(Boston 데이터 세트 사용).

이제 LazyRegressor를 사용하여 데이터를 피팅해 보겠습니다.

from lazypredict.Supervised import LazyRegressor
from sklearn import datasets
from sklearn.utils import shuffle
import numpy as np

# load the data
boston = datasets.load_boston()
X, y = shuffle(boston.data, boston.target, random_state=0)
X = X.astype(np.float32)

# split the data
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0)

# fit the lazy object
reg = LazyRegressor(verbose=0, ignore_warnings=False, custom_metric=None)
models, predictions = reg.fit(X_train, X_test, y_train, y_test)

# print the results in a table
print(models)

코드 실행 결과는 다음과 같습니다.


LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!

以下是对最佳回归模型的详细描述:

model_dictionary = reg.provide_models(X_train,X_test,y_train,y_test)
model_dictionary['ExtraTreesRegressor']


LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!

这里可以看到SimpleImputer被用于整个数据集,然后是StandardScaler用于数字特征。这个数据集中没有分类或序数特征,但如果有的话,会分别使用OneHotEncoder和OrdinalEncoder。ExtraTreesRegressor模型接收了转换和归类后的数据。

结论

LazyPredict库对于任何从事机器学习行业的人来说都是一种有用的资源。LazyPredict通过自动创建和评估模型的过程来节省选择模型的时间和精力,这大大提高了模型选择过程的有效性。LazyPredict提供了一种快速而简单的方法来比较几个模型的有效性,并确定哪个模型系列最适合我们的数据和问题,因为它能够同时拟合和评估众多模型。

阅读本文之后希望你现在对LazyPredict库有了直观的了解,这些概念将帮助你建立一些真正有价值的项目。

译者介绍

崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。

原文标题:LazyPredict: A Utilitarian Python Library to Shortlist the Best ML Models for a Given Use Case,作者:Sanjay Kumar

위 내용은 LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제