이 문서에서는 LazyPredict를 사용하여 간단한 ML 모델을 만드는 방법을 설명합니다. LazyPredict의 머신러닝 모델 생성의 특징은 많은 코드가 필요하지 않음과 동시에 매개변수 수정 없이 여러 모델을 맞출 수 있어 많은 모델 중에서 가장 성능이 좋은 모델을 선택할 수 있다는 점입니다.
이 문서에서는 LazyPredict를 사용하여 간단한 ML 모델을 만드는 방법을 설명합니다. LazyPredict의 머신러닝 모델 생성의 특징은 많은 코드가 필요하지 않고 매개변수 수정 없이 다중 모델 피팅을 수행할 수 있어 많은 모델 중에서 가장 성능이 좋은 모델을 선택할 수 있다는 점입니다.
이 문서에는 다음 내용이 포함되어 있습니다.
LazyPredict는 가장 유명한 것으로 알려져 있습니다. Python 소프트웨어 패키지의 발전은 기계 학습 모델 개발 방식에 혁명을 일으키고 있습니다. LazyPredict를 사용하면 거의 코딩하지 않고도 다양한 기본 모델을 빠르게 생성할 수 있으므로 데이터에 가장 적합한 모델을 선택할 수 있는 시간이 확보됩니다.
LazyPredict의 가장 큰 장점은 모델의 광범위한 매개변수 조정 없이 모델 선택을 더 쉽게 한다는 것입니다. LazyPredict는 데이터에 가장 적합한 모델을 찾아 맞추는 빠르고 효율적인 방법을 제공합니다.
다음으로, 이 기사를 통해 LazyPredict의 사용법에 대해 자세히 알아보고 알아보겠습니다.
LazyPredict 라이브러리 설치는 매우 간단한 작업입니다. 다른 Python 라이브러리를 설치하는 것과 마찬가지로 코드 한 줄만큼 쉽습니다.
!pip install lazypredict
이 예에서는 Sklearn 패키지의 유방암 데이터 세트를 활용합니다.
이제 데이터를 로드해 보겠습니다.
from sklearn.datasets import load_breast_cancer from lazypredict.Supervised import LazyClassifier data = load_breast_cancer() X = data.data y= data.target
최고의 분류기 모델을 선택하기 위해 이제 "LazyClassifier" 알고리즘을 배포해 보겠습니다. 이러한 특성과 입력 매개변수는 이 클래스에 적합합니다.
LazyClassifier( verbose=0, ignore_warnings=True, custom_metric=None, predictions=False, random_state=42, classifiers='all', )
그런 다음 로드된 데이터에 모델을 적용하고 피팅합니다.
from lazypredict.Supervised import LazyClassifier from sklearn.model_selection import train_test_split # split the data X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0) # build the lazyclassifier clf = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None) # fit it models, predictions = clf.fit(X_train, X_test, y_train, y_test) # print the best models print(models)
위 코드를 실행하면 다음과 같은 결과를 얻습니다.
그러면 다음 작업을 수행하여 모델의 세부 정보를 볼 수 있습니다.
model_dictionary = clf.provide_models(X_train,X_test,y_train,y_test)
다음으로 자세한 걸음 정보를 표시할 모델 이름을 설정해주세요.
model_dictionary['LGBMClassifier']
여기서 전체 데이터 세트에 SimpleImputer가 사용되고 숫자 기능에 StandardScaler가 사용되는 것을 볼 수 있습니다. 이 데이터 세트에는 범주형 또는 순서형 기능이 없지만, 있는 경우 OneHotEncoder 및 OrdinalEncoder가 각각 사용됩니다. LGBMClassifier 모델은 변환 및 분류 후 데이터를 수신합니다.
LazyClassifier의 내부 기계 학습 모델은 평가 및 피팅을 위해 sci-kit-learn 도구 상자를 사용합니다. LazyClassifier 함수가 호출되면 의사결정 트리, 랜덤 포레스트, 지원 벡터 머신 등을 포함하여 데이터에 다양한 모델을 자동으로 구축하고 적용합니다. 정밀도, 재현율, F1 점수 등 사용자가 제공하는 성능 지표 세트는 이러한 모델을 평가하는 데 사용됩니다. 학습 세트는 피팅에 사용되고 테스트 세트는 평가에 사용됩니다.
모델을 평가하고 피팅한 후 LazyClassifier는 평가 결과 요약(위 표 참조)과 상위 모델 목록 및 각 모델에 대한 성능 지표를 제공합니다. 수동으로 모델을 조정하거나 선택할 필요가 없으므로 여러 모델의 성능을 빠르고 쉽게 평가하고 데이터에 가장 적합한 모델을 선택할 수 있습니다.
"LazyRegressor" 기능을 사용하면 회귀 모델에 대해 동일한 작업을 다시 수행할 수 있습니다. 회귀 작업에 적합한 데이터 세트를 가져옵니다(Boston 데이터 세트 사용).
이제 LazyRegressor를 사용하여 데이터를 피팅해 보겠습니다.
from lazypredict.Supervised import LazyRegressor from sklearn import datasets from sklearn.utils import shuffle import numpy as np # load the data boston = datasets.load_boston() X, y = shuffle(boston.data, boston.target, random_state=0) X = X.astype(np.float32) # split the data X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0) # fit the lazy object reg = LazyRegressor(verbose=0, ignore_warnings=False, custom_metric=None) models, predictions = reg.fit(X_train, X_test, y_train, y_test) # print the results in a table print(models)
코드 실행 결과는 다음과 같습니다.
以下是对最佳回归模型的详细描述:
model_dictionary = reg.provide_models(X_train,X_test,y_train,y_test) model_dictionary['ExtraTreesRegressor']
这里可以看到SimpleImputer被用于整个数据集,然后是StandardScaler用于数字特征。这个数据集中没有分类或序数特征,但如果有的话,会分别使用OneHotEncoder和OrdinalEncoder。ExtraTreesRegressor模型接收了转换和归类后的数据。
LazyPredict库对于任何从事机器学习行业的人来说都是一种有用的资源。LazyPredict通过自动创建和评估模型的过程来节省选择模型的时间和精力,这大大提高了模型选择过程的有效性。LazyPredict提供了一种快速而简单的方法来比较几个模型的有效性,并确定哪个模型系列最适合我们的数据和问题,因为它能够同时拟合和评估众多模型。
阅读本文之后希望你现在对LazyPredict库有了直观的了解,这些概念将帮助你建立一些真正有价值的项目。
崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。
原文标题:LazyPredict: A Utilitarian Python Library to Shortlist the Best ML Models for a Given Use Case,作者:Sanjay Kumar
위 내용은 LazyPredict: 귀하에게 가장 적합한 ML 모델을 선택하세요!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!