>  기사  >  백엔드 개발  >  Python에서 다중 선형 회귀 모델을 구현하는 방법에 대한 자세한 설명

Python에서 다중 선형 회귀 모델을 구현하는 방법에 대한 자세한 설명

WBOY
WBOY앞으로
2024-01-24 09:27:061729검색

Python에서 다중 선형 회귀 모델을 구현하는 방법에 대한 자세한 설명

다중 선형 회귀는 데이터 분석 및 기계 학습에 널리 사용되는 통계 모델입니다. 여러 개의 독립변수를 사용하여 하나 이상의 종속변수의 값을 예측합니다. Python에서는 다양한 라이브러리와 프레임워크를 사용하여 NumPy, Pandas, Scikit-Learn 등과 같은 여러 선형 회귀 모델을 구현할 수 있습니다.

아래에서는 Scikit-Learn 라이브러리를 사용하여 주택 가격을 예측하는 다중 선형 회귀 모델을 구축하겠습니다. 이 예에서는 주택 가격 데이터세트의 데이터를 사용합니다. 데이터 세트에는 506개의 샘플과 도시 범죄율, 주택의 평균 방 수, 주택의 연령 등을 포함한 13개의 독립 변수가 포함되어 있습니다.

먼저 필요한 라이브러리와 데이터 세트를 가져와야 합니다.

import numpy as np
import pandas as pd
from sklearn.datasets import load_boston

boston = load_boston()
X = pd.DataFrame(boston.data, columns=boston.feature_names)
y = pd.DataFrame(boston.target, columns=['MEDV'])

여기에서는 Pandas 라이브러리를 사용하여 데이터 세트를 DataFrame 객체에 로드하고 독립 변수와 종속 변수를 각각 X와 y에 저장합니다.

다음으로 데이터 세트를 훈련 세트와 테스트 세트로 분할해야 합니다. 학습 세트는 모델을 피팅하는 데 사용되고, 테스트 세트는 모델의 성능을 평가하는 데 사용됩니다.

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

여기에서는 Scikit-Learn 라이브러리의 train_test_split 함수를 사용하여 데이터 세트를 훈련 세트와 테스트 세트로 분할합니다. test_size 매개변수를 사용하여 테스트 세트의 크기를 지정하고 결과의 재현성을 보장하기 위해 random_state 매개변수를 사용하여 무작위 시드를 설정합니다.

다음으로 선형 회귀 모델을 사용하여 데이터 세트를 맞출 수 있습니다.

from sklearn.linear_model import LinearRegression

regressor = LinearRegression()
regressor.fit(X_train, y_train)

여기에서는 Scikit-Learn 라이브러리의 LinearRegression 클래스를 사용하여 선형 회귀 모델을 만들고 fit 메서드를 사용하여 훈련 데이터를 맞춥니다.

이제 모델을 사용하여 테스트 세트에서 주택 가격을 예측할 수 있습니다.

y_pred = regressor.predict(X_test)

여기에서는 예측 방법을 사용하여 테스트 세트의 주택 가격을 예측합니다.

마지막으로 Scikit-Learn 라이브러리의 일부 평가 지표를 사용하여 모델 성능을 평가할 수 있습니다.

from sklearn.metrics import mean_squared_error, r2_score

print('Mean squared error: %.2f' % mean_squared_error(y_test, y_pred))
print('Coefficient of determination: %.2f' % r2_score(y_test, y_pred))

여기에서는 평균 제곱 오차를 계산하기 위해 평균_제곱_오류 함수를 사용하고 결정 계수를 계산하기 위해 r2_score 함수를 사용합니다. 이러한 측정항목은 모델의 성능과 정확성을 이해하는 데 도움이 됩니다.

요컨대 Python을 사용하면 다중 선형 회귀 모델 설계가 매우 간단해질 수 있습니다. 필요한 라이브러리와 데이터 세트를 가져오고, 모델을 맞추고, 일부 평가 지표를 사용하여 모델 성능을 평가하면 됩니다. 실제 적용에서는 더 나은 예측 결과를 얻기 위해 데이터에 대한 탐색적 데이터 분석, 기능 엔지니어링 및 모델 최적화를 수행해야 합니다.

위 내용은 Python에서 다중 선형 회귀 모델을 구현하는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 163.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제