ホームページ  >  記事  >  バックエンド開発  >  Python で多重線形回帰モデルを実装する方法の詳細な説明

Python で多重線形回帰モデルを実装する方法の詳細な説明

WBOY
WBOY転載
2024-01-24 09:27:061729ブラウズ

Python で多重線形回帰モデルを実装する方法の詳細な説明

重線形回帰は、データ分析と機械学習で広く使用されている統計モデルです。複数の独立変数を使用して、1 つ以上の従属変数の値を予測します。 Python では、NumPy、Pandas、Scikit-Learn など、さまざまなライブラリやフレームワークを使用して複数の線形回帰モデルを実装できます。

以下では、Scikit-Learn ライブラリを使用して、住宅価格を予測する重線形回帰モデルを構築します。この例では、House Price データセットのデータを使用します。データセットには、506 のサンプルと、都市犯罪率、家の平均部屋数、家の築年数などを含む 13 の独立変数が含まれています。

まず、必要なライブラリとデータセットをインポートする必要があります。

import numpy as np
import pandas as pd
from sklearn.datasets import load_boston

boston = load_boston()
X = pd.DataFrame(boston.data, columns=boston.feature_names)
y = pd.DataFrame(boston.target, columns=['MEDV'])

ここでは、Pandas ライブラリを使用してデータセットを DataFrame オブジェクトにロードし、独立した従属変数はそれぞれ X と y に格納されます。

次に、データ セットをトレーニング セットとテスト セットに分割する必要があります。トレーニング セットはモデルを適合させるために使用され、テスト セットはモデルのパフォーマンスを評価するために使用されます。

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

ここでは、Scikit-Learn ライブラリの train_test_split 関数を使用して、データ セットをトレーニング セットとテスト セットに分割します。 test_size パラメータを使用してテスト セットのサイズを指定し、random_state パラメータを使用してランダム シードを設定して、結果の再現性を確保します。

次に、線形回帰モデルを使用してデータセットを適合させます。

from sklearn.linear_model import LinearRegression

regressor = LinearRegression()
regressor.fit(X_train, y_train)

ここでは、Scikit-Learn ライブラリの LinearRegression クラスを使用して線形回帰モデルを作成し、fit メソッドを使用してトレーニング データを近似します。

これで、モデルを使用してテスト セット内の住宅価格を予測できるようになります。

y_pred = regressor.predict(X_test)

ここでは、predict メソッドを使用してテスト セット内の住宅価格を予測します。

最後に、Scikit-Learn ライブラリのいくつかの評価メトリクスを使用して、モデルのパフォーマンスを評価できます。

from sklearn.metrics import mean_squared_error, r2_score

print('Mean squared error: %.2f' % mean_squared_error(y_test, y_pred))
print('Coefficient of determination: %.2f' % r2_score(y_test, y_pred))

ここでは、mean_squared_error 関数を使用して平均二乗誤差を計算し、r2_score 関数を使用して決定係数を計算します。これらのメトリクスは、モデルのパフォーマンスと精度を理解するのに役立ちます。

つまり、Python を使用して複数の線形回帰モデルを設計するのは非常に簡単です。必要なライブラリとデータセットをインポートし、モデルを適合させ、いくつかの評価指標を使用してモデルのパフォーマンスを評価するだけです。実際のアプリケーションでは、より良い予測結果を得るために、データに対して探索的データ分析、特徴エンジニアリング、モデルの最適化を実行する必要があります。

以上がPython で多重線形回帰モデルを実装する方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は163.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。