首頁 >後端開發 >Python教學 >Python 2.x 中如何使用scikit-learn模組進行機器學習

Python 2.x 中如何使用scikit-learn模組進行機器學習

WBOY
WBOY原創
2023-07-30 14:09:22892瀏覽

Python 2.x 中如何使用scikit-learn模組進行機器學習

導語:
機器學習是一門研究如何使電腦能夠透過資料學習並改進自身表現的學科。 scikit-learn是一個基於Python的機器學習函式庫,它提供了許多機器學習演算法和工具,使得機器學習變得更加簡單和有效率。

本文將介紹如何在Python 2.x 中使用scikit-learn模組進行機器學習,同時提供範例程式碼。

一、安裝scikit-learn模組
首先,我們需要確保已經安裝了Python 2.x 版本。然後,可以透過pip指令安裝scikit-learn模組:

pip install -U scikit-learn

安裝完成後,就可以開始使用scikit-learn模組進行機器學習了。

二、載入資料集
在機器學習中,我們通常需要載入和處理資料集。 scikit-learn提供了許多內建的資料集,可以直接使用。以下以鳶尾花資料集為例進行示範:

from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target

上述程式碼中,我們使用load_iris()函數載入了鳶尾花資料集,然後將資料集中的輸入資料儲存在變數X中,將對應的標籤儲存在變數y

三、分割資料集
在訓練機器學習模型之前,我們需要將資料集分成訓練集和測試集。 scikit-learn提供了train_test_split函數來實現資料集的分割。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

上述程式碼中,我們將資料集分成訓練集和測試集,其中test_size=0.2表示測試集的比例為20%,random_state=42表示隨機種子,以確保每次劃分結果的一致性。

四、選擇模型
在機器學習中,我們可以選擇不同的模型來訓練我們的資料集。在scikit-learn中,每個模型都有對應的類,我們可以透過建立模型類的實例來選擇不同的模型。

以支援向量機(SVM)為例,使用SVC類別來建立一個SVM模型的實例:

from sklearn.svm import SVC
model = SVC()

五、訓練模型
一旦選擇了模型,我們就可以使用訓練資料集對模型進行訓練。

model.fit(X_train, y_train)

在上述程式碼中,我們使用fit方法對模型進行訓練,將訓練資料集X_train和對應的標籤y_train作為輸入。

六、模型評估
在訓練完成後,我們需要使用測試資料集來評估模型的效能。

score = model.score(X_test, y_test)
print("模型准确率:", score)

上述程式碼中,我們使用score方法計算模型在測試資料集上的準確率,並輸出評估結果。

七、模型預測
最後,我們可以使用訓練好的模型來進行預測。

y_pred = model.predict(X_test)
print("预测结果:", y_pred)

在上述程式碼中,我們使用predict方法對測試資料集進行預測,並輸出預測結果。

總結:
透過本文的介紹,我們了解到如何在Python 2.x 中使用scikit-learn模組進行機器學習。我們學習了載入資料集、劃分資料集、選擇模型、訓練模型、模型評估和模型預測等基本步驟,並給出了相應的程式碼範例。

希望這篇文章對你在學習機器學習以及使用scikit-learn模組時有所幫助。祝你學習進步,掌握機器學習的技巧!

以上是Python 2.x 中如何使用scikit-learn模組進行機器學習的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn