本教學示範了一個使用 Python 和 LogisticRegression 演算法來預測心臟病發作可能性的機器學習專案。 對源自 Kaggle 的資料集進行分析以建立預測模型。
StandardScaler
(sklearn.預處理)fit_transform()
train_test_split()
model.predict()
model.predict_proba()
classification_report()
roc_auc_score()
此計畫旨在說明邏輯迴歸在根據患者資料預測心臟病發作風險的實際應用。 我們將利用 Python 的功能來建立和評估這個預測模型。
Jupyter Notebook 和資料集可在此處取得:
筆記本:https://www.php.cn/link/aa3f874fb850d8908be9af3a69af4289
資料集:https://www.php.cn/link/4223a1d5b9e017dda51515829140e5d2(Kaggle來源: https://www.php.cn/link/5bb77e5c6d452aee283844d47756dc05)
未來的教程將探索其他機器學習概念,重點關注監督和無監督學習,如Kaggle 路線圖所述:https://www.php.cn/link/4bea9e07f447fd088811cc81697a4d4e [#機器學習工程師2025 年路線圖]
本教學是為對學習機器學習感興趣的 Python 愛好者,特別是該領域的新手而設計的。 它建立在之前涵蓋線性迴歸的教程的基礎上。
隨意嘗試筆記本並探索不同的機器學習模型!
<code class="language-python">import pandas as pd data = pd.read_csv('heart-disease-prediction.csv') print(data.head())</code>
這使用 pandas 載入資料集。
<code class="language-python">print(data.info())</code>
這提供了資料集結構和資料類型的摘要。
<code class="language-python">print(data.isnull().sum()) data.fillna(data.mean(), inplace=True) print(data.isnull().sum())</code>
使用每列的平均值來識別和填充缺失值。
<code class="language-python">X = data[['age', 'totChol','sysBP','diaBP', 'cigsPerDay','BMI','glucose']] y = data['TenYearCHD']</code>
選擇相關特徵 (X) 和目標變數 (y)。
<code class="language-python">from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X = scaler.fit_transform(X)</code>
使用 StandardScaler
對資料進行標準化,以提高模型效能。
<code class="language-python">import pandas as pd data = pd.read_csv('heart-disease-prediction.csv') print(data.head())</code>
資料集分為訓練集和測試集(80/20 分割)。
<code class="language-python">print(data.info())</code>
使用訓練資料訓練邏輯迴歸模型。
<code class="language-python">print(data.isnull().sum()) data.fillna(data.mean(), inplace=True) print(data.isnull().sum())</code>
使用 classification_report
和 roc_auc_score
評估模型的表現。
<code class="language-python">X = data[['age', 'totChol','sysBP','diaBP', 'cigsPerDay','BMI','glucose']] y = data['TenYearCHD']</code>
經過訓練的模型用於預測新患者心臟病的風險。
提供額外的病患資料以便進一步練習:
<code class="language-python">from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X = scaler.fit_transform(X)</code>
以上是專案 - 使用 Python 進行監督學習 - 讓我們使用邏輯回歸來預測心臟病發作的機會的詳細內容。更多資訊請關注PHP中文網其他相關文章!