本教學示範了一個使用 Python 和 LogisticRegression 演算法來預測心臟病發作可能性的機器學習專案。 對源自 Kaggle 的資料集進行分析以建立預測模型。
關鍵概念:
- 邏輯迴歸
-
StandardScaler
(sklearn.預處理) fit_transform()
train_test_split()
model.predict()
model.predict_proba()
classification_report()
roc_auc_score()
專案目標:
此計畫旨在說明邏輯迴歸在根據患者資料預測心臟病發作風險的實際應用。 我們將利用 Python 的功能來建立和評估這個預測模型。
Jupyter Notebook 和資料集可在此處取得:
筆記本:https://www.php.cn/link/aa3f874fb850d8908be9af3a69af4289
資料集:https://www.php.cn/link/4223a1d5b9e017dda51515829140e5d2(Kaggle來源: https://www.php.cn/link/5bb77e5c6d452aee283844d47756dc05)
未來計畫:
未來的教程將探索其他機器學習概念,重點關注監督和無監督學習,如Kaggle 路線圖所述:https://www.php.cn/link/4bea9e07f447fd088811cc81697a4d4e [#機器學習工程師2025 年路線圖]
目標受眾:
本教學是為對學習機器學習感興趣的 Python 愛好者,特別是該領域的新手而設計的。 它建立在之前涵蓋線性迴歸的教程的基礎上。
隨意嘗試筆記本並探索不同的機器學習模型!
逐步指南:
第 1 步:資料載入
import pandas as pd data = pd.read_csv('heart-disease-prediction.csv') print(data.head())
這使用 pandas 載入資料集。
第 2 步:探索性資料分析 (EDA)
print(data.info())
這提供了資料集結構和資料類型的摘要。
第 3 步:處理缺失資料
print(data.isnull().sum()) data.fillna(data.mean(), inplace=True) print(data.isnull().sum())
使用每列的平均值來識別和填充缺失值。
第四步:資料預處理
X = data[['age', 'totChol','sysBP','diaBP', 'cigsPerDay','BMI','glucose']] y = data['TenYearCHD']
選擇相關特徵 (X) 和目標變數 (y)。
第 5 步:資料標準化
from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X = scaler.fit_transform(X)
使用 StandardScaler
對資料進行標準化,以提高模型效能。
第 6 步:資料分割
import pandas as pd data = pd.read_csv('heart-disease-prediction.csv') print(data.head())
資料集分為訓練集和測試集(80/20 分割)。
第七步:模型訓練
print(data.info())
使用訓練資料訓練邏輯迴歸模型。
第8步:模型評估
print(data.isnull().sum()) data.fillna(data.mean(), inplace=True) print(data.isnull().sum())
使用 classification_report
和 roc_auc_score
評估模型的表現。
第9步:模型預測
X = data[['age', 'totChol','sysBP','diaBP', 'cigsPerDay','BMI','glucose']] y = data['TenYearCHD']
經過訓練的模型用於預測新患者心臟病的風險。
提供額外的病患資料以便進一步練習:
from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X = scaler.fit_transform(X)
以上是專案 - 使用 Python 進行監督學習 - 讓我們使用邏輯回歸來預測心臟病發作的機會的詳細內容。更多資訊請關注PHP中文網其他相關文章!

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

兩小時內可以學到Python的基礎知識。 1.學習變量和數據類型,2.掌握控制結構如if語句和循環,3.了解函數的定義和使用。這些將幫助你開始編寫簡單的Python程序。

如何在10小時內教計算機小白編程基礎?如果你只有10個小時來教計算機小白一些編程知識,你會選擇教些什麼�...

使用FiddlerEverywhere進行中間人讀取時如何避免被檢測到當你使用FiddlerEverywhere...

Python3.6環境下加載Pickle文件報錯:ModuleNotFoundError:Nomodulenamed...

如何解決jieba分詞在景區評論分析中的問題?當我們在進行景區評論分析時,往往會使用jieba分詞工具來處理文�...

如何使用正則表達式匹配到第一個閉合標籤就停止?在處理HTML或其他標記語言時,常常需要使用正則表達式來�...


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

SublimeText3漢化版
中文版,非常好用

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。