프로젝트 - Python을 사용한 지도 학습 - 로지스틱 회귀를 사용하여 심장마비 발생 가능성 예측-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

프로젝트 - Python을 사용한 지도 학습 - 로지스틱 회귀를 사용하여 심장마비 발생 가능성 예측

DDD

Jan 18, 2025 pm 10:14 PM

Project - Supervised Learning with Python - Lets use Logistic Regression for Predicting the chances of having a Heart Attack

이 튜토리얼에서는 Python과 LogisticRegression 알고리즘을 사용하여 심장 마비 가능성을 예측하는 기계 학습 프로젝트를 보여줍니다. Kaggle에서 가져온 데이터 세트를 분석하여 예측 모델을 구축합니다.

주요 개념:

로지스틱 회귀
StandardScaler (sklearn.preprocessing)
fit_transform()
train_test_split()
model.predict()
model.predict_proba()
classification_report()
roc_auc_score()

프로젝트 목표:

이 프로젝트의 목적은 환자 데이터를 기반으로 심장 마비 위험을 예측하는 데 로지스틱 회귀 분석을 실제로 적용하는 방법을 보여주는 것입니다. 우리는 Python의 기능을 활용하여 이 예측 모델을 구축하고 평가할 것입니다.

Jupyter Notebook 및 데이터 세트는 여기에서 확인할 수 있습니다.

노트북: https://www.php.cn/link/aa3f874fb850d8908be9af3a69af4289

데이터 세트: https://www.php.cn/link/4223a1d5b9e017dda51515829140e5d2(Kaggle 출처: https://www.php.cn/link/5bb77e5c6d452aee283844d47756dc05)

향후 계획:

향후 튜토리얼에서는 Kaggle 로드맵 https://www.php.cn/link/4bea9e07f447fd088811cc81697a4d4e에 설명된 대로 지도 및 비지도 학습에 초점을 맞춘 추가 기계 학습 개념을 탐구할 것입니다. [#Machine Learning Engineer 2025년 로드맵]

대상:

이 튜토리얼은 기계 학습 학습에 관심이 있는 Python 애호가, 특히 해당 분야에 처음 입문하는 사람들을 위해 제작되었습니다. 선형 회귀를 다루는 이전 튜토리얼을 기반으로 합니다.

노트북을 자유롭게 실험하고 다양한 기계 학습 모델을 탐색해 보세요!

단계별 가이드:

1단계: 데이터 로딩

import pandas as pd

data = pd.read_csv('heart-disease-prediction.csv')
print(data.head())

Pandas를 사용하여 데이터세트를 로드합니다.

2단계: 탐색적 데이터 분석(EDA)

print(data.info())

데이터세트의 구조와 데이터 유형에 대한 요약을 제공합니다.

3단계: 누락된 데이터 처리

print(data.isnull().sum())
data.fillna(data.mean(), inplace=True)
print(data.isnull().sum())

각 열의 평균을 사용하여 누락된 값을 식별하고 채웁니다.

4단계: 데이터 전처리

X = data[['age', 'totChol','sysBP','diaBP', 'cigsPerDay','BMI','glucose']]
y = data['TenYearCHD']

관련 특성(X)과 대상 변수(y)를 선택했습니다.

5단계: 데이터 정규화

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)

모델 성능 향상을 위해 StandardScaler을 사용하여 데이터를 정규화합니다.

6단계: 데이터 분할

import pandas as pd

data = pd.read_csv('heart-disease-prediction.csv')
print(data.head())

데이터 세트는 훈련 세트와 테스트 세트로 분할됩니다(80/20 분할).

7단계: 모델 훈련

print(data.info())

학습 데이터를 사용하여 로지스틱 회귀 모델을 학습합니다.

8단계: 모델 평가

print(data.isnull().sum())
data.fillna(data.mean(), inplace=True)
print(data.isnull().sum())

모델의 성능은 classification_report, roc_auc_score을 이용하여 평가합니다.

9단계: 모델 예측

X = data[['age', 'totChol','sysBP','diaBP', 'cigsPerDay','BMI','glucose']]
y = data['TenYearCHD']

훈련된 모델은 새로운 환자의 심장병 위험을 예측하는 데 사용됩니다.

향후 연습을 위해 추가 환자 데이터가 제공됩니다.

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)

위 내용은 프로젝트 - Python을 사용한 지도 학습 - 로지스틱 회귀를 사용하여 심장마비 발생 가능성 예측의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

Python vs. C : 응용 및 사용 사례가 비교되었습니다Apr 12, 2025 am 12:01 AM

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

2 시간의 파이썬 계획 : 현실적인 접근Apr 11, 2025 am 12:04 AM

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

파이썬 : 기본 응용 프로그램 탐색Apr 10, 2025 am 09:41 AM

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 같은 작업에 적합합니다.

2 시간 안에 얼마나 많은 파이썬을 배울 수 있습니까?Apr 09, 2025 pm 04:33 PM

2 시간 이내에 파이썬의 기본 사항을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우십시오. 이를 통해 간단한 파이썬 프로그램 작성을 시작하는 데 도움이됩니다.

10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법?Apr 02, 2025 am 07:18 AM

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

중간 독서를 위해 Fiddler를 사용할 때 브라우저에서 감지되는 것을 피하는 방법은 무엇입니까?Apr 02, 2025 am 07:15 AM

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

Python 3.6에 피클 파일을로드 할 때 '__builtin__'모듈을 찾을 수없는 경우 어떻게해야합니까?Apr 02, 2025 am 07:12 AM

Python 3.6에 피클 파일로드 3.6 환경 보고서 오류 : modulenotfounderror : nomodulename ...

경치 좋은 스팟 코멘트 분석에서 Jieba Word 세분화의 정확성을 향상시키는 방법은 무엇입니까?Apr 02, 2025 am 07:09 AM

경치 좋은 스팟 댓글 분석에서 Jieba Word 세분화 문제를 해결하는 방법은 무엇입니까? 경치가 좋은 스팟 댓글 및 분석을 수행 할 때 종종 Jieba Word 세분화 도구를 사용하여 텍스트를 처리합니다 ...

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

드림위버 CS6

시각적 웹 개발 도구

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.