Python의 전처리 및 히트맵에 대한 간략한 소개-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Python의 전처리 및 히트맵에 대한 간략한 소개

不言

Oct 11, 2018 pm 04:29 PM

python

이 기사는 Python의 전처리 및 히트 맵에 대한 간략한 소개를 제공합니다. 도움이 필요한 친구들이 참고할 수 있기를 바랍니다.

데이터 분석에는 아직 많은 것들이 있습니다. 여기서는 경험적 소개만 하겠습니다. 이 부분을 이해하신 후에 활용하시면 더 빠르게 해결책을 찾으실 수 있을 거라 믿습니다.

이번에도 sklearn에 설정된 홍채 데이터를 그대로 사용하여 히트맵을 통해 표시해 보겠습니다.

Preprocessing

sklearn.preprocessing은 기계 학습 라이브러리의 전처리 모듈로, 데이터를 표준화, 정규화 등을 수행하고 필요에 따라 사용할 수 있습니다. 여기서는 표준화된 방법을 사용하여 데이터를 정리합니다. 다른 방법은 직접 쿼리할 수 있습니다.

표준화: 특성 데이터의 분포를 가우스 분포라고도 하는 표준 정규 분포로 조정합니다. 이는 데이터의 평균이 0이고 분산이 1임을 의미합니다.

표준화하는 이유는 일부 특성의 분산이 너무 크면 목적 함수를 지배하고 매개변수 추정기가 다른 특성을 올바르게 학습하지 못하게 하기 때문입니다.

표준화 과정은 두 단계로 이루어집니다. 즉, 평균의 분산화(평균이 0이 됨), 분산의 조정(분산이 1이 됨)입니다.

위의 기능을 달성하기 위해 sklearn.preprocessing에서 확장 방법을 제공합니다.

예를 들어보겠습니다.

from sklearn import preprocessing
import numpy as np
# 创建一组特征数据，每一行表示一个样本，每一列表示一个特征
xx = np.array([[1., -1., 2.],
              [2., 0., 0.],
              [0., 1., -1.]])
# 将每一列特征标准化为标准正太分布，注意，标准化是针对每一列而言的
xx_scale = preprocessing.scale(xx)
xx_scale

데이터의 각 열을 표준화한 결과는 다음과 같습니다.

array([[ 0.        , -1.22474487,  1.33630621],
       [ 1.22474487,  0.        , -0.26726124],
       [-1.22474487,  1.22474487, -1.06904497]])

안에 있는 데이터가 변경되고 값이 상대적으로 작아서 한눈에 알아볼 수도 있습니다. 당신이 그것을 볼 수 없더라도 상관 없습니다. Python은 일부 통계를 쉽게 계산할 수 있습니다.

 # 测试一下xx_scale每列的均值方差
 print(&#39;均值：&#39;, xx_scale.mean(axis=0))  # axis=0指列，axis=1指行
 print(&#39;方差：&#39;, xx_scale.std(axis=0))

위에서 표준화를 무엇으로 변환해야 하는지 소개했는데, 결과는 실제로 일관성이 있습니다. 열별로 평균과 분산을 계산한 결과는 다음과 같습니다.

均值： [0. 0. 0.]
方差： [1. 1. 1.]

물론 분산과 평균은 꼭 가지고 다닐 필요는 없습니다. 때로는 두 가지 방법 중 하나의 이점을 원할 경우 다음과 같은 방법이 있습니다.

with_mean, with_std 이 두 가지는 부울 매개변수이며 둘 다 기본적으로 true이지만 false로 사용자 정의할 수도 있습니다. 즉, 센터링을 의미하지 않거나 분산을 1로 조정하지 마십시오.

히트 맵

히트 맵에 대한 자세한 정보는 이미 인터넷에 많이 있으므로 여기서는 히트 맵에 대해 간단히 언급하겠습니다. .

히트맵에서는 데이터가 행렬 형태로 존재하며, 속성 범위는 색상의 그라데이션으로 표현됩니다. 여기서는 히트맵을 그리는 데 pcolor가 사용됩니다.

작은 밤

가져오기 라이브러리에서 시작한 다음 데이터 세트를 로드하고 데이터를 처리한 다음 이미지를 그리고 이미지에 주석과 장식을 추가하는 등의 작업을 수행합니다. 저는 코드에 댓글을 다는 데 익숙합니다. 이해가 안 되는 부분이 있으면 메시지를 남겨주시면 제 시간에 답변해 드리겠습니다.

# 导入后续所需要的库
from sklearn.datasets import load_iris
from sklearn.preprocessing import scale
import numpy as np
import matplotlib.pyplot as plt
# 加载数据集
data = load_iris()
x = data[&#39;data&#39;]
y = data[&#39;target&#39;]
col_names = data[&#39;feature_names&#39;]
# 数据预处理
# 根据平均值对数据进行缩放
x = scale(x, with_std=False)
x_ = x[1:26,] # 选取其中25组数据
y_labels = range(1, 26)
# 绘制热图
plt.close(&#39;all&#39;)
plt.figure(1)
fig, ax = plt.subplots()
ax.pcolor(x_, cmap=plt.cm.Greens, edgecolors=&#39;k&#39;)
ax.set_xticks(np.arange(0, x_.shape[1])+0.5) # 设置横纵坐标
ax.set_yticks(np.arange(0, x_.shape[0])+0.5)
ax.xaxis.tick_top() # x轴提示显示在图形上方
ax.yaxis.tick_left() # y轴提示显示在图形的左侧
ax.set_xticklabels(col_names, minor=False, fontsize=10) # 传递标签数据
ax.set_yticklabels(y_labels, minor=False, fontsize=10)
plt.show()

그렇다면 그려진 이미지는 어떤 모습일까요?

위의 간단한 단계를 통해 이러한 데이터의 직관적인 이미지를 그릴 수 있습니다. 물론 실제로 사용할 때는 그렇게 간단하지 않습니다. 지식을 더 넓혀보세요.

위 내용은 Python의 전처리 및 히트맵에 대한 간략한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 博客园에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

파이썬 어레이에 어떤 데이터 유형을 저장할 수 있습니까?Apr 27, 2025 am 12:11 AM

PythonlistsCanstoreAnyDatAtype, ArrayModuLearRaysStoreOneType 및 NUMPYARRAYSAREFORNUMERICALPUTATION.1) LISTSAREVERSATILEBUTLESSMEMORY-EFFICENT.2) ARRAYMODUERRAYRAYRAYSARRYSARESARESARESARESARESARESAREDOREDORY-UNFICEDONOUNEOUSDATA.3) NumpyArraysUraysOrcepperperperperperperperperperperperperperperperferperferperferferpercient

파이썬 어레이에 잘못된 데이터 유형의 값을 저장하려고하면 어떻게됩니까?Apr 27, 2025 am 12:10 AM

whenyouattempttoreavalueofthewrongdatatypeinapythonaphonarray, thisiSdueTotheArrayModule의 stricttyPeenforcement, theAllElementStobeofthesAmetypecified bythetypecode.forperformancersassion, arraysaremoreficats the thraysaremoreficats thetheperfication the thraysaremorefications는

Python Standard Library의 일부는 무엇입니까? 목록 또는 배열은 무엇입니까?Apr 27, 2025 am 12:03 AM

Pythonlistsarepartoftsandardlardlibrary, whileraysarenot.listsarebuilt-in, 다재다능하고, 수집 할 수있는 반면, arraysarreprovidedByTearRaymoduledlesscommonlyusedDuetolimitedFunctionality.

스크립트가 잘못된 파이썬 버전으로 실행되는지 확인해야합니까?Apr 27, 2025 am 12:01 AM

thescriptIsrunningwithHongpyThonversionDueCorRectDefaultTerpretersEttings.tofixThis : 1) checktheDefaultPyThonVersionUsingPyThon-VersionorPyThon3- version.2) usvirtual-ErondmentsBythePython.9-Mvenvmyenv, 활성화, 및 파괴

파이썬 어레이에서 수행 할 수있는 일반적인 작업은 무엇입니까?Apr 26, 2025 am 12:22 AM

PythonArraysSupportVariousOperations : 1) SlicingExtractsSubsets, 2) 추가/확장 어드먼트, 3) 삽입 값 삽입 ATSpecificPositions, 4) retingdeletesElements, 5) 분류/ReversingChangesOrder 및 6) ListsompectionScreateNewListSbasedOnsistin

어떤 유형의 응용 프로그램에서 Numpy Array가 일반적으로 사용됩니까?Apr 26, 2025 am 12:13 AM

NumpyArraysareSentialplosplicationSefficationSefficientNumericalcomputationsanddatamanipulation. Theyarcrucialindatascience, MachineLearning, Physics, Engineering 및 Financeduetotheiribility에 대한 handlarge-scaledataefficivally. forexample, Infinancialanyaly

파이썬의 목록 위의 배열을 언제 사용 하시겠습니까?Apr 26, 2025 am 12:12 AM

UseanArray.ArrayOveralistInpyThonWhendealingwithhomogeneousData, Performance-CriticalCode, OrinterFacingwithCcode.1) HomogeneousData : ArraysSaveMemorywithtypepletement.2) Performance-CriticalCode : arraysofferbetterporcomanceFornumericalOperations.3) Interf

모든 목록 작업은 배열에 의해 지원됩니까? 왜 또는 왜 그렇지 않습니까?Apr 26, 2025 am 12:05 AM

아니요, NOTALLLISTOPERATIONARESUPPORTEDBYARRARES, andVICEVERSA.1) ArraySDONOTSUPPORTDYNAMICOPERATIONSLIKEPENDORINSERTWITHUTRESIGING, WHITHIMPACTSPERFORMANCE.2) ListSDONOTEECONSTANTTIMECOMPLEXITEFORDITITICCESSLIKEARRAYSDO.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.