찾다
기술 주변기기일체 포함5 통계 테스트 모든 데이터 과학자가 알아야 할 모든 데이터 - 분석 Vidhya

데이터 과학의 필수 통계 테스트 : 포괄적 인 가이드

데이터 과학에서 가치있는 통찰력을 잠금 해제하는 것이 가장 중요합니다. 통계 테스트를 마스터하는 것은이를 달성하는 데 필수적입니다. 이 테스트는 데이터 과학자들이 가설을 엄격하게 검증하고, 다양한 그룹을 비교하고, 숨겨진 관계를 발견하고, 자신감있는 예측을 할 수 있도록합니다. 시장 동향을 분석하거나, 기계 학습 알고리즘을 정제하거나 과학 연구를 수행하든 통계 테스트에 대한 강력한 파악은 필수적입니다. 이 기사는 모든 데이터 과학자가 알아야 할 주요 통계 테스트를 탐구합니다.

5 통계 테스트 모든 데이터 과학자가 알아야 할 모든 데이터 - 분석 Vidhya

목차 :

  • 소개
  • 데이터 과학에서 통계 테스트의 중요한 역할
  • 데이터 과학자에 대한 5 가지 통계 테스트
    • z- 테스트
    • t- 테스트
    • ANOVA (분산 분석)
    • f- 검정
    • 카이-제곱 테스트
  • 결론

데이터 과학에서 통계 테스트의 중요성 :

통계 테스트는 다음의 객관적인 프레임 워크를 제공합니다.

  • 가설 테스트 : 관찰 된 데이터 패턴이 진정 또는 단순한 무작위 변동인지 객관적으로 결정합니다.
  • 데이터 중심 결정 : 주관적인 의견을 정보에 입각 한 의사 결정에 대한 정량적 증거로 대체하십시오.
  • 그룹 비교 : 다양한 데이터 세트 또는 실험 조건에서 의미있는 비교를 가능하게합니다.
  • 관계 발견 : 데이터 세트 내 변수 간의 관계를 밝히고 정량화합니다.
  • 모델 평가 : 예측 모델의 정확성과 신뢰성을 평가합니다.
  • 데이터 품질 보증 : 데이터 트렌드의 이상 또는 상당한 변화를 식별합니다.

5 가지 필수 통계 테스트 :

z- 테스트

Z- 검정은 샘플 평균과 모집단 평균 사이에 유의 한 차이가 있는지 또는 인구 분산이 알려지고 샘플 크기가 크면 두 샘플 평균 사이에 유의 한 차이가 있는지 평가합니다 (일반적으로 n> 30). 표준 정규 분포 (평균 = 0, 표준 편차 = 1)에 의존합니다.

공식 (한 샘플 Z- 테스트) :

 <code>z = (x̅ - μ) / (σ / √n)</code>

어디:

  • x̅ = 샘플 평균
  • μ = 가설 된 인구 평균
  • σ = 인구 표준 편차
  • n = 샘플 크기

z- 테스트 수행 :

  1. 가설 정의 : NULL (HAL : 유의 한 차이 없음)과 대안 (HAT : 유의 한 차이) 가설을 설명하십시오.
  2. 유의 수준 (α) : 진정한 귀무 가설을 거부 할 확률을 설정하십시오 (예 : α = 0.05).
  3. Z- 테스트 유형 : 적절한 테스트 (한 샘플, 2- 표본 또는 비율)를 선택하십시오.
  4. z- 진술 계산 : 관련 공식을 사용하십시오.
  5. 임계 값 (z_critical) : α를 기반으로 표준 정규 분포 테이블에서 임계 z 값을 결정하십시오.
  6. 결과 해석 : 계산 된 z-statistic (| z |)의 절대 값을 z_critical과 비교하십시오. | z | > z_critical.

t- 테스트

T- 검정은 두 그룹의 평균 사이에 유의 한 차이가 있는지 결정합니다. Z- 테스트와 달리 인구 분산을 알 수없는 경우 사용됩니다.

t- 검정 유형 :

  • 한 샘플 T- 검정 : 샘플 평균을 가정 된 모집단 평균과 비교합니다.
  • 독립 샘플 T- 검정 : 두 개의 독립 그룹의 평균을 비교합니다.
  • 페어링 된 샘플 T- 테스트 : 두 관련 그룹의 평균을 비교합니다 (예 : 전 및 후 측정).

t- 검정 수행 :

단계는 Z- 검정과 유사하지만 적절한 t- 검정 공식을 사용하고 T- 분포 테이블 (자유도 고려)을 참조하여 중요한 t- 값을 찾으십시오.

ANOVA (분산 분석)

ANOVA는 통계적으로 유의 한 차이를 식별하기 위해 3 개 이상의 그룹의 평균을 비교합니다.

ANOVA 유형 :

  • 일원 분산 분석 : 비교는 한 가지 요소를 기준으로 그룹 간의 평균을 비교합니다.
  • 양방향 ANOVA : 두 가지 요소와 상호 작용을 기반으로 한 평균을 비교합니다.
  • 반복 측정 ANOVA : 동일한 대상이 여러 조건에서 측정 될 때 사용됩니다.

ANOVA 수행 : ANOVA에는 사각형 (SST, SSB, SSW), 자유도, 평균 제곱 (MSB, MSW) 및 F- 스테이트 틱의 합계를 계산합니다. 그런 다음 F-statistic은 F- 분포 테이블의 임계 F 값과 비교됩니다.

f- 검정

F- 검정은 정상적으로 분포 된 두 인구의 분산을 비교합니다. 두 그룹간에 데이터 스프레드에 통계적으로 유의 한 차이가 있는지 확인합니다.

공식:

 <code>F = σ₁² / σ₂²</code>

어디:

  • σ of² = 인구의 분산 1
  • σ of² = 인구의 분산 2

F- 테스트 수행 : 샘플 분산을 계산하고, F- 통계를 계산하고, 자유도를 결정하며, F- 스테이트 틱을 F- 분포 테이블의 임계 F 값과 비교하십시오.

카이-제곱 테스트

카이-제곱 테스트는 두 범주 형 변수 사이의 연관성을 평가합니다.

카이-제곱 테스트의 유형 :

  • 카이-제곱 독립 테스트 : 두 범주 형 변수 사이에 관계가 있는지 결정합니다.
  • 카이-제곱 장점 테스트 : 샘플 분포가 가정 된 분포와 얼마나 잘 일치하는지 평가합니다.

카이-제곱 테스트 수행 : 두 테스트 모두 관찰 및 예상 빈도를 사용하여 카이 제곱 통계 (χ²)를 계산하는 것이 포함됩니다. 그런 다음 χ² 값은 카이 제곱 분포 테이블의 임계 값과 비교됩니다.

결론:

통계 테스트는 데이터 과학자에게 없어야 할 도구입니다. 그들의 적용 및 해석을 이해하는 것은 데이터에서 유효한 결론을 도출하는 데 중요합니다. 이 5 가지 테스트 (Z- 테스트, T- 테스트, ANOVA, F- 테스트 및 카이-제곱 테스트)를 마스터함으로써 데이터 과학자들은 자신있게 데이터를 분석하고 가설을 검증하며 정보에 입각 한 결정을 내릴 수 있습니다. 테스트 선택은 연구 질문, 데이터 유형 및 데이터에 대한 가정에 따라 다릅니다.

위 내용은 5 통계 테스트 모든 데이터 과학자가 알아야 할 모든 데이터 - 분석 Vidhya의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
Tesla의 Robovan은 2024 년 Robotaxi 티저의 숨겨진 보석이었습니다.Tesla의 Robovan은 2024 년 Robotaxi 티저의 숨겨진 보석이었습니다.Apr 22, 2025 am 11:48 AM

2008 년 이래로 저는 도시 교통의 미래로서 "Robotjitney"라고 불리는 공유 라이드 밴을 옹호했습니다. 나는이 차량들을 21 세기의 차세대 대중 교통 솔루션 인 Surpas로 예측합니다.

Sam 's Club은 영수증 수표를 제거하고 소매를 강화하기 위해 AI에 베팅합니다.Sam 's Club은 영수증 수표를 제거하고 소매를 강화하기 위해 AI에 베팅합니다.Apr 22, 2025 am 11:29 AM

체크 아웃 경험 혁명 Sam 's Club의 혁신적인 "Just Go"시스템은 기존 AI 기반 AI 기반 "Scan & Go"기술을 기반으로하여 회원이 쇼핑 중에 Sam's Club 앱을 통해 구매를 스캔 할 수 있습니다.

Nvidia의 AI Omniverse는 GTC 2025에서 확장됩니다Nvidia의 AI Omniverse는 GTC 2025에서 확장됩니다Apr 22, 2025 am 11:28 AM

GTC 2025에서 Nvidia의 향상된 예측 가능성 및 신제품 라인업 AI 인프라의 핵심 업체 인 Nvidia는 고객의 예측 가능성 증가에 중점을두고 있습니다. 여기에는 일관된 제품 제공, 성과 기대치 충족 및 충족이 포함됩니다

Google의 Gemma 2 모델의 기능을 탐색합니다Google의 Gemma 2 모델의 기능을 탐색합니다Apr 22, 2025 am 11:26 AM

Google의 Gemma 2 : 강력하고 효율적인 언어 모델 효율성과 성능으로 축하되는 Google의 Gemma Family of Language 모델은 Gemma 2의 도착으로 확장되었습니다.이 최신 릴리스는 두 가지 모델로 구성됩니다 : 27 억 매개 변수 Ver Ver

Genai의 다음 물결 : Kirk Borne 박사와의 관점 -Salystics VidhyaGenai의 다음 물결 : Kirk Borne 박사와의 관점 -Salystics VidhyaApr 22, 2025 am 11:21 AM

이 데이터 에피소드와 함께이 선도에는 주요 데이터 과학자, 천체 물리학 자, TEDX 스피커 인 Kirk Borne 박사가 있습니다. Borne 박사는 빅 데이터, AI 및 머신 러닝 분야의 유명한 전문가 인 현재 상태와 미래의 Traje에 대한 귀중한 통찰력을 제공합니다.

주자와 운동 선수를위한 AI : 우리는 훌륭한 진전을 이루고 있습니다주자와 운동 선수를위한 AI : 우리는 훌륭한 진전을 이루고 있습니다Apr 22, 2025 am 11:12 AM

이 연설에는 인공 지능이 사람들의 신체 운동을 지원하는 데 왜 좋은지를 보여주는 공학에 대한 백 그라운드 정보가 매우 통찰력있는 관점이있었습니다. 스포츠에서 인공 지능 적용을 탐구하는 데 중요한 부분 인 세 가지 디자인 측면을 보여주기 위해 각 기고자의 관점에서 핵심 아이디어를 간략하게 설명 할 것입니다. 에지 장치 및 원시 개인 데이터 인공 지능에 대한이 아이디어에는 실제로 두 가지 구성 요소가 포함되어 있습니다. 하나는 우리가 큰 언어 모델을 배치하는 위치와 관련하여 하나의 구성 요소와 다른 하나는 인간 언어와 활력 징후가 실시간으로 측정 될 때“표현”하는 언어의 차이와 관련이 있습니다. Alexander Amini는 달리기와 테니스에 대해 많은 것을 알고 있지만 그는 여전히

Caterpillar의 기술, 인재 및 혁신에 관한 Jamie EngstromCaterpillar의 기술, 인재 및 혁신에 관한 Jamie EngstromApr 22, 2025 am 11:10 AM

Caterpillar의 최고 정보 책임자이자 IT의 수석 부사장 인 Jamie Engstrom은 28 개국에서 2,200 명 이상의 IT 전문가로 구성된 글로벌 팀을 이끌고 있습니다. 현재 역할에서 4 년 반을 포함하여 Caterpillar에서 26 년 동안 Engst

새로운 Google 사진 업데이트는 Ultra HDR 품질로 모든 사진 팝을 만듭니다.새로운 Google 사진 업데이트는 Ultra HDR 품질로 모든 사진 팝을 만듭니다.Apr 22, 2025 am 11:09 AM

Google Photos의 새로운 Ultra HDR 도구 : 빠른 가이드 Google Photos의 새로운 Ultra HDR 도구로 사진을 향상시켜 표준 이미지를 활기차고 높은 동기 범위의 걸작으로 변환하십시오. 소셜 미디어에 이상적 이며이 도구는 모든 사진의 영향을 높이고

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구

ZendStudio 13.5.1 맥

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

DVWA

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는