학생 잔차는 회귀 분석에서 데이터의 잠재적 이상값을 식별하는 데 자주 사용됩니다. 이상값은 데이터의 전체 추세와 크게 다르며 적합 모델에 상당한 영향을 미칠 수 있는 점입니다. 이상값을 식별하고 분석하면 데이터의 기본 패턴을 더 잘 이해하고 모델의 정확도를 높일 수 있습니다. 이번 글에서는 스튜던트화 잔차(Studentized Residual)와 이를 파이썬으로 구현하는 방법에 대해 자세히 살펴보겠습니다.
학생잔차란 무엇인가요?
"학생화 잔차"라는 용어는 표준 편차를 추정치로 나눈 특정 잔차 클래스를 의미합니다. 회귀 분석 잔차는 반응 변수의 관측값과 모델에서 생성된 기대값 간의 차이를 설명합니다. 적합 모델에 큰 영향을 미칠 수 있는 데이터의 이상값을 찾기 위해 스튜던트화 잔차가 사용되었습니다.
다음 공식은 일반적으로 스튜던트화 잔차를 계산하는 데 사용됩니다. -
으아악"잔차"는 관찰된 반응 값과 예상 반응 값의 차이를 나타내고, "잔차 표준 편차"는 잔차 표준 편차의 추정치를 나타내며, "hii"는 각 데이터 포인트에 대한 레버리지 계수를 나타냅니다.
Python을 사용하여 학생화 잔차 계산
statsmodels 패키지는 Python에서 스튜던트화 잔차를 계산하는 데 사용할 수 있습니다. 예를 들어 다음을 고려하십시오 -
문법
으아악OLSResults는 statsmodels의 ols() 메서드를 사용하여 피팅된 선형 모델을 나타냅니다.
으아악여기서 "등급"과 "점수"는 단순 선형 회귀를 나타냅니다.
알고리즘
numpy, pandas, Statsmodel API를 가져옵니다.
데이터세트를 만듭니다.
데이터세트에서 간단한 선형 회귀 모델을 수행합니다.
학생화 잔차를 계산하세요.
학생 잔차를 인쇄하세요.
예
다음은 scikit-posthocs 라이브러리를 사용하여 Dunn의 테스트를 실행하는 데모입니다. -
으아악다음으로 statsmodels OLS 클래스를 사용하여 선형 회귀 모델을 만듭니다. -
으아악이상치 테스트() 방법을 사용하여 데이터세트의 각 관측값에 대한 스튜던트화 잔차를 DataFrame에서 생성할 수 있습니다. -
으아악출력
으아악학생화 잔차에 대한 예측 변수 값을 빠르게 플롯할 수도 있습니다. -
문법
으아악여기에서는 matpotlib 라이브러리를 사용하여 색상 = '검은색' 및 라이프스타일 = '--'으로 차트를 그립니다.
알고리즘
matplotlib의 pyplot 라이브러리 가져오기
예측 변수 값 정의
학생 잔차 정의
예측 변수와 스튜던트화 잔차의 산점도 만들기
예
으아악출력
결론
가능한 데이터 이상값을 식별하고 평가합니다. 스튜던트화 잔차를 조사하면 데이터의 전체 추세에서 크게 벗어나는 점을 찾고 해당 점이 적합 모델에 영향을 미치는 이유를 탐색할 수 있습니다. 중요한 관측값 식별 스튜던트화 잔차를 사용하여 적합 모델에 큰 영향을 미치는 영향력 있는 데이터를 발견하고 평가할 수 있습니다. 레버리지가 높은 지점을 찾으세요. 스튜던트화 잔차를 사용하여 높은 레버리지 지점을 식별할 수 있습니다. 레버리지는 적합 모델에 대한 특정 지점의 영향을 측정한 것입니다. 전반적으로 스튜던트화 잔차를 사용하면 회귀 모델의 성능을 분석하고 개선하는 데 도움이 됩니다.
위 내용은 Python에서 학생 잔차를 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python은 게임 및 GUI 개발에서 탁월합니다. 1) 게임 개발은 Pygame을 사용하여 드로잉, 오디오 및 기타 기능을 제공하며 2D 게임을 만드는 데 적합합니다. 2) GUI 개발은 Tkinter 또는 PYQT를 선택할 수 있습니다. Tkinter는 간단하고 사용하기 쉽고 PYQT는 풍부한 기능을 가지고 있으며 전문 개발에 적합합니다.

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 같은 작업에 적합합니다.

2 시간 이내에 파이썬의 기본 사항을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우십시오. 이를 통해 간단한 파이썬 프로그램 작성을 시작하는 데 도움이됩니다.

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

Python 3.6에 피클 파일로드 3.6 환경 보고서 오류 : modulenotfounderror : nomodulename ...


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

Eclipse용 SAP NetWeaver 서버 어댑터
Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

드림위버 CS6
시각적 웹 개발 도구

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.
