>기술 주변기기 >일체 포함 >다중선형회귀모델의 개념과 응용에 대한 심층분석

다중선형회귀모델의 개념과 응용에 대한 심층분석

王林
王林앞으로
2024-01-22 18:30:211419검색

다중 선형 회귀는 선형 회귀의 가장 일반적인 형태이며 단일 응답 변수 Y가 여러 예측 변수와 선형 관계를 나타내는 방법을 설명하는 데 사용됩니다.

다중 회귀를 사용할 수 있는 응용 프로그램의 예:

집의 판매 가격은 위치, 침실 및 욕실 수, 건축 연도, 부지 규모 등과 같은 요인에 의해 영향을 받을 수 있습니다.

2. 아이의 키는 엄마의 키, 아빠의 키, 영양, 환경적 요인에 따라 달라집니다.

다중 선형 회귀 모델 매개변수

k개의 독립 예측 변수 x1, x2..., xk와 응답 변수 y가 있는 다중 선형 회귀 모델을 생각해 보세요.

多元线性回归概念分析 多元线性回归模型

k+1 변수에 대한 n개의 관측치가 있고 n개의 변수가 k보다 커야 한다고 가정합니다.

多元线性回归概念分析 多元线性回归模型

최소 제곱 회귀의 기본 목표는 초평면을 (k+1) 차원 공간에 맞춰 잔차 제곱의 합을 최소화하는 것입니다.

多元线性回归概念分析 多元线性回归模型

모델 매개변수를 도출하기 전에 이를 0으로 설정하고 매개변수가 만족해야 하는 최소 제곱 정규 방정식을 도출합니다.

이 방정식은 벡터와 행렬의 도움으로 공식화됩니다.

多元线性回归概念分析 多元线性回归模型

선형 회귀 모델은 다음과 같이 작성됩니다.

多元线性回归概念分析 多元线性回归模型

선형 회귀에서 최소 제곱 모수 추정치는 b

多元线性回归概念分析 多元线性回归模型

X의 열이 고정되어 있다고 상상해 보세요. 특정 문제의 데이터이고 b는 가변적입니다. 우리는 잔차 제곱합을 최소화하는 "최적" b를 찾고 싶습니다.

가능한 가장 작은 제곱합은 0입니다.

多元线性回归概念分析 多元线性回归模型

여기 y는 추정된 응답 벡터입니다.

코드는 data2

data2 데이터 세트

多元线性回归概念分析 多元线性回归模型

dataset=read.csv('data2.csv')
dataset$State=factor(dataset$State,
levels=c('New York','California','Florida'),
labels=c(1,2,3))
dataset$State
多元线性回归概念分析 多元线性回归模型

library(caTools)
set.seed(123)
split=sample.split(dataset$Profit,SplitRatio=0.8)
training_set=subset(dataset,split==TRUE)
test_set=subset(dataset,split==FALSE)
regressor=lm(formula=Profit~.,
data=training_set)
y_pred=predict(regressor,newdata=test_set)
에 다중 선형 회귀를 구현합니다.

위 내용은 다중선형회귀모델의 개념과 응용에 대한 심층분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 163.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제