머신러닝에서 정규화는 모델의 과적합을 방지하는 데 사용되는 기술입니다. 모델의 계수에 페널티 항을 도입함으로써 정규화는 모델 매개변수의 크기를 제한할 수 있으므로 모델의 일반화 능력이 향상됩니다. 이 기술은 모델 신뢰성, 속도 및 정확성을 향상시킬 수 있습니다. 정규화는 기본적으로 추가 매개변수를 추가하여 모델의 복잡성을 제한함으로써 과도한 네트워크 매개변수로 인한 모델 과적합 문제를 방지합니다.
정규화의 목적은 추정기를 단순화하여 추정기의 분산을 줄여 모델의 일반화 능력을 향상시키는 것입니다. 그러나 정규화는 편향을 증가시키는 방식으로 이 목표를 달성합니다. 일반적으로 편향의 증가는 표본 크기가 작거나 매개변수 수가 클 때, 즉 모델이 과적합되기 쉬운 경우에 발생합니다. 그러나 정규화가 올바르게 적용되면 올바른 양의 편향이 도입되어 과적합 문제를 피할 수 있습니다.
정규화의 역할과 의의는 과적합을 방지하는 것입니다. Overfitting이 발생하면 모델의 일반화 능력이 거의 상실됩니다. 이는 모델이 훈련 데이터 세트에서만 작동하고 다른 데이터 세트에서는 작동하지 않음을 의미합니다. 정규화를 통해 페널티 항을 도입하여 모델 매개변수의 크기를 제한할 수 있으므로 모델의 복잡성이 줄어들고 일반화 능력이 향상됩니다. 이를 통해 모델은 새로운 데이터 세트에 더 잘 적응할 수 있어 예측 성능과 안정성이 향상됩니다.
예를 들어, 정규화는 매개변수 a를 조정하여 편향과 분산 사이의 균형을 제어하는 것으로 볼 수 있습니다. a 값이 높을수록 모델의 계수가 감소하여 분산이 감소합니다. a를 점진적으로 늘리면 분산이 줄어들고 과적합을 방지할 수 있지만, 특정 임계값을 초과하면 편향이 발생하여 과소적합이 발생합니다.
정규화는 RSS(잔차 제곱합)가 포함된 페널티 항을 복잡한 모델에 추가하여 작동합니다. 간단한 선형 회귀 방정식을 예로 들어 보겠습니다. 여기서 Y는 종속 기능 또는 응답을 나타냅니다.
Y는 대략 β0+β1X1+β2X2+…+βpXp, X1, Estimation이며, 이는 특성에 부여된 가중치의 크기를 나타냅니다.
피팅 프로세스에는 손실 함수와 잔차 제곱합(RSS) 함수가 포함됩니다. 계수는 손실 함수를 최소화하는 방식으로 선택됩니다.
계수는 훈련 데이터에 따라 조정됩니다. 훈련 데이터에 노이즈가 있는 경우 추정된 계수가 향후 데이터에 잘 일반화되지 않는다는 것을 알 수 있습니다. 여기서 정규화가 시작되어 훈련을 통해 학습된 추정치를 0으로 축소하고 정규화합니다.
dropout
dropout에서는 활성화된 난수가 네트워크를 더 효과적으로 훈련시킵니다. 활성화는 입력에 가중치를 곱하여 얻은 출력입니다. 활성화의 특정 부분이 각 레이어에서 제거되면 모델에 대한 입력으로 특정 활성화가 학습되지 않습니다. 이는 입력 모델이 과적합으로 인해 어려움을 겪지 않음을 의미합니다.
배치 정규화
배치 정규화는 배치 평균을 빼고 배치 표준 편차로 나누어 이전 활성화 계층의 출력을 정규화합니다. 정규화된 출력에 감마와 베타를 곱할 수 있도록 각 레이어에 두 개의 훈련 가능한 매개변수를 도입합니다. 감마와 베타의 값은 신경망을 통해 알아내게 됩니다. 초기 레이어 매개변수와 후속 레이어 매개변수 간의 결합을 약화시킴으로써 학습률이 향상되고 정확도가 향상되며 공분산 드리프트 문제가 해결됩니다.
데이터 증대
데이터 증대에는 기존 데이터를 사용하여 합성 데이터를 생성하여 사용 가능한 실제 데이터 양을 늘리는 작업이 포함됩니다. 모델이 실제 세계에서 접할 수 있는 데이터의 변화를 생성하여 딥 러닝 모델의 정확도를 높이는 데 도움을 줍니다.
조기 중지
훈련 세트의 일부를 검증 세트로 사용하고 해당 검증 세트에 대해 모델의 성능을 측정합니다. 이 검증 세트의 성능이 저하되면 모델 학습이 즉시 중지됩니다.
L1 정규화
L1 정규화 기술을 사용하는 회귀 모델을 Lasso 회귀라고 합니다. 최소 절대 수축 및 선택 연산자인 올가미 회귀 모델은 손실 함수에 페널티 항으로 계수의 "절대값"을 추가합니다.
L2 정규화
L2 정규화를 사용한 회귀 모델을 능선 회귀라고 합니다. 능선 회귀 모델은 능선 회귀에서 계수의 제곱 진폭이 손실 함수에 페널티 항으로 추가됩니다.
위 내용은 정규화의 개념과 머신러닝에서의 중요성에 대한 심층 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!