Python의 EM 알고리즘은 무엇입니까?-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Python의 EM 알고리즘은 무엇입니까?

PHPz

Jun 05, 2023 am 08:51 AM

python통계em 알고리즘

Python의 EM 알고리즘은 최대 우도 추정을 기반으로 하는 반복 방법으로, 비지도 학습의 매개변수 추정 문제에 일반적으로 사용됩니다. 이 기사에서는 EM 알고리즘의 정의, 기본 원칙, 애플리케이션 시나리오 및 Python 구현을 소개합니다.

1. EM 알고리즘의 정의

EM 알고리즘은 Expectation-Maximization Algorithm의 약어입니다. 관찰된 데이터를 바탕으로 최대 우도 추정치를 해결하도록 설계된 반복 알고리즘입니다.

EM 알고리즘에서는 표본 데이터가 특정 확률 분포에서 나온다고 가정해야 하며, 분포의 매개변수는 알 수 없으며 EM 알고리즘을 통해 추정해야 합니다. EM 알고리즘은 알려지지 않은 매개변수가 두 가지 범주, 즉 하나는 관찰 가능한 변수이고 다른 하나는 관찰 불가능한 변수로 나눌 수 있다고 가정합니다. 반복을 통해 관찰 불가능한 변수의 기대값을 모수의 추정값으로 사용한 후 수렴할 때까지 다시 해를 푼다.

2. EM 알고리즘의 기본 원리

E 단계(Expectation)

E 단계에서는 현재 매개변수 추정값을 기반으로 숨겨진 변수의 확률 분포를 계산해야 합니다. 각 숨겨진 변수의 조건 분포, 즉 숨겨진 변수의 기대값입니다. 이 기대값은 현재 매개변수 추정치를 기반으로 계산됩니다.

M스텝(최대화)

M스텝에서는 E스텝에서 계산된 히든변수의 기대값을 바탕으로 현재 파라미터 값을 재추정해야 합니다. 이 추정치는 E단계에서 계산된 잠재변수의 기대값을 기반으로 계산됩니다.

매개변수 값 업데이트

E 단계와 M 단계의 반복을 통해 결국 매개변수 추정값 세트를 얻게 됩니다. 추정값이 수렴하면 알고리즘이 종료되고, 그렇지 않으면 반복이 계속됩니다. 각 반복은 최적의 모수 추정치를 찾을 때까지 모수 값을 최적화합니다.

3. EM 알고리즘의 적용 시나리오

EM 알고리즘은 군집 분석, 모델 선택, 은닉 마르코프 모델 등 비지도 학습 분야에서 널리 사용됩니다. 강력한 견고성과 높은 반복 효율성이라는 장점이 있습니다.

예를 들어 클러스터링 문제에서 EM 알고리즘은 가우스 혼합 모델의 매개변수 추정에 사용될 수 있습니다. 즉, 관찰된 데이터 분포를 여러 가우스 분포의 혼합 모델로 모델링하고 샘플을 그룹화하여 데이터가 각 그룹은 동일한 확률 분포를 따릅니다. EM 알고리즘에서는 E 단계에서 데이터를 그룹화하고 M 단계에서 가우스 분포의 매개변수를 업데이트하여 문제를 해결합니다.

또한 이미지 처리에서 EM 알고리즘은 이미지 분할 및 이미지 노이즈 제거와 같은 작업에 자주 사용됩니다.

4. Python은 EM 알고리즘을 구현합니다

Python에는 SciPy 라이브러리의 EM 알고리즘 구현, scikit-learn 라이브러리의 Gaussian 혼합 모델 GMM과 같이 매개변수 추정을 위해 EM 알고리즘을 사용할 수 있는 많은 함수가 있습니다. 및 TensorFlow 라이브러리 등이 있습니다.

다음은 SciPy 라이브러리의 EM 알고리즘 구현을 예로 들어 소개합니다. 먼저 다음과 같이 Pyhton에서 가져와야 합니다.

import scipy.stats as st
import numpy as np

그런 다음 가우스 혼합 모델의 확률 밀도 함수를 EM 알고리즘의 최적화 목적 함수로 정의합니다.

def gmm_pdf(data, weights, means, covs):
    n_samples, n_features = data.shape
    pdf = np.zeros((n_samples,))
    for i in range(len(weights)):
        pdf += weights[i]*st.multivariate_normal.pdf(data, mean=means[i], cov=covs[i])
    return pdf

다음으로 EM 알고리즘의 함수를 정의합니다.

def EM(data, n_components, max_iter):
    n_samples, n_features = data.shape
    weights = np.ones((n_components,))/n_components
    means = data[np.random.choice(n_samples, n_components, replace=False)]
    covs = [np.eye(n_features) for _ in range(n_components)]

    for i in range(max_iter):
        # E步骤
        probabilities = np.zeros((n_samples, n_components))
        for j in range(n_components):
            probabilities[:,j] = weights[j]*st.multivariate_normal.pdf(data, mean=means[j], cov=covs[j])
        probabilities = (probabilities.T/probabilities.sum(axis=1)).T

        # M步骤
        weights = probabilities.mean(axis=0)
        means = np.dot(probabilities.T, data)/probabilities.sum(axis=0)[:,np.newaxis]
        for j in range(n_components):
            diff = data - means[j]
            covs[j] = np.dot(probabilities[:,j]*diff.T, diff)/probabilities[:,j].sum()

    return weights, means, covs

마지막으로 다음 코드를 사용하여 EM 알고리즘을 테스트합니다.

# 生成数据
np.random.seed(1234)
n_samples = 100
x1 = np.random.multivariate_normal([0,0], [[1,0],[0,1]], int(n_samples/2))
x2 = np.random.multivariate_normal([3,5], [[1,0],[0,2]], int(n_samples/2))
data = np.vstack((x1,x2))

# 运行EM算法
weights, means, covs = EM(data, 2, 100)

# 输出结果
print('weights:', weights)
print('means:', means)
print('covs:', covs)

참고 자료:

[1] Xu, R. & Wunsch, D. C. (2005) Survey of Clustering Algorithms on Neural. Networks, 16(3), 645-678.

[2] Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003) Journal of Machine Learning Research, 3(4-5), 993. -1022.

위 내용은 Python의 EM 알고리즘은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

파이썬 어레이에 어떤 데이터 유형을 저장할 수 있습니까?Apr 27, 2025 am 12:11 AM

PythonlistsCanstoreAnyDatAtype, ArrayModuLearRaysStoreOneType 및 NUMPYARRAYSAREFORNUMERICALPUTATION.1) LISTSAREVERSATILEBUTLESSMEMORY-EFFICENT.2) ARRAYMODUERRAYRAYRAYSARRYSARESARESARESARESARESARESAREDOREDORY-UNFICEDONOUNEOUSDATA.3) NumpyArraysUraysOrcepperperperperperperperperperperperperperperperferperferperferferpercient

파이썬 어레이에 잘못된 데이터 유형의 값을 저장하려고하면 어떻게됩니까?Apr 27, 2025 am 12:10 AM

whenyouattempttoreavalueofthewrongdatatypeinapythonaphonarray, thisiSdueTotheArrayModule의 stricttyPeenforcement, theAllElementStobeofthesAmetypecified bythetypecode.forperformancersassion, arraysaremoreficats the thraysaremoreficats thetheperfication the thraysaremorefications는

Python Standard Library의 일부는 무엇입니까? 목록 또는 배열은 무엇입니까?Apr 27, 2025 am 12:03 AM

Pythonlistsarepartoftsandardlardlibrary, whileraysarenot.listsarebuilt-in, 다재다능하고, 수집 할 수있는 반면, arraysarreprovidedByTearRaymoduledlesscommonlyusedDuetolimitedFunctionality.

스크립트가 잘못된 파이썬 버전으로 실행되는지 확인해야합니까?Apr 27, 2025 am 12:01 AM

thescriptIsrunningwithHongpyThonversionDueCorRectDefaultTerpretersEttings.tofixThis : 1) checktheDefaultPyThonVersionUsingPyThon-VersionorPyThon3- version.2) usvirtual-ErondmentsBythePython.9-Mvenvmyenv, 활성화, 및 파괴

파이썬 어레이에서 수행 할 수있는 일반적인 작업은 무엇입니까?Apr 26, 2025 am 12:22 AM

PythonArraysSupportVariousOperations : 1) SlicingExtractsSubsets, 2) 추가/확장 어드먼트, 3) 삽입 값 삽입 ATSpecificPositions, 4) retingdeletesElements, 5) 분류/ReversingChangesOrder 및 6) ListsompectionScreateNewListSbasedOnsistin

어떤 유형의 응용 프로그램에서 Numpy Array가 일반적으로 사용됩니까?Apr 26, 2025 am 12:13 AM

NumpyArraysareSentialplosplicationSefficationSefficientNumericalcomputationsanddatamanipulation. Theyarcrucialindatascience, MachineLearning, Physics, Engineering 및 Financeduetotheiribility에 대한 handlarge-scaledataefficivally. forexample, Infinancialanyaly

파이썬의 목록 위의 배열을 언제 사용 하시겠습니까?Apr 26, 2025 am 12:12 AM

UseanArray.ArrayOveralistInpyThonWhendealingwithhomogeneousData, Performance-CriticalCode, OrinterFacingwithCcode.1) HomogeneousData : ArraysSaveMemorywithtypepletement.2) Performance-CriticalCode : arraysofferbetterporcomanceFornumericalOperations.3) Interf

모든 목록 작업은 배열에 의해 지원됩니까? 왜 또는 왜 그렇지 않습니까?Apr 26, 2025 am 12:05 AM

아니요, NOTALLLISTOPERATIONARESUPPORTEDBYARRARES, andVICEVERSA.1) ArraySDONOTSUPPORTDYNAMICOPERATIONSLIKEPENDORINSERTWITHUTRESIGING, WHITHIMPACTSPERFORMANCE.2) ListSDONOTEECONSTANTTIMECOMPLEXITEFORDITITICCESSLIKEARRAYSDO.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

Dreamweaver Mac版

시각적 웹 개발 도구

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.