찾다
기술 주변기기일체 포함생성 모델과 차별 모델
생성 모델과 차별 모델May 19, 2023 pm 09:31 PM
분류 모델차별적 모델생성 모델

분류 모델은 생성 모델과 판별 모델이라는 두 가지 주요 범주로 나눌 수 있습니다. 이 기사에서는 이 두 모델 유형의 차이점을 설명하고 각 접근 방식의 장단점을 논의합니다.

생성 모델과 차별 모델

판별 모델

판별 모델은 입력 데이터의 특성을 학습하여 출력 레이블을 예측하는 모델입니다. 분류 문제에서 우리의 목표는 각 입력 벡터 x를 레이블 y에 할당하는 것입니다. 판별 모델은 입력 벡터를 레이블에 매핑하는 함수 f(x)를 직접 학습하려고 시도합니다. 이러한 모델은 두 가지 하위 유형으로 더 나눌 수 있습니다.

분류자는 확률 분포를 사용하지 않고 f(x)를 찾으려고 합니다. 이러한 분류기는 클래스의 확률 추정치를 제공하지 않고 각 샘플에 대한 레이블을 직접 출력합니다. 이러한 분류기는 결정론적 분류기 또는 무분포 분류기라고도 합니다. 이러한 분류기의 예로는 k-최근접 이웃, 의사결정 트리, SVM 등이 있습니다.

분류자는 먼저 훈련 데이터에서 사후 클래스 확률 P(y = k|x)를 학습하고 이러한 확률을 기반으로 클래스 중 하나(일반적으로 사후 확률이 가장 높은 클래스)에 새 샘플 x를 할당합니다.

이러한 분류기를 확률 분류기라고도 합니다. 이러한 분류기의 예로는 출력 계층에서 시그모이드 또는 소프트맥스 함수를 사용하는 로지스틱 회귀 및 신경망이 있습니다.

모든 조건이 동일할 때 저는 일반적으로 결정론적 분류기보다는 확률 분류기를 사용합니다. 왜냐하면 이 분류기는 특정 클래스에 샘플을 할당할 때 신뢰도에 대한 추가 정보를 제공하기 때문입니다.

일반 판별 모델에는 다음이 포함됩니다.

  • 로지스틱 회귀(LR)
  • 지원 벡터 머신(SVM)
  • 결정 트리(DT)

생성 모델

생성 모델은 클래스 확률을 추정하기 전에 입력 분포를 학습합니다. 생성 모델은 데이터 생성 과정을 학습할 수 있는 모델로, 입력 데이터의 확률 분포를 학습하고 새로운 데이터 샘플을 생성할 수 있습니다.

더 구체적으로, 생성 모델은 먼저 훈련 데이터에서 카테고리의 조건부 밀도 P(x|y = k)와 사전 카테고리 확률 P(y = k)를 추정합니다. 그들은 각 카테고리의 데이터가 어떻게 생성되는지 이해하려고 노력합니다.

그런 다음 Bayes 정리를 사용하여 사후 클래스 확률을 추정합니다.

생성 모델과 차별 모델

Bayes 규칙의 분모는 분자에 나타나는 변수로 나타낼 수 있습니다.

생성 모델과 차별 모델

생성 모델은 입력과 레이블을 먼저 학습할 수도 있습니다. 그런 다음 P(x, y)의 결합 분포를 정규화하여 사후 확률 P(y = k|x)를 얻습니다. 사후 확률이 있으면 이를 사용하여 클래스 중 하나(일반적으로 사후 확률이 가장 높은 클래스)에 새 샘플 x를 할당할 수 있습니다.

예를 들어 개 이미지(y = 1)와 고양이 이미지(y = 0)를 구별해야 하는 이미지 분류 작업을 생각해 보세요. 생성 모델은 먼저 개 P(x|y = 1) 모델과 고양이 P(x|y = 0) 모델을 구축합니다. 그런 다음 새 이미지를 분류할 때 이를 두 모델과 비교하여 새 이미지가 개에 더 가까운지 고양이에 더 가까운지 확인합니다.

생성 모델을 사용하면 학습된 입력 분포 P(x|y)에서 새로운 샘플을 생성할 수 있습니다. 그래서 우리는 그것을 생성 모델이라고 부릅니다. 가장 간단한 예는 위 모델의 경우 P(x|y = 1)에서 샘플링하여 새로운 개 이미지를 생성할 수 있다는 것입니다.

일반 생성 모델에는

  • Naive Bayes(Naïve Bayes)
  • Gaussian Mixture Models(GMMs)
  • Hidden Markov Model(hmm)
  • Linear Discriminant Analysis(LDA)

Deep Generative Model(DGMs) 적극적인 모델 및 심층 신경망:

  • Autoencoder(AE)
  • Generative Adversarial Network(GAN)
  • GPT(Generative Pre-trained Transformer)와 같은 자동 회귀 모델)은 수십억 개의 매개변수가 있는 자동 회귀 언어 모델입니다.

차이점, 장점 및 단점

생성 모델과 차별 모델의 주요 차이점은 서로 다른 학습 목표에 있습니다. 생성 모델은 입력 데이터의 분포를 학습하고 새로운 데이터 샘플을 생성할 수 있습니다. 판별 모델은 입력 데이터와 출력 레이블 간의 관계를 학습하고 새 레이블을 예측할 수 있습니다.

생성 모델:

생성 모델은 입력 분포와 클래스 확률을 동시에 학습하기 때문에 더 많은 정보를 제공합니다. 학습된 입력 분포에서 새로운 샘플을 생성할 수 있습니다. 그리고 결측값을 사용하지 않고 입력 분포를 추정할 수 있으므로 결측 데이터를 처리할 수 있습니다. 그러나 대부분의 판별 모델에서는 모든 기능이 존재해야 합니다.

생성 모델은 입력 데이터와 출력 데이터 간의 공동 분포를 설정하기 위해 많은 양의 컴퓨팅 및 스토리지 리소스가 필요하기 때문에 훈련 복잡성이 높습니다. 생성 모델은 입력 데이터와 출력 데이터 간의 결합 분포를 설정해야 하고 데이터 분포를 가정하고 모델링해야 하기 때문에 데이터 분포에 대한 가정이 상대적으로 강합니다. 따라서 복잡한 데이터 분포의 경우 생성 모델이 필요합니다. 소규모에 적합합니다. 컴퓨팅 리소스에는 적용되지 않습니다.

생성 모델은 입력 데이터와 출력 데이터 사이에 다변량 결합 분포를 설정하여 다중 모드 데이터를 처리할 수 있기 때문에 다중 모드 데이터를 처리할 수 있습니다.

판별 모델:

생성 모델이 데이터에 대한 몇 가지 가정 없이 입력 분포 P(x|y)를 학습하는 것은 계산적으로 어렵습니다. 예를 들어 x가 m개의 이진 특성으로 구성된 경우 P를 예측합니다. (x |y) 모델링을 위해서는 각 클래스의 데이터에서 2ᵐ 매개변수를 추정해야 합니다(이 매개변수는 m 특성의 2ᵐ 조합 각각의 조건부 확률을 나타냅니다). Naïve Bayes와 같은 모델은 학습해야 하는 매개변수 수를 줄이기 위해 기능의 조건부 독립성을 가정하므로 학습 복잡성이 낮습니다. 그러나 그러한 가정으로 인해 생성 모델이 판별 모델보다 성능이 떨어지는 경우가 많습니다.

판별 모델은 입력 데이터와 출력 데이터 간의 매핑 관계를 유연하게 모델링할 수 있으므로 복잡한 데이터 분포 및 고차원 데이터에 적합합니다.

차별 모델은 입력 데이터와 출력 데이터 간의 매핑 관계만 고려하고 누락된 값을 채우고 노이즈를 제거하기 위해 입력 데이터의 정보를 사용하지 않기 때문에 노이즈 데이터와 누락 데이터에 민감합니다.

요약

생성 모델과 판별 모델은 모두 기계 학습에서 중요한 모델 유형입니다. 각각 고유한 장점과 적용 가능한 시나리오가 있습니다. 실제 적용에서는 특정 작업의 요구에 따라 적절한 모델을 선택하고 하이브리드 모델과 기타 기술 수단을 결합하여 모델의 성능과 효과를 향상시키는 것이 필요합니다.


위 내용은 생성 모델과 차별 모델의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
MCP (Model Context Protocol) 란 무엇입니까?MCP (Model Context Protocol) 란 무엇입니까?Mar 03, 2025 pm 07:09 PM

MCP (Model Context Protocol) : AI 및 데이터를위한 범용 커넥터 우리는 모두 매일 코딩에서 AI의 역할에 익숙합니다. Replit, Github Copilot, Black Box AI 및 Cursor IDE는 AI가 워크 플로우를 간소화하는 방법에 대한 몇 가지 예일뿐입니다. 하지만 상상해보십시오

Omniparser V2 및 Omnitool을 사용하여 지역 비전 에이전트 구축Omniparser V2 및 Omnitool을 사용하여 지역 비전 에이전트 구축Mar 03, 2025 pm 07:08 PM

Microsoft의 Omniparser V2 및 Omnitool : AI를 사용한 GUI 자동화 혁명 조미료 전문가처럼 Windows 11 인터페이스와 상호 작용하는 AI를 상상해보십시오. Microsoft의 Omniparser v2와 Omnitool은 이것을 다시 만듭니다

나는 Cursor AI와 함께 Vibe 코딩을 시도했는데 놀랍습니다!나는 Cursor AI와 함께 Vibe 코딩을 시도했는데 놀랍습니다!Mar 20, 2025 pm 03:34 PM

Vibe Coding은 끝없는 코드 라인 대신 자연 언어를 사용하여 애플리케이션을 생성함으로써 소프트웨어 개발의 세계를 재구성하고 있습니다. Andrej Karpathy와 같은 비전가들로부터 영감을 얻은이 혁신적인 접근 방식은 Dev가

REPLIT 에이전트 : 실제 예제가있는 가이드REPLIT 에이전트 : 실제 예제가있는 가이드Mar 04, 2025 am 10:52 AM

앱 개발 혁신 : REPLIT 에이전트에 대한 깊은 다이빙 복잡한 개발 환경으로 씨름하고 구성 파일을 모호하게하는 데 지쳤습니까? REPLIT 에이전트는 아이디어를 기능적 앱으로 변환하는 프로세스를 단순화하는 것을 목표로합니다. 이 ai-p

활주로 ACT-One Guide : 나는 그것을 테스트하기 위해 스스로 촬영했다활주로 ACT-One Guide : 나는 그것을 테스트하기 위해 스스로 촬영했다Mar 03, 2025 am 09:42 AM

이 블로그 게시물은 Web Interface와 Python API를 모두 다루는 Runway ML의 새로운 Act-One Animation Tool을 테스트하는 경험을 공유합니다. 유망하지만 내 결과는 예상보다 덜 인상적이었습니다. 생성 AI를 탐색하고 싶습니까? p에서 llms를 사용하는 법을 배우십시오

2025 년 2 월 2 일 Genai 출시 : GPT-4.5, Grok-3 & More!2025 년 2 월 2 일 Genai 출시 : GPT-4.5, Grok-3 & More!Mar 22, 2025 am 10:58 AM

2025 년 2 월은 Generative AI의 또 다른 게임 변화 달이었으며, 가장 기대되는 모델 업그레이드와 획기적인 새로운 기능을 제공합니다. Xai 's Grok 3 및 Anthropic's Claude 3.7 Sonnet, Openai 's G에 이르기까지

물체 감지에 Yolo V12를 사용하는 방법은 무엇입니까?물체 감지에 Yolo V12를 사용하는 방법은 무엇입니까?Mar 22, 2025 am 11:07 AM

Yolo (한 번만 보이면)는 주요 실시간 객체 감지 프레임 워크였으며 각 반복은 이전 버전에서 개선되었습니다. 최신 버전 Yolo V12는 정확도를 크게 향상시키는 발전을 소개합니다.

Elon Musk & Sam Altman은 5 천억 달러 이상의 Stargate 프로젝트를 충돌시킵니다.Elon Musk & Sam Altman은 5 천억 달러 이상의 Stargate 프로젝트를 충돌시킵니다.Mar 08, 2025 am 11:15 AM

OpenAi, SoftBank, Oracle 및 Nvidia와 같은 기술 거인이 지원하고 미국 정부의 지원을받는 5 천억 달러 규모의 Stargate AI 프로젝트는 미국 AI 리더십을 굳히는 것을 목표로합니다. 이 야심 찬 사업은 AI Advanceme의 미래를 약속합니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

안전한 시험 브라우저

안전한 시험 브라우저

안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

DVWA

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 영어 버전

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전