生成式模型與辨別式模型-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

生成式模型與辨別式模型

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 19, 2023 pm 09:31 PM

分類模型辨別式模型生成式模型

分類模型可分為兩大類:生成式模型與辨別式模型。本文解釋了這兩種模型類型之間的區別，並討論了每種方法的優缺點。

生成式模型與辨別式模型

辨別式模型

辨別式模型是一種能夠學習輸入資料和輸出標籤之間關係的模型，它透過學習輸入資料的特徵來預測輸出標籤。在分類問題中，我們的目標是將每個輸入向量x分配給標籤y。判別模型試圖直接學習將輸入向量對應到標籤的函數f(x)。這些模型可以進一步分為兩個子類型:

分類器試圖找到f(x)而不使用任何機率分佈。這些分類器直接為每個樣本輸出一個標籤，而不提供類別的機率估計。這些分類器通常稱為確定性分類器或無分佈分類器。此類分類器的例子包括k近鄰、決策樹和SVM。

分類器首先從訓練資料中學習後驗類機率P(y = k|x)，並根據這些機率將一個新樣本x分配給其中一個類別(通常是後驗機率最高的類)。

這些分類器通常被稱為機率分類器。這種分類器的例子包括邏輯迴歸和在輸出層中使用sigmoid或softmax函數的神經網路。

在所有條件相同的情況下，我一般都使用機率分類器而不是確定性分類器，因為這個分類器提供了關於將樣本分配給特定類別的置信度的額外資訊。

一般的判別式模型包括：

邏輯迴歸（Logistic Regression，LR）
支援向量機（Support Vector Machine，SVM）
決策樹（Decision Tree，DT）

生成式模型

生成式模型在估計類別機率之前學習輸入的分佈。生成式模型是一種能夠學習資料生成過程的模型，它可以學習輸入資料的機率分佈，並產生新的資料樣本。

更具體地說生成模型首先從訓練資料估計類別的條件密度P(x|y = k)和先驗類別機率P(y = k)。他們試圖了解每個分類的數據是如何產生的。

接著利用貝葉斯定理估計後驗類別機率:

生成式模型與辨別式模型

#貝葉斯規則的分母可以用分子中出現的變數來表示:

生成式模型與辨別式模型

生成式模型也可以先學習輸入和標籤P(x, y)的聯合分佈，然後將其歸一化以獲得後驗機率P(y = k |x)。一旦我們有了後驗機率，我們就可以用它們將一個新的樣本x分配給其中一個類別(通常是後驗機率最高的類別)。

例如,考慮一個圖像分類任務中,我們需要區分圖像狗(y = 1)和貓(y = 0)。生成模型首先會建立一個狗 P(x|y = 1) 的模型，以及貓 P(x|y = 0) 的模型。然後在對新圖像進行分類時，它會將其與兩個模型進行匹配，以查看新圖像看起來更像狗還是更像貓。

為生成模型允許我們從學習的輸入分佈P(x|y)中產生新的樣本。所以我們稱之為生成式模型。最簡單的例子是，對於上面的模型我們可以從P(x|y = 1)中取樣來產生新的狗的圖像。

一般的生成模型包括

樸素貝葉斯(Naïve Bayes)
高斯混合模型(GMMs)
隱馬可夫模型(hmm)
線性判別分析(LDA)

深度生成模型(DGMs)結合了生成模型和深度神經網路：

生成式對抗網路（Generative Adversarial Network，GAN）
自回歸模型，例如GPT（Generative Pre-trained Transformer）是一種包含數十億參數的自迴歸語言模型。

區別和優缺點

生成式模型和辨別式模型的主要差異在於它們學習的目標不同。生成式模型學習輸入資料的分佈，可以產生新的資料樣本。辨別式模型學習輸入資料和輸出標籤之間的關係，可以預測新的標籤。

生成式模型：

產生模型給了我們更多的信息，因為它們同時學習輸入分佈和類別機率。可以從學習的輸入分佈中產生新的樣本。並且可以處理缺失的數據，因為它們可以在不使用缺失值的情況下估計輸入分佈。但是大多數判別模型要求所有的特徵都存在。

訓練複雜度高，因為生成式模型要建立輸入資料和輸出資料之間的聯合分佈，需要大量的運算和儲存資源。對資料分佈的假設比較強，因為生成式模型要建立輸入資料和輸出資料之間的聯合分佈，需要對資料的分佈進行假設和建模，因此對於複雜的資料分佈，生成式模型在小規模的計算資源上並不適用。

生成模型可以處理多模態數據，因為生成式模型可以建立輸入資料和輸出資料之間的多元聯合分佈，從而能夠處理多模態資料。

辨別式模型：

如果不對資料做一些假設，生成式模型學習輸入分佈P(x|y)在計算上是困難的，例如，如果x由m個二進位特徵組成，為了對P(x|y)建模，我們需要從每個類別的資料中估計2個ᵐ參數(這些參數表示m個特徵的2個ᵐ組合中的每一個的條件機率)。而Naïve Bayes等模型則對特徵進行條件獨立性假設，以減少需要學習的參數數量，因此訓練複雜度低。但是這樣的假設通常會導致生成模型比判別模型表現得更差。

對於複雜的資料分佈和高維資料具有很好的表現，因為辨別式模型可以靈活地對輸入資料和輸出資料之間的映射關係進行建模。

辨別式模型對雜訊資料和缺失資料敏感，因為模型只考慮輸入資料和輸出資料之間的映射關係，不利用輸入資料中的資訊填補缺失值和移除雜訊。

總結

生成式模型和辨別式模型都是機器學習中重要的模型類型，它們各自具有優點和適用場景。在實際應用中，需要根據特定任務的需求選擇合適的模型，並結合混合模型和其他技術手段來提高模型的效能和效果。

以上是生成式模型與辨別式模型的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

微軟工作趨勢指數2025顯示工作場所容量應變Apr 24, 2025 am 11:19 AM

由於AI的快速整合而加劇了工作場所的迅速危機危機，要求戰略轉變以外的增量調整。 WTI的調查結果強調了這一點：68％的員工在工作量上掙扎，導致BUR

AI可以理解嗎？中國房間的論點說不，但是對嗎？Apr 24, 2025 am 11:18 AM

約翰·塞爾（John Searle）的中國房間論點：對AI理解的挑戰 Searle的思想實驗直接質疑人工智能是否可以真正理解語言或具有真正意識。想像一個人，對下巴一無所知

中國的'智能” AI助手回應微軟召回的隱私缺陷Apr 24, 2025 am 11:17 AM

與西方同行相比，中國的科技巨頭在AI開發方面的課程不同。他們不專注於技術基準和API集成，而是優先考慮“屏幕感知” AI助手 - AI T

Docker將熟悉的容器工作流程帶到AI型號和MCP工具Apr 24, 2025 am 11:16 AM

MCP：賦能AI系統訪問外部工具模型上下文協議（MCP）讓AI應用能夠通過標準化接口與外部工具和數據源交互。由Anthropic開發並得到主要AI提供商的支持，MCP允許語言模型和智能體發現可用工具並使用合適的參數調用它們。然而，實施MCP服務器存在一些挑戰，包括環境衝突、安全漏洞以及跨平台行為不一致。 Forbes文章《Anthropic的模型上下文協議是AI智能體發展的一大步》作者：Janakiram MSVDocker通過容器化解決了這些問題。基於Docker Hub基礎設施構建的Doc