重新編寫的標題：探究半監督學習的應用領域及其相關場景-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

重新編寫的標題：探究半監督學習的應用領域及其相關場景

王林

Nov 18, 2023 pm 10:21 PM

人工智慧半監督學習

重新編寫的標題：探究半監督學習的應用領域及其相關場景

Labs 導讀

#隨著網路的發展，企業可以獲得越來越多的資料。這些數據有助於企業更了解用戶，即客戶畫像，並可以改善用戶體驗。然而，這些數據中可能存在大量未經標記的數據。如果所有數據都採用人工標記的方法，將會面臨兩個問題。首先，人工標記的時間成本較高，效率低。隨著資料量的增加，需要雇用更多的人員和更長的時間，成本也會更高。其次，隨著使用者規模的增加，很難透過手動標記來跟上資料的成長速度

Part 01、什麼是半監督式學習

##半監督學習是指使用既有標籤的資料又有無標籤的資料訓練模型。半監督學習通常會基於有標籤的資料建構屬性空間，再從無標籤的資料中提取有效資訊填充（或重構）屬性空間。因此，通常半監督學習的初始訓練集會劃分為有標籤的資料集D1和無標籤資料集D2，然後透過預處理、特徵提取等基本步驟後訓練半監督學習模型，然後將訓練好的模型用於生產環境，為使用者提供服務。重新編寫的標題：探究半監督學習的應用領域及其相關場景

Part 02、半監督學習的假設

為了實現標籤資料有效補充標籤數據中的「有用」信息，對數據分部等方面做出一些假設。半監督學習的基礎假設是p(x)中包含p(y|x)的信息，即無標籤的數據應該包含對於標籤預測有用的且與有標籤的數據不相同的或者很難從有標籤的數據中提取出來的資訊。此外，也存在一些服務於演算法的假設。例如，相似性假設（平滑假設）是指在資料樣本建構的屬性空間中，相近或相似的樣本具有相同的標籤；低密度分離假設是指在資料樣本少的地方存在一個決策邊界能區分不同標籤的數據。

以上假設主要目的是為了表明有標籤的資料與無標籤的資料來自相同的資料分佈。 Part 03、

半監督學習演算法分類 半監督學習演算法眾多，可大致分為直推式學習（transductive learning）和歸納式學習（Inductive model）## ，二者差異在於

用於模型評估的測試資料集的選擇重新編寫的標題：探究半監督學習的應用領域及其相關場景

。直推式的半監督學習是指需要預測標籤的資料集就是用於訓練的無標籤資料集，學習的目的是為了進一步提高預測結果的準確性。歸納式學習則是為完全未知的資料集預測標籤。

此外，常見的半監督學習演算法的步驟為：第一步會在有標籤的資料上訓練模型，然後用這個模型將無標籤的資料打上偽標籤，然後將偽標籤和有標籤的資料組合成新的訓練集，在這個訓練集上訓練一個新的模型，最後用這個模型將預測資料集貼上標籤。

Part 04、總結

#半監督學習的最大的問題是在許多情況下，模型的表現依賴有標籤的數據集，並且對於有標籤資料集的品質要求較高，甚至半監督學習模型預測準確度與基於有標籤資料集的有監督模型的結果相差不大，反而半監督模型為了有效提取無標籤資料中的有效訊息，會消耗更多的資源。因此，

半監督學習的發展方向是提高演算法的穩健性以及資料擷取的有效性。

############目前在半監督學習領域中，PU-Learning（正負樣本學習）是比較熱門的演算法。這類演算法主要應用於只有正樣本和無標籤資料的資料集。它的優點是在某些場景下，我們能夠相對容易地取得可靠的正樣本資料集，且資料量相對較大。舉例來說，在垃圾郵件偵測中，我們很容易取得大量的正常郵件資料######

以上是重新編寫的標題：探究半監督學習的應用領域及其相關場景的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

微軟工作趨勢指數2025顯示工作場所容量應變Apr 24, 2025 am 11:19 AM

由於AI的快速整合而加劇了工作場所的迅速危機危機，要求戰略轉變以外的增量調整。 WTI的調查結果強調了這一點：68％的員工在工作量上掙扎，導致BUR

AI可以理解嗎？中國房間的論點說不，但是對嗎？Apr 24, 2025 am 11:18 AM

約翰·塞爾（John Searle）的中國房間論點：對AI理解的挑戰 Searle的思想實驗直接質疑人工智能是否可以真正理解語言或具有真正意識。想像一個人，對下巴一無所知

中國的'智能” AI助手回應微軟召回的隱私缺陷Apr 24, 2025 am 11:17 AM

與西方同行相比，中國的科技巨頭在AI開發方面的課程不同。他們不專注於技術基準和API集成，而是優先考慮“屏幕感知” AI助手 - AI T

Docker將熟悉的容器工作流程帶到AI型號和MCP工具Apr 24, 2025 am 11:16 AM

MCP：賦能AI系統訪問外部工具模型上下文協議（MCP）讓AI應用能夠通過標準化接口與外部工具和數據源交互。由Anthropic開發並得到主要AI提供商的支持，MCP允許語言模型和智能體發現可用工具並使用合適的參數調用它們。然而，實施MCP服務器存在一些挑戰，包括環境衝突、安全漏洞以及跨平台行為不一致。 Forbes文章《Anthropic的模型上下文協議是AI智能體發展的一大步》作者：Janakiram MSVDocker通過容器化解決了這些問題。基於Docker Hub基礎設施構建的Doc