回歸(regression)和分類(classification)是兩種最常見的機器學習問題類型,如下圖所示。
迴歸問題通常用來預測一個值,其標籤的值是連續的。例如,預測房價、未來的天氣等任何連續性的走勢、數值。比較常見的迴歸演算法是線性迴歸(linear regression)演算法以及深度學習中的神經網路等。
分類問題是將事物標記一個類別標籤,結果為離散值,也就是類別中的一個選項,例如,判斷一幅圖片上的動物是一隻貓還是一隻狗。分類有二元分類和多元分類,每個類別的最終正確結果只有一個。分類是機器學習的經典應用領域,許多機器學習演算法都可以用於分類,包括最基礎的邏輯迴歸演算法、經典的決策樹演算法,以及深度學習中的神經網路等。還有從多元分類上衍生出來的多標籤分類問題,典型應用如社交網站中上傳照片時的自動標註人名功能,以及推薦系統——在網站或App中為同一個用戶推薦多種產品,或把某一種產品推薦給多個使用者。
當然,除了回歸問題和分類問題之外,機器學習的應用場景還有很多。例如,無監督學習中最常見的聚類(clustering)問題是在沒有標籤的情況下,把資料依照其特徵的性質分成不同的簇(其實也就是資料分類);還有一種無監督學習是關聯規則,透過它可以找到特徵之間的影響關係。
又例如時間序列,指在內部結構隨時間呈現規律性變化的資料集,如趨勢性資料、隨季節變化的資料等。時間序列問題其實也就是和時間、週期緊密關聯的迴歸問題。具體應用情境包括預測金融市場的波動,推斷太陽活動、潮汐、天氣甚至恆星的誕生、星系的形成,預測流行疾病傳播過程等。
還有結構化輸出。通常機器學習都是輸出一個答案或選項,有時需要透過學習輸出一個結構。什麼意思呢?例如,在語音辨識中,機器輸出的是一個句子,句子是有標準結構的,不只是數字0~9這麼簡單(辨識0~9是分類問題),這比一般的分類問題更進一步。具體應用場景包括語音辨識——輸出語法結構正確的句子、機器翻譯——輸出合乎規範的文章。
還有一部分機器學習問題的目標不是解決問題,而是令世界變得更加豐富多彩,因此AI也可以進行藝術家所做的工作,例如以下幾種。 Google的Dreamwork可以結合兩種圖片的風格進行藝術化的風格遷移。生成式對抗網路GAN能造出以假亂真的圖片。挖掘數位特徵向量的潛隱空間,進行音樂、新聞、故事等創作。
我們可以把這種機器學習應用程式稱為生成式學習。
還有些時候,機器學習的目標是做出決定,這時叫它們決策性問題。決策性問題本質上仍然是分類問題,因為每一個決策實際上還是在用最適合的行為來分類環境的某一個狀態。例如,自動駕駛中的方向(左、中、右),以及圍棋中的落點,仍然是19×19個類別的其中之一。具體應用場景包括自動駕駛、智能體玩遊戲、機器人下棋等。在許多決策性問題中,機器必須學習哪些決策是有效的、可以帶來回報的,哪些是無效的、會帶來負報酬的,以及哪些是對長遠目標有利的。因此,強化學習是這種情況下的常用技術。
整體來說,機器學習的訣竅在於要了解自己的問題,並針對自己的問題選擇最佳的機器學習方法(演算法),也就是找到哪一種技術最有可能適合這種情況。如果能把場景或任務和適宜的技術連結起來,就可以在遇到問題時心中有數,迅速定位一個解決方向。下圖將一些常見的機器學習應用場景和機器學習模型進行了連接
以上是機器學習的應用範圍有哪些?的詳細內容。更多資訊請關注PHP中文網其他相關文章!