機器學習是人工智慧的一個分支。人工智慧的研究是從以「推理」為重點到以「知識」為重點,再到以「學習」為重點,一條自然、清晰的脈絡。顯然,機器學習是實現人工智慧的一個途徑,即以機器學習為手段解決人工智慧中的問題。機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。機器學習理論主要是設計和分析一些讓電腦可以自動「學習」的演算法。機器學習演算法是一類從資料中自動分析獲得規律,並利用規律對未知資料進行預測的演算法。因為學習演算法中涉及了大量的統計理論,機器學習與推論統計聯繫尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。很多推論問題屬於無程式可循難度,所以部分的機器學習研究是發展容易處理的近似演算法。
#機器學習已廣泛應用於資料探勘、電腦視覺、自然語言處理、生物特徵識別、搜尋引擎、醫學診斷、檢測信用卡詐欺、證券市場分析、DNA序列定序、語音和手寫識別、戰略遊戲和機器人等領域。
定義
機器學習有以下幾種定義:
- 機器學習是一門人工智慧的科學,該領域的主要研究對像是人工智慧,特別是如何在經驗學習中改善具體演算法的效能。
- 機器學習是對能透過經驗自動改進的電腦演算法的研究。
- 機器學習是用數據或以往的經驗,以此優化電腦程式的效能標準。
一種常被引用的英文定義是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
分類
機器學習可以分成以下幾個類別:
- 監督學習從給定的訓練資料集中學習出一個函數,當新的資料到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習演算法包括迴歸分析和統計分類。
監督學習和非監督學習的差異就是訓練集目標是否人標註。他們都有訓練集 且都有輸入和輸出
- 無監督學習與監督學習相比,訓練集沒有人為標註的結果。常見的無監督學習演算法有聚類。
- 半監督學習介於監督學習與無監督學習之間。
- 增強學習透過觀察來學習做成如何的動作。每個動作都會對環境有所影響,學習對象會根據觀察到的周圍環境的回饋來做出判斷。
參考文獻
- Bishop, C. M. (1995). 《模式辨識神經網路》,牛津大學出版社. ISBN 0-19-853864-2.
- Bishop, C. M. (2006). 《模式辨識與機器學習》,Springer. ISBN 978-0-387-31073-2.
- Richard O. Duda, Peter E. Hart, David G. Stork (2001). 《模式分類》(第2版), New York: Wiley. ISBN 0-471-05669-3.
- MacKay, D. J. C. (2003). 《資訊理論、推理與學習演算法》,劍橋大學出版社. ISBN 0-521-64298-1
- Mitchel.l, T. (1997). 《機器學習》, McGraw Hill. ISBN 0-07-042807-7
- Sholom Weiss, Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5.
以上是機器學習-入門知識的詳細內容。更多資訊請關注PHP中文網其他相關文章!