首頁  >  文章  >  後端開發  >  python資料探勘需要學什麼

python資料探勘需要學什麼

(*-*)浩
(*-*)浩原創
2019-06-22 15:02:032903瀏覽

只要能解決實際問題,用什麼工具來學習資料探勘都是無所謂,這裡首推Python。

python資料探勘需要學什麼

需要掌握Python中的哪些知識?(推薦學習:Python影片教學

1、Pandas函式庫的操作

Panda是資料分析特別重要的一個函式庫,我們要掌握以下三點:

· pandas 分組運算;

· pandas 索引與多重索引;

索引比較難,但是卻是非常重要的

· pandas 多表運算與資料透視表

2、numpy數值計算

numpy資料計算主要應用是在資料探勘,對於以後的機器學習,深度學習,這也是一個必須掌握的函式庫,我們要掌握以下內容:

· Numpy array理解;

· 數組索引操作;

#· 數組計算;

· Broadcasting(線性代數裡面的知識)

3、資料視覺化-matplotlib與seaborn

· Matplotib語法

python最基本的視覺化工具就是matplotlib。咋一看Matplotlib與matlib有點像,要搞清楚二者的關係是什麼,這樣學習起來才會比較輕鬆。

· seaborn的使用

seaborn是一個非常漂亮的視覺化工具。

· pandas繪圖功能

前面說過pandas是做資料分析的,但它也提供了一些繪圖的API。

4、資料探勘入門

這部分是最難也是最有趣的一部分,要掌握以下幾個部分:

· 機器學習的定義

在這裡跟資料探勘先不做差別

· 代價函數的定義

· Train/Test/Validate

· Overfitting的定義與避免方法

5、資料探勘演算法

資料探勘發展到現在,演算法已經非常多,以下只需掌握最簡單的,最核心的,最常用的演算法:

· 最小平方法演算法;

· 梯度下降;

· 向量化;

· 極大似然估計;

· Logistic Regression;

##· Decision Tree;

#· RandomForesr;

##· XGBoost;

6、資料探勘實戰

透過機器學習裡面最著名的函式庫scikit-learn來進行模型的理解。

更多Python相關技術文章,請造訪

Python教學

欄位學習!

以上是python資料探勘需要學什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn