本篇文章給大家分享了關於Python資料處理的相關內容以及要點解釋,對此知識點有興趣的朋友可以參考學習下。
Numpy、Pandas是Python資料處理中常用到的兩個框架,都是採用C語言編寫,所以運算速度快。 Matplotlib是Python的的畫圖工具,可以把之前處理後的資料透過影像繪製出來。之前只是看過文法,沒有系統學習總結過,這篇部落格文章總結了這三個架構的API。
以下是這三個框架的簡單介紹和區別:
Numpy:經常用於資料生成和一些運算
Pandas:基於Numpy建構的,是Numpy的升級版本
#Matplotlib:Python中強大的繪圖工具
Numpy
Numpy快速入門教學可參考:Numpy tutorial
Numpy屬性
ndarray.ndim:維度
ndarray.shape:行數和列數,例如(3, 5)
#ndarray.size:元素的數量
Numpy建立
array(object, dtype=None):使用Python的list或tuple建立資料Numpy運算
#加、減:a b、a - b刪除遺失資料的行:df.dropna(how='any')
填入遺失數據:df.fillna(value=5)
資料值是否為NaN:pd.isna(df1)
##Pandas合併資料
#pd.concat([df1, df2, df3], axis=0):合併df
pd.merge(left, right, on='key'):依據key欄位合併
df.append(s, ignore_index=True):新增資料
Pandas導入導出
pd.read_csv('foo.csv'):從csv檔讀取
df.to_excel('foo.xlsx', sheet_name='Sheet1'):儲存到excel檔案pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA']):從excel檔案讀取
Matplotlibimport pandas as pd import numpy as np import matplotlib.pyplot as plt # 随机生成1000个数据 data = pd.Series(np.random.randn(1000),index=np.arange(1000)) # 为了方便观看效果, 我们累加这个数据 data.cumsum() # pandas 数据可以直接观看其可视化形式 data.plot() plt.show()##相關推薦:
淺聊python日誌的設定檔路徑問題
################################################### #以上是淺析Python資料處理的詳細內容。更多資訊請關注PHP中文網其他相關文章!