一、工具準備
資料分析一個很好的工具:anaconda,本教學是在win10系統中使用anaconda3的jupyter工具,該工具運行在瀏覽器中。
下載網址:https://www.anaconda.com/
啟動方法
開始選單,開啟anaconda prompt命令列視窗
#進入到專案所在目錄,該目錄自己設定
使用指令jupyter notebook即可開啟瀏覽器
#二、Series類型
1. 創建Series物件
透過列表或陣列創建物件
import pandas as pd import numpy as np users=['张三','李四','王老五'] series1=pd.Series(users) print(series1)
以上程式碼結果:
0 张三 1 李四 2 王老五 dtype: object
透過字典建立series物件
users={'张三':20,'李四':25,'王五':21} series2=pd.Series(users) print(series2)
以上程式碼結果:张三 20
李四 25
王五 21
dtype: int64
print(series2.index)
以上程式碼結果:
Index(['张三', '李四', '王五'], dtype='object')
print(series2.values)
[20 25 21]4. 取得某一個值
print(series2.values) print(series2[1]) print(series2['王五'])
以上程式碼結果:25
21
pd.date_range('2022-10-01',periods=4,freq='M')#########periods:分多個區間#### ########freq:按年、月、日、週、時間等分割################6.時間間隔索引######
pd.TimedeltaIndex([10,12,14,16],unit="D")# ##以上程式碼結果:###
TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)#########unit的值可以換成Y,W,H等等###
7.索引取值
import numpy as np import pandas as pd pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D']) # pd['A':'C']#通过索引名称取值,结果包含最后一个 pd[0:3]#通过索引下标取值,结果不包含最后一个
8. 条件索引
conditon=series>50 series[conditon] 或 series[series>50]
以上代码结果:
0 1 2 3 4 A 84.0 63.0 76.0 72.0 77.0 B NaN 96.0 NaN 65.0 NaN C NaN NaN NaN 81.0 NaN D 74.0 89.0 NaN NaN 53.0
以上是使用Pandas資料分析之Series的詳細內容。更多資訊請關注PHP中文網其他相關文章!