首頁  >  文章  >  後端開發  >  使用Pandas資料分析之Series

使用Pandas資料分析之Series

P粉469731340
P粉469731340原創
2022-07-21 17:08:45177瀏覽

一、工具準備

資料分析一個很好的工具:anaconda,本教學是在win10系統中使用anaconda3的jupyter工具,該工具運行在瀏覽器中。

  1. 下載網址:https://www.anaconda.com/

  2. 啟動方法

  • 開始選單,開啟anaconda prompt命令列視窗

  • #進入到專案所在目錄,該目錄自己設定

  • 使用指令jupyter notebook即可開啟瀏覽器

#二、Series類型

索引一旦被創建,裡面的值不能被單一修改

1. 創建Series物件

透過列表或陣列創建物件

import pandas as pd
import numpy as np
users=['张三','李四','王老五']
series1=pd.Series(users)
print(series1)

以上程式碼結果:

0     张三
1     李四
2    王老五
dtype: object

透過字典建立series物件

users={'张三':20,'李四':25,'王五':21}
series2=pd.Series(users)
print(series2)

以上程式碼結果:

张三    20
李四    25
王五    21
dtype: int64

2. 取得Series的序列

print(series2.index)
以上程式碼結果:

Index(['张三', '李四', '王五'], dtype='object')
  • 3. 取得Series的值

    print(series2.values)
  • 以上程式碼結果:
  • [20 25 21]

    4. 取得某一個值
print(series2.values)
print(series2[1])
print(series2['王五'])

以上程式碼結果:

25
21

上面兩種方法都可以取得到Series的值

  • 5. 日期時間索引

    pd.date_range('2022-10-01',periods=4,freq='M')
    #########periods:分多個區間#### ########freq:按年、月、日、週、時間等分割################6.時間間隔索引######
    pd.TimedeltaIndex([10,12,14,16],unit="D")
    # ##以上程式碼結果:###
    TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
    #########unit的值可以換成Y,W,H等等###

7.索引取值

import numpy as np
import pandas as pd
pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D'])
# pd['A':'C']#通过索引名称取值,结果包含最后一个
pd[0:3]#通过索引下标取值,结果不包含最后一个

8. 条件索引

conditon=series>50
series[conditon]
或
series[series>50]

以上代码结果:

	0	1	2	3	4
A	84.0	63.0	76.0	72.0	77.0
B	NaN	96.0	NaN	65.0	NaN
C	NaN	NaN	NaN	81.0	NaN
D	74.0	89.0	NaN	NaN	53.0

以上是使用Pandas資料分析之Series的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn