首页  >  文章  >  后端开发  >  使用Pandas数据分析之Series

使用Pandas数据分析之Series

P粉469731340
P粉469731340原创
2022-07-21 17:08:45153浏览

一、工具准备

数据分析一个很好的工具:anaconda,本教程是在win10系统中使用anaconda3的jupyter工具,该工具运行在浏览器中。

  1. 下载网址:https://www.anaconda.com/

  2. 启动方法

  • 开始菜单,打开anaconda prompt命令行窗口

  • 进入到项目所在目录,该目录自己设定

  • 使用命令jupyter notebook即可打开浏览器

二、Series类型

索引一旦被创建,里面的值不能被单个修改

1. 创建Series对象

  • 通过列表或者数组创建对象

import pandas as pd
import numpy as np
users=['张三','李四','王老五']
series1=pd.Series(users)
print(series1)

以上代码结果:

0     张三
1     李四
2    王老五
dtype: object
  • 通过字典创建series对象

users={'张三':20,'李四':25,'王五':21}
series2=pd.Series(users)
print(series2)

以上代码结果:

张三    20
李四    25
王五    21
dtype: int64

2. 获取Series的序列

print(series2.index)

以上代码结果:

Index(['张三', '李四', '王五'], dtype='object')

3. 获取Series的值

print(series2.values)

以上代码结果:

[20 25 21]

4. 获取某一个值

print(series2.values)
print(series2[1])
print(series2['王五'])

以上代码结果:

25
21

上面两种方法都可以获取到Series的值

5. 日期时间索引

pd.date_range('2022-10-01',periods=4,freq='M')
  • periods:分多个区间

  • freq:按年、月、日、周、时间等划分

6.时间间隔索引

pd.TimedeltaIndex([10,12,14,16],unit="D")

以上代码结果:

TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
  • unit的值可以换成Y,W,H等等

7.索引取值

import numpy as np
import pandas as pd
pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D'])
# pd['A':'C']#通过索引名称取值,结果包含最后一个
pd[0:3]#通过索引下标取值,结果不包含最后一个

8. 条件索引

conditon=series>50
series[conditon]
或
series[series>50]

以上代码结果:

	0	1	2	3	4
A	84.0	63.0	76.0	72.0	77.0
B	NaN	96.0	NaN	65.0	NaN
C	NaN	NaN	NaN	81.0	NaN
D	74.0	89.0	NaN	NaN	53.0

以上是使用Pandas数据分析之Series的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn