1. 도구 준비
데이터 분석을 위한 좋은 도구: anaconda 이 튜토리얼은 브라우저에서 실행되는 win10 시스템의 anaconda3 jupyter 도구를 사용하는 것입니다.
다운로드 URL: https://www.anaconda.com/
시작 방법
시작 메뉴에서 아나콘다 프롬프트 명령줄 창을 엽니다.
프로젝트가 있는 디렉터리를 입력하세요. 디렉토리를 직접 설정하세요
jupyter Notebook 명령을 사용하여 브라우저를 엽니다
2. 시리즈 유형
한 번 인덱스가 생성되면 내부 값을 수정할 수 없습니다. 개별
1. 시리즈 객체 생성
목록이나 배열을 통해 객체 생성
import pandas as pd import numpy as np users=['张三','李四','王老五'] series1=pd.Series(users) print(series1)
위 코드 결과:
0 张三 1 李四 2 王老五 dtype: object
사전을 통해 시리즈 객체 생성
users={'张三':20,'李四':25,'王五':21} series2=pd.Series(users) print(series2)
위는 코드 결과:
张三 20 李四 25 王五 21 dtype: int64
2. 시리즈의 시퀀스를 가져옵니다.
print(series2.index)
위 코드의 결과:
Index(['张三', '李四', '王五'], dtype='object')
3. 시리즈의 값을 가져옵니다.
print(series2.values)
위 코드의 결과:
[20 25 21]
4. 특정 값을 얻습니다.
print(series2.values) print(series2[1]) print(series2['王五'])
위 코드의 결과:
25 21
위 두 가지 방법 중 하나로 시리즈의 값을 얻을 수 있습니다.
5.
pd.date_range('2022-10-01',periods=4,freq='M')
기간: 여러 간격으로 나누어짐
freq: 년, 월, 일, 주, 시간 등으로 나누어짐
6 시간 간격 지수
pd.TimedeltaIndex([10,12,14,16],unit="D")
의 결과 위 코드:
TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
단위 값은 Y, W, H 등으로 대체될 수 있습니다.
7.索引取值
import numpy as np import pandas as pd pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D']) # pd['A':'C']#通过索引名称取值,结果包含最后一个 pd[0:3]#通过索引下标取值,结果不包含最后一个
8. 条件索引
conditon=series>50 series[conditon] 或 series[series>50]
以上代码结果:
0 1 2 3 4 A 84.0 63.0 76.0 72.0 77.0 B NaN 96.0 NaN 65.0 NaN C NaN NaN NaN 81.0 NaN D 74.0 89.0 NaN NaN 53.0
위 내용은 Pandas 데이터 분석을 사용한 시리즈의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!