>  기사  >  백엔드 개발  >  ARIMA 모델에 맞는 Python의 statsmodels 모듈 사용 소개

ARIMA 모델에 맞는 Python의 statsmodels 모듈 사용 소개

coldplay.xixi
coldplay.xixi앞으로
2021-01-20 17:37:234402검색

ARIMA 모델에 맞는 Python의 statsmodels 모듈 사용 소개

관련 무료 학습 권장사항: python 비디오 튜토리얼

필요한 패키지 및 모듈 가져오기

from scipy import statsimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima.model import ARIMAfrom statsmodels.graphics.tsaplots import plot_predict
plt.rcParams['font.sans-serif']=['simhei']#用于正常显示中文标签plt.rcParams['axes.unicode_minus']=False#用于正常显示负号

1 데이터를 읽고 그래프를 그립니다.

data=pd.read_csv('数据/客运量.csv',index_col=0)data.index = pd.Index(sm.tsa.datetools.dates_from_range('1949', '2008'))#将时间列改为专门时间格式,方便后期操作data.plot(figsize=(12,8),marker='o',color='black',ylabel='客运量')#画图

#Passenger flow 시계열 데이터 이 글 : https://download.csdn.net/download/weixin_45590329/14143811
#시계열 꺾은선형 차트는 아래와 같이 데이터가 증가하는 추세를 보이고 있으며 초기에는 데이터가 증가하는 것으로 판단됩니다. not stable

2. 정상성 테스트

sm.tsa.adfuller(data,regression='c')sm.tsa.adfuller(data,regression='nc')sm.tsa.adfuller(data,regression='ct')

가 수행되었습니다. 세 가지 형태의 ADF 단위근 테스트에서 일부 결과에 표시된 것처럼 계열이 정상적이지 않은 것으로 나타났습니다

3. data

diff=data.diff(1)diff.dropna(inplace=True)diff.plot(figsize=(12,8),marker='o',color='black')#画图

데이터의 1차 차분을 꺾은선형 차트로 작성하여 처음에는 정상이라고 판단합니다

4. 1차 차분 데이터에 대해 정상성 검정을 실시합니다

sm.tsa.adfuller(diff,regression='c')sm.tsa.adfuller(diff,regression='nc')sm.tsa.adfuller(diff,regression='ct')

그림과 같이 이는 시퀀스가 ​​고정되어 있음을 나타내는 그림입니다

5. ARIMA(p, d, q) 순서를 결정합니다

fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(diff.values.squeeze(), lags=12, ax=ax1)#自相关系数图1阶截尾,决定MA(1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(diff, lags=12, ax=ax2)#偏相关系数图1阶截尾,决定AR(1)

자기 상관 계수 다이어그램 ACF 및 부분 자기 상관 계수 플롯 PACF에 따라 원본 데이터를 ARIMA( 1,1,1) 모델

6. 파이썬 튜토리얼

(동영상)

위 내용은 ARIMA 모델에 맞는 Python의 statsmodels 모듈 사용 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 csdn.net에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제