관련 무료 학습 권장사항: python 비디오 튜토리얼
필요한 패키지 및 모듈 가져오기
from scipy import statsimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima.model import ARIMAfrom statsmodels.graphics.tsaplots import plot_predict plt.rcParams['font.sans-serif']=['simhei']#用于正常显示中文标签plt.rcParams['axes.unicode_minus']=False#用于正常显示负号
1 데이터를 읽고 그래프를 그립니다.
data=pd.read_csv('数据/客运量.csv',index_col=0)data.index = pd.Index(sm.tsa.datetools.dates_from_range('1949', '2008'))#将时间列改为专门时间格式,方便后期操作data.plot(figsize=(12,8),marker='o',color='black',ylabel='客运量')#画图
#Passenger flow 시계열 데이터 이 글 : https://download.csdn.net/download/weixin_45590329/14143811
#시계열 꺾은선형 차트는 아래와 같이 데이터가 증가하는 추세를 보이고 있으며 초기에는 데이터가 증가하는 것으로 판단됩니다. not stable
2. 정상성 테스트
sm.tsa.adfuller(data,regression='c')sm.tsa.adfuller(data,regression='nc')sm.tsa.adfuller(data,regression='ct')
가 수행되었습니다. 세 가지 형태의 ADF 단위근 테스트에서 일부 결과에 표시된 것처럼 계열이 정상적이지 않은 것으로 나타났습니다
3. data
diff=data.diff(1)diff.dropna(inplace=True)diff.plot(figsize=(12,8),marker='o',color='black')#画图
데이터의 1차 차분을 꺾은선형 차트로 작성하여 처음에는 정상이라고 판단합니다
4. 1차 차분 데이터에 대해 정상성 검정을 실시합니다
sm.tsa.adfuller(diff,regression='c')sm.tsa.adfuller(diff,regression='nc')sm.tsa.adfuller(diff,regression='ct')
그림과 같이 이는 시퀀스가 고정되어 있음을 나타내는 그림입니다
5. ARIMA(p, d, q) 순서를 결정합니다
fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(diff.values.squeeze(), lags=12, ax=ax1)#自相关系数图1阶截尾,决定MA(1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(diff, lags=12, ax=ax2)#偏相关系数图1阶截尾,决定AR(1)
자기 상관 계수 다이어그램 ACF 및 부분 자기 상관 계수 플롯 PACF에 따라 원본 데이터를 ARIMA( 1,1,1) 모델
6. 파이썬 튜토리얼
(동영상)
위 내용은 ARIMA 모델에 맞는 Python의 statsmodels 모듈 사용 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!