1. ARIMA 모형 및 SARIMA 모형
ARIMA(Autoregressive Integrated Moving Average) 모형은 ‘현재의 시계열이 과거 관측 값들에 의해 설명된다’는 AR(Autoregressive)과 ‘시계열이 과거 오차항으로 설명된다’는 MA(Moving Average)’ 그리고 불안정한 시계열을 정상화하는 과정(Integrated)이 포함된 모형이다.
Box-Jenkins 모형구축방법을 적용하여 ARIMA 모형을 식별하기 전에 시계열 자료의 안정 성(stationary)을 확인하는 절차가 선행되어야 한다. 시계열 자료가 불안정한 경우에 차분 (difference) 혹은 적분(Integrated)의 과정을 거쳐 자료를 안정적 시계열로 바꾼 후 모형에 적용시켜야 하는데, ARIMA 모형은 불안정한 시계열 자료를 안정적 시계열로 변환시킨 후, ARMA모형에 적합시키는 모형을 의미한다.
ARIMA(p,d,q) 모형의 기본 형태는 식(1)과 같다.
위 연산자를 사용하면 ARIMA(p,d,q) 모형을 식 (3)으로 간단히 나타낼 수 있다.
ARIMA(p,d,q) 모형에서 만약 d=0 이라면, ARMA(p,q)모형이 된다.
ARIMA 모형은 다양한 분야의 예측에 활용되는 방법이다. 하지만 시계열 자료의 주기적 특성을 반영하지 못한다는 단점이 있으며, 만약 원시계열 자료가 주기적 특성 또는 계절성을 보이는 경우, ARIMA 모형을 적용하기에는 다소 무리가 있다. 이러한 ARIMA 모형의 문제점을
보완한 모형이 SARIMA 모형이다. SARIMA 모형은 미래를 예측함에 있어 ARIMA 모형처럼 예측시점과 가까운 과거 자료를
이용할 뿐만 아니라, 원자료의 주기적 특성을 반영하여 그 이전 주기의 자료를 추가적으로 활용한다. 이러한 방식으로 최근의 정보와 이전 주기의 정보를 모두 반영하는 것이다. SARIMA(p,d,q)(P,D,Q)s 모형을 수식으로 나타내면 식 (4)와 같다.
2. SARIMA 모형 추정 방법
시계열 자료가 어떠한 과정을 따르는지 구분하고, 모형 추정 및 미래 예측을 위해서는 Figure 1 와 같이 안정성 검정, 모형 식별, 모수 추정, 모형 진단, 예측의 단계를 거친다.
시계열 자료는 안정적(stationary) 시계열과 불안정적(non-stationary) 시계열로 나뉘는데, 안정적 시계열이란 시점과 무관하게 평균, 분산이 일정한 시계열을 의미한다. Box-Jenkins에 의해 개발된 ARIMA 모형 구축절차를 적용하기 위해서는 안정적 시계열이어야 하므로 모형 추정에 앞서, 시계열 자료가 안정적인지를 확인하고, 불안정 시계열이라면 로그변환, 차분 등을 통해 안정적 시계열로 변환시키는 과정이 필요하다.
모형 식별 단계에서는 SARIMA(p,d,q)(P,D,Q 의 차수를 결정한다. 비계절차분 횟수인 ‘d’와 계절차분 횟수인 ‘D’는 앞선 안정성 검정 단계에서 시계열을 안정적으로 만드는 과정에서 자동으로 결정된다. 다음으로 ‘p’,‘P’,‘q’,‘Q’의 차수는 자기상관함수(Autocorrelation function: ACF) 및 부분자기상관함수(Partial Autocorrelation function: PACF)를 관찰하여 결정하게 된다.
모수 추정 단계는 모형 식별 단계에서 찾은 ‘p’,‘d’,‘q’,‘P’,‘D’,‘Q’의 차수로 결정된 모형에 포함되어 있는 AR, MA, SAR, SMA항의 모수를 추정하는 단계이다. 이 단계에서는 차수가 달라질 때 변화하는 AIC(Akaike’s information criterion)와 BIC(Bayesian Information Criterion) 등의 값을 비교하여, AIC와 BIC의 값이 낮을수록 우수한 모형이라고 판단하며, 추정된 모수가 통계적으로 유의한지를 확인한다.
모형 진단 단계는 추정된 모형이 시계열 자료를 잘 설명하는가를 확인하는 단계이다. 모형 이 통계적으로 적절하다면 잔차는 자기상관(Autocorrelation)이 존재하지 않는 백색 잡음 (White Noise)으로 나타나야 한다. 이 단계에서는 잔차의 자기상관함수(ACF), 부분자기상관함수(PACF)를 확인하고, Ljung-Box 검정 통계량으로 잔차에 자기상관이 존재하는지 여부를 검증한다.
예측의 단계는 최종단계로서, 앞선 단계를 통해 선택된 모형을 활용하여 미래를 예측하는 단계이다. 이 단계는 사후예측으로 실제 수치와의 비교를 통혜 모형의 예측력을 검증할 수 있고, 그 이후의 수치를 예측하는데 활용될 수 있다.
No comments