Statistics/예측방법론

시계열분해의 개요 시계열의 변동요인 시계열은 4가지 변동으로 구성 추세변동 : 시간에 따라 증감하는 경향이 있는 장기적 변동 순환변동 : 주기적 변동 중 주기가 1년을 초과하고 추세변동보다 짧은 변동 계절변동 : 1년 주기 반복되는 계절변동과 달력변동 불규칙변동 : 세가진 요인 외 변동, 특이항과 순수 불규칙 변동 시계열은 변동요인의 곱(승법), 또는 합(가법)으로 표현 시계열은 대체로 시간에 따라 증가, 그 변동도 커지는 경우 다수 로그가법모형이 주로 이용 ㏑𝑦𝑡 = ㏑𝑇𝑡 + ㏑𝐶𝑡 + ㏑𝑆𝑡 + ㏑𝐼𝑡 월/분기별 시계열 𝑦𝑡 = 𝑇𝑡 + 𝐶𝑡 + 𝑆𝑡 + 𝐻𝑡 + 𝑂𝑡 + 𝐼𝑡 𝐻𝑡 : 달력변동, 𝑂𝑡 : 특이항 일별 시계열 𝑦𝑡 = 𝑇𝑡 + 𝐶𝑡 + 𝑆𝑡⁽⁷⁾ + 𝑆𝑡⁽³¹⁾ + 𝑆𝑡⁽³⁶⁵⁾ +..

회귀모형의 진단방법 회귀모형 진단의 개요 회귀모형의 타당성 : 잔차 𝑟𝑡 를 𝑥축 중심으로 시각화해 타당성 검토 잔차가 𝑥축 중심 임의 분포 : 모형이 타당 잔차가 𝑥축 중심 일정한 함수 패턴을 보임 : 모형 수정 1차 자기상관의 진단과 조정 회귀모형에서는 오차항 간 독립 가정 시계열의 경우 시간에 따른 상관관계 존재 오차에 1차 자기상관이 있음 오차에 자기상관이 있는 경우 회귀계수의 표준오차 추정값이 실제보다 작게 추정 회귀계수 추정값에 대한 𝑡, 𝐹검정 과대 평가 (좋게 평가되어짐) 회귀모형에서 자기상관을 검진하고 이를 조정해야할 필요 자기상관 확인 ρ(rho) = 0 : 오차항이 독립적 (회귀분석 진행) ρ(rho) > 0 : 오차항 양의 상관관계 ρ(rho) < 0 : 오차항 음의 상관관계 더..

상관관계 시계열 간 관계 시계열 간 상관성을 보이는 경우가 있음 표본상관계수 변수들간 선형관계 표본교차상관계수 표본상관계수 식에서 한 변수를 시차변수로 둠 (시차에 따른 관계파악) 이때, 두 변수간 관계가 어느정도 파악되어야함 변수간 선·후행 관계 파악 𝑘(시차) = 0 : 시계열𝑌가 시계열𝑋와 동행 𝑘(시차) 0 : 시계열𝑌가 시계열𝑋에 후행 최대값을 기준으로 n시차 선·후행을 판단 회귀분석 개요 회귀분석 변수 간 관계를 표현하고 관계로부터 미래값 추정 단순회귀 : 설명변수가 1개인 회귀모형 중회귀모형 : 설명변수가 2개 이상 설명변수 간 상관성 : 다중공선성 문제 회귀모형의 작성 회귀모형의 작성 개요 아래 3단계 반복 모형의 설정 : 변수선택, 변환..

ARIMA 모형의 추정 추정방법 아래 방법으로 모수값 추정 최대가능도추정법 가능도함수, 결합확률밀도함수 최대화하여 모수 추정 최소제곱추정법(조건부/ 비조건부) 오차 제곱합을 가장 작게하는 모수 추정 통계(추정량)은 근사적으로 𝑡분포를 따름 검정 : 모수들이 각각 0과 다른지 검정, 기각역 및 유의확률 추정값 : 모수에 추정값 대입, 오차 제거하여 구체화 자동식별과 추정 하이드먼과 칸다카르 ARIMA 모형의 (𝑝,𝑑,𝑞)(𝑃,𝐷,𝑄)𝑠를 자동식별 (근사적으로 𝑡분포) 차분수 𝑑 : 단위근검정과 계절단위근검정을 반복 후 결정 AIC, AICc, BIC 모형선택기준을 최소로 하는 𝑝,𝑞 결정 ARIMA 모형의 진단 진단과정 식별, 추정 단계 후 얻어진 모형이 타당한지 검토 (타당 시 예측에 사용) 진단내용 아..

시계열모형 관련 검정 단위근 검정 비정상시계열에 대해 확률적 추세 여부를 검정 시계열의 추세변동 : 확률적 추세변동과 확정적 추세변동으로 구분 확률적 추세변동 순수한 확률적 충격 결과, 서서히 움직이는 추세변동 𝑌𝑡 = 𝑌𝑡₋₁ + ε𝑡 확정적 추세변동 시계열모형의 평균 자체가 시간의 함수 𝑌𝑡 = ⍺ + β𝑡 + ε𝑡 확정적, 확률적 추세변동 𝑌𝑡 = ⍺ + β𝑡 + 𝑌𝑡₋₁ + ε𝑡 AR(1) 모형의 단위근 검정 AR(1) 모형 : 단위근 존재 (Φ =1 인 경우) AR(1) 모형의 분산 : 단위근 존재, 분산 ∞ 단위근 존재에 따른 시계열의 움직임 |Φ₁| < 1 : 시계열 평균수준 수렴 (안정시계열) Φ₁ ≠ 1 : 시계열 평균수준 수렴하지 않음 단위근을 가지는 시계열은 차분해 단위근을 제거 (안..

불안정시계열모형 확률보행모형 𝑌𝑡 = 𝑌𝑡₋₁ + ε𝑡 (1시차 전의 오차가 더해짐) 기대값 : 0 분산 : 𝑡 · 𝜎² (시간에 의존) 모형상세 𝑌𝑡 = 𝛿 + 𝑌𝑡₋₁ + ε𝑡 , 𝐸(𝑌𝑡) = 𝑡 · 𝛿 (델타, 입실론이 중복, 계속 값이 커진다.) 자기상관계수 : 서서히 감소 (델타가 있으면 감소가 적다.) 부분자기상관계수 : 1시차에서만 큰 값을 가짐 (직전 데이터가 크게 상관) 스펙트럼 : 저주파에서 큰 값 > 확률적 추세가 있다. 차분을 통해 안정시계열(백색잡음계열)로 변환 ARIMA모형 시계열을 차분해 ARMA모형이 되는 모형 ARIMA(𝑞,𝑑,𝑝) 𝑞 : AR , 𝑑 : 차분 , 𝑝 : MA 자기상관계수 서서히 감소(확률보행모형)하며 변동(ARMA)이 있음 부분자기상관계수 : 특이점 없..

시계열모형 시계열모형 생성된 일련의 통계적 현상을 수학함수로 나타낸 확률과정 관측된 시계열 : 특정한 확률과정이 실현된 값 시계열모형 : 선형 시계열모형과 비선형시계열모형으로 구분 선형시계열 모형 시계열의 시차변수와 오차 시차변수의 선형결합 안정시계열모형 : 기댓값과 자기공분산이 시간에 의존하지 않는 확률과정 시계열분석 이론 : 안정시계열모형을 중심으로 정리됨 불안정시계열의 안정화필요 시계열의 표본자기상관계수, 표본부분자기상관계수 및 스펙트럼의 추정값이 특정 시계열의 이론값과 유사 동 시계열이 특정 선형 시계열모형으로부터 생성되었다고 유추 선형 시계열모형은 이해하기 쉽고 분석 및 예측 결과가 안정적 시계열을 충분히 표현하지 못한다는 한계가 있음 비선형 시계열모형 비선형 시계열모형 TAR, Bilinear..

자기상관 시계열의 자기상관 시계열은 시간에 의존적이 구조 자기공분산 𝑟(𝑠,𝑡) = Cov(𝑌𝑠,𝑌𝑡) 자기상관함수 자기공분산 표준화 자기공분산 / √각 시점의 분산의 곱 자기공분산함수와 자기상관함수의 성질 대칭성 : 앞 뒤의 값의 순서와 상관이 없음 𝑠 = 𝑡 자기공분산함수 = VAR(𝑌𝑡) 자기상관함수 = 1 자기상관 없음 자기공분산함수 = 0 자기상관함수 = 0 양의 자기상관 자기공분산함수 > 0 0 < 자기상관함수 < 1 음의 자기상관 자기공분산함수 < 0 -1 < 자기상관함수 < 0 시계열별 자기상관 (교제참고) 상관계수 표본자기상관계수 표본상관계수 𝑟 : 두 변수가 얼마나 선형적으로 밀접한지 파악 표본자기상관계수 : 두 시계열 변수를 시차를 두고 구한 표본상관계수 검정 귀무가설 : 두 변수간 ..

시계열의 주파수 분석 시계열의 주파수 정보 시계열에는 주기적 변동 포함 (주파수 정보) 푸리에 급수(series)로 표현 푸리에 변환 시간 도메인을 주파수 도메인으로 변환 주기적 시계열의 표현 시계열 𝑦𝑡 : 시간에 따라 특정한 주기로 순환 cosine(또는 sine)커브로 표현 𝑦𝑡 = Acos(2π𝑤𝑡) 𝑡 = 1,2,...,𝑛) * A : 진폭, 𝑤 : 주파수(단위시간당 순환 수, frequency) 주기 𝑝인 변동 : 𝑛기간 중 𝑛/𝑝번 순환 존재 주파수 𝑤 : 1/𝑝의 역수 * 12개월 주기 월별 시계열 : 𝑝 = 12, 𝑤 = 1/12 저주파 변동 : 주기가 긴 변동 고주파 변동 : 주기가 짧은 변동 시계열의 구성 시계열 𝑦𝑡 : 주기적 함수 𝑔(𝑡)와 백색잡음계 ε𝑡로 구성 𝑦𝑡 = 𝑔(𝑡)..