ML/XAI

causal impact

sapziling 2023. 1. 25. 15:08

시계열 데이터 y (일별 판매량)이 (마케팅 시행여부)로 인해 증가한건지, 그냥 다른 티비프로그램이나 원래 상승할 거였는지 알고 싶다고 하자. 그 효과를 측정하는 방법론 중 하나가 Causal Impact 이다.

우리가 갖고 있는건,

1) actual : 마케팅을 시행했을떄의 일별 판매량 

밖에 없다. 그럼, 마케팅을 시행하지 않았을때의 일별 판매량은 예측해서 비교해볼 수 밖에 없다.

2) predicted : 마케팅을 시행하지 않았을 때의 일별 판매량

그런데 어떻게 예측할까? 그냥 ARIMA같은 시계열 모델 등을 써서 예측해볼 수 있을 거다. 그런데 궁금한게 다른 영향도 있었는지, 그 영향을 받았으면 어떠했을지 반영해서 예측해보면 더 좋을 것이다. 그래서 예를 들어 티비프로그램을 반영할 수 있는 검색량이나, 상승하는 트렌드였다면 비슷한 웹사이트의 판매량을 가져와서 prediction 해볼 수 있다. 그 변수들을 공변량 X로 정의하게 된다. 흔히 쓰이는 시계열 예측 방법론(python)은 Bayesian structural time series 이다. 아리마 대신 이 방법론을 쓴 이유는 좀 더 탐구 해봐야 할 거 같다.