-
PSM propensity score matchingML 2022. 12. 13. 13:54
- random assignment 불가능한 경우가 많기 때문에, 관측한 데이터를 가지고 X의 영향력을 알고 싶을 때.
- 예) A 플랫폼에서 마케팅 쿠폰 사용여부(X)에 따른 구매여부(Y) 효과가 있었는지 알고 싶다고 하자.
제일 간단하게 비교해보는 건 쿠폰 사용한 유저/사용하지 않은 유저에 대해 구매여부 평균을 비교해보는 방법일 것이다.
그런데 엄밀히 따지자면 사용하지 않은 유저는 A플랫폼에 대한 선호도가 없어서 일수도 있고, 쿠폰 항목에 대한 관심도가 적을 수도 있다. 즉, 쿠폰 사용여부말고도 다른 변인들이 영향을 주었을 수도 있다. 그러면 쿠폰 사용한 유저/사용하지 않은 유저 중, 단순 평균이 아니라 비슷한 유저끼리 짝을 지어 비교해보면 어떨까?
그 비슷한의 기준을 psm에서는 logistic regression(X~ X를 제외한 다른 변인들) 을 사용한다. lr 에서 나온 propensity score를 가지고 비슷하다는 기준을 정하게 된다.
lr 로 propensity score 구하는 건 --> 다음에 찾아볼 예정
'ML' 카테고리의 다른 글
LightGBM missing values NULL 값 (0) 2023.01.05 PSM practice (0) 2022.12.15 Minhash & LSH (0) 2022.11.18 Q. PCA에서 highly correlated 변수를 삭제해주어야하나? (0) 2022.11.07 클러스터링 Clustering 자료 조사 방법론 비교 (0) 2022.08.12