ML/XAI

SHAP sampling

sapziling 2023. 6. 16. 12:27

- background : 모든 데이터에 대해 shap 계산시 너무 오래 걸리는 경향이 있음

- sampling 해서 확인했을때 100개 , 만 개가 임포턴스  TOP10개에서 큰 차이가 없었음.  이렇게 확인해보는 방법은 

 

https://github.com/slundberg/shap/issues/1065 여기에서 slundberg 도 추천한 방법임. 

 

현재 만개면 0.1% 정도. 가능하다면 전체와 만개를 비교해보면 젤 좋긴할텐데 시간이 오래걸릴거 같다...