Project/부실가계 분류모델

부실가계 탐지 모형 - 결론

patrck_jjh 2021. 6. 3. 22:11

 

 

<성능지표 비교>

최종적인 성능지표는 다음과 같다.

 

 흰색 칸에 있는 값들이 오버 샘플링 이전 하늘색 칸에 있는 값들이 오버샘플링 이후의 값들이다. 오버샘플링 이후에 정확도와 정밀도는 전체적으로 하락했으나 재현율은 크게 상승하였고 AUC도 상승하였다. 특히 로지스틱 회귀의 경우 오버 샘플링 이후 정확도는 다른 알고리즘들과 비슷한 수준이지만 다른지표들은 확실히 높았다.

 

 

 


 

 

 

<특징 중요도 비교>

 

-의사결정나무

 의사결정나무에서는 담보대출기관이 은행인지, 비은행금융기관인지의 여부가 2019년 2020년  공통적으로 가장 중요한 특징으로 나타났다.  반면 담보대출용도_거주주택 구입, 가구주 종사상 지위, 수도권 여부가 2019년에 비해 2020년에 더 중요해진 피처이다.

 

 

 

-LightGBM

LightGBM에서는 담보대출용도_거주주택 마련, 담보대출기관_은행여부의 중요도가  크게 상승하였고, 가구주 혼인상태, 수도권 여부의 중요도  또한 크게 상승하였다.

 

 

의사결정나무와 LightGBM 공통적으로 2019년에 비해 2020년에 중요해진 특징으로 담보대출_거주주택 구입, 수도권 여부가 있다.