금일은 심화프로젝트를 이어 진행하였습니다. 전처리는 완료하였고, 팀원들 각각 모델을 나누어 맡아 hyperparameter 최적화해 보았습니다.

<aside> 📌

고객 유지율 향상을 위한 이탈 예측 모델 생성 및 솔루션 제안 프로젝트

오전 시간은 전처리를 검토하고, 실제로 모델에 돌려보며 이상 없는지 최종 점검하였습니다.

이 과정에서 인코딩 방법과 스케일링 방법 등을 최종적으로 확정지었습니다.

이를 토대로 제가 format을 만들어 팀원들에게 코드 공유하였고, 오후에는 각자 모델을 2개씩 맡아 학습시키고, 최적화하고, 이를 토대로 해석하는 작업까지 진행하였습니다.

저는 Decision Tree와 LightGBM 이렇게 두 개의 모델을 맡아 진행하였습니다.

Decision Tree

https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html

image.png

LightGBM

https://lightgbm.readthedocs.io/en/latest/pythonapi/lightgbm.LGBMClassifier.html

image.png

문제

간단히 하이퍼 파라미터 최적화 후 결과를 보니,