Прогнозирование оттока клиента банка
Из банка стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых. Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Предоставлены исторические данные о поведении клиентов и расторжении договоров с банком.
Задача
Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых.
Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Нам предоставлены исторические данные о поведении клиентов и расторжении договоров с банком.
Построим модель с предельно большим значением F1-меры. Успешными будем считать решения с метрикой от 0,59 на валидации.
Дополнительно измерим метрику AUC-ROC, сравним её значение с F1-мерой.
Ноутбук
Выводы
Задачей данного проекта было прогнозирование оттока клиентов банка на основе имеющихся данных.
Был проведён исследовательский анализ данных, позволивший выявить ряд несущественных проблем с данными и одну колонку с возможно ошибочными данными.
Затем были созданы четыре модели, которые последовательно обучались с различными наборами данных, созданными на основе исходной таблицы. Оценка эффективности моделей производилась по метрикам F1 и ROC AUC.
В результате было установлено, что наилучшего значения метрики удаётся достичь для отмасштабированного и сбалансированного набора данных, из которого была исключена колонка с потенциально некорректными данными. Итоговая метрика F1 наилучшей модели на тестовых данных равна 0,6.
Ценность прогнозов моделей была показана путём сравнения с «глупым» классификатором, который на всех данных выдавал прогноз, что клиент останется в банке.
Полученные модели могут применяться при разработке маркетинговых стратегий, при изучении клиентской базы, чтобы целенаправлено работать с клиентами, которые могут уйти из банка.