Прогнозирование оттока клиента банка

Из банка стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых. Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Предоставлены исторические данные о поведении клиентов и расторжении договоров с банком.

Задача

Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых.

Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Нам предоставлены исторические данные о поведении клиентов и расторжении договоров с банком.

Построим модель с предельно большим значением F1-меры. Успешными будем считать решения с метрикой от 0,59 на валидации.

Дополнительно измерим метрику AUC-ROC, сравним её значение с F1-мерой.

Ноутбук

(ноутбук проекта)

Выводы

Задачей данного проекта было прогнозирование оттока клиентов банка на основе имеющихся данных.

Был проведён исследовательский анализ данных, позволивший выявить ряд несущественных проблем с данными и одну колонку с возможно ошибочными данными.

Затем были созданы четыре модели, которые последовательно обучались с различными наборами данных, созданными на основе исходной таблицы. Оценка эффективности моделей производилась по метрикам F1 и ROC AUC.

В результате было установлено, что наилучшего значения метрики удаётся достичь для отмасштабированного и сбалансированного набора данных, из которого была исключена колонка с потенциально некорректными данными. Итоговая метрика F1 наилучшей модели на тестовых данных равна 0,6.

Ценность прогнозов моделей была показана путём сравнения с «глупым» классификатором, который на всех данных выдавал прогноз, что клиент останется в банке.

Полученные модели могут применяться при разработке маркетинговых стратегий, при изучении клиентской базы, чтобы целенаправлено работать с клиентами, которые могут уйти из банка.