As instituições financeiras têm sido desafiadas a desenvolver novos métodos para minerar e interpretar os dados dos clientes para ajudá-los a entender suas necessidades. O avanço da tecnologia reduziu a assimetria de informações entre bancos e seus clientes, impulsionando a competição e tornando o gerenciamento de retenção de clientes cada vez mais importante. Nesse contexto, a previsão de churn (perda de clientes) é fundamental, sendo uma questão estratégica que permite às empresas monitorar o comportamento de engajamento do cliente e agir quando o engajamento diminui.
Portanto, modelos preditivos adaptados para identificar possíveis “churners” são fundamentais para apoiar as decisões gerenciais. O principal desafio é que geralmente os clientes que deixam de sê-lo têm um baixo índice frente aos dados gerais (representam 2% do total de clientes do banco de dados da instituição financeira) sendo um evento raro, mas que gera um alto custo para a empresa e os modelos preditivos não os captam e analisam com seguridade. São dados desbalanceados que precisam de um pré-processamento mais acurado para balancear os clientes retidos e os clientes em churn.
O pesquisador da FGV EAESP, João Luiz Becker, em conjunto com pesquisadores da UFRGS, publicaram um estudo na Financial Innovation propondo um framework completo para previsão de churn que abrange uma sequência de etapas de pré-processamento antes da tarefa de classificação. Além disso, o framework se baseia em algoritmos mais sofisticados, possibilitando um ganho de desempenho devido à sinergia entre essas etapas.
O framework proposto para prever o churn de clientes em um banco compreende duas fases: pré-processamento de dados e treinamento/teste do modelo. Três métodos de pré-processamento foram adotados, utilizando dados de um grande banco brasileiro. Na primeira fase, novas características foram criadas para resumir o comportamento de compra dos clientes, incluindo recência, frequência e valor monetário em categorias como cartões de crédito e investimentos. Na segunda fase, os dados foram balanceados gerando “churners” sintéticos e removendo clientes com informações ruidosas e redundantes. Os resultados confirmam que as novas características melhoraram as previsões de churn, e a análise estatística revelou o impacto das diferentes etapas de pré-processamento e técnicas de classificação no desempenho.
A recência das compras a crédito emerge como a característica mais crucial, representando 46,23% da importância ao prever a saída de clientes. Além das compras a crédito, características relacionadas a depósitos e investimentos também exercem influência significativa na previsão de churn. A renda total do cliente e o número de produtos distintos adquiridos também se destacam como fatores relevantes para prever o churn. Segundo os pesquisadores, gerentes de marketing podem se beneficiar do framework proposto, pois ele permite antecipar clientes propensos a churn até três meses antes, mesmo em dados altamente desequilibrados, fornecendo tempo suficiente para planejar estratégias proativas de retenção de clientes.
Leia o artigo na integra.