Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

"MODELO PREDICTIVO DE FUGA DE CLIENTES CON TARJETA DE CRÉDITO"

No description
by

Carmen Stefany Neciosup Vera

on 13 October 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of "MODELO PREDICTIVO DE FUGA DE CLIENTES CON TARJETA DE CRÉDITO"

Muchas Gracias
INTRODUCCIÓN
PROBLEMA
¿Cuál es el modelo predictivo que mejor describe la fuga de clientes con tarjeta de crédito en una entidad bancaria del Perú, usando Árboles de Clasificación y Regresión Logística. Octubre-Diciembre, 2014?
"MODELO PREDICTIVO DE FUGA DE CLIENTES CON TARJETA DE CRÉDITO EN UNA ENTIDAD BANCARIA DEL PERÚ, USANDO ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN LOGÍSTICA. OCTUBRE-DICIEMBRE, 2014”
TESIS
para optar el título de:
LICENCIADA EN ESTADÍSTICA

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS
ESCUELA PROFESIONAL DE ESTADÍSTICA

Presentada por:
Bach. CARMEN STÉFANY NECIOSUP VERA
Asesorada por:
Mg.Sc. VÍCTOR MANUEL CHUNG ALVA

Miembros del Jurado:
Dra. EMMA NOBLECILLA MONTEALEGRE Presidenta
Mg. Sc. MANUEL HURTADO SÁNCHEZ Secretario
Mg. Sc. WILVER RODRIGUEZ LÓPEZ Vocal

Entidades de todos los rubros, se esfuerzan cada vez más por entender el comportamiento de sus clientes y poder anticipar las posibles fugas.

Temas principales en todo negocio: Gestión del Riesgo de Fuga de Clientes o Customer Churn.

“Es más barato retener a un cliente que captar uno nuevo”; -> Caracterizar la Fuga de Clientes y construir un modelo predictivo para clientes de una entidad en particular permite:
* Identificar factores más influyentes
* Generar mejores campañas
* Minimizar el porcentaje de clientes fugados.
CHANGE
RETURN
Campañas para clientes con alta probabilidad de Fuga
Se construyeron tres modelos predictivos (Técnicas: Regresión Logística, Árbol CART y Árbol CHAID Exhaustivo). Se validó cada uno, y se compararon sus capacidades predictivas, para seleccionar el mejor modelo predictivo de fuga de clientes y poder describir perfiles de clientes con mayor probabilidad de fuga.
MARCO TEÓRICO
RIESGO DE FUGA DE CLIENTES
TARJETAS DE CRÉDITO
“Una tarjeta de crédito es un instrumento de pago mediante el cual una persona natural o jurídica accede a una línea de crédito por un plazo determinado. Tiene carácter de intransferible y un plazo de vigencia no mayor de 5 años.”
-
Según la Superintendencia de Banca, Seguros y AFP (
SBS)-
MODELOS DE REGRESIÓN LOGÍSTICA
Técnica estadística más apropiadas cuando
:
-> Variables independientes: métricas y categóricas
-> Variable dependiente: categórica (dos grupos)
MODELOS DE ÁRBOLES DE CLASIFICACIÓN
CHURN VOLUNTARIO
CHURN INVOLUNTARIO
Proceso de abandono de un cliente hacia la empresa.

Asociado a la inactividad de un cliente respecto de la compra de productos y/o servicios o a la elección por utilizar los productos y/o servicios de la competencia.

Para poder estimar las probabilidades de fuga de sus clientes, se emplean metodologías que tratan de identificar patrones comunes entre los clientes que han abandonado alguna vez la empresa y los que aún siguen activos en ella.

Para identificar estos patrones, se utilizan técnicas de Data Mining (específicamente técnicas de clasificación binaria), que les permiten construir un MODELO que pueden aplicar sobre la cartera actual de clientes para predecir el perfil de cada uno de ellos y determinar su probabilidad de fuga en cierto tiempo.

Dentro de las técnicas de clasificación binaria utilizadas para estos fines podemos encontrar aplicaciones de Regresión Logística, Support Vector Machines, Redes Neuronales, Árboles de Decisión, Redes Bayesianas, entre otras.
CART
"Classification and Regression Trees"
(Breiman, 1984)

Utiliza datos históricos para construir árboles de clasificación o de regresión los cuales son usados para clasificar o predecir nuevos datos.

Pueden emplear variables numéricas y/o categóricas.
CHAID EXHAUSTIVO
CHAID EXHAUSTIVO:
(Biggs, de Ville y Suen, 1991)
MATERIALES Y MÉTODOS
POBLACIÓN
Clientes (Personas Naturales) de la entidad bancaria, que contaron con el servicio de una tarjeta de crédito e hicieron uso de ella durante los meses de Octubre a Diciembre del 2014.
Se construyeron tres modelos estadísticos, uno con cada una de estas técnicas estadísticas: Regresión Logística y Árboles de Clasificación (Árbol CART y Árbol CHAID Exhaustivo).

La elección del mejor modelo predictivo para gestionar el Riesgo de Fuga de Clientes en la entidad financiera se realizó mediante la comparación de las capacidades predictiva de estos modelos, contrastando las Curvas COR de los tres modelos.

Se empleó la metodología de Data Mining utilizando los softwares estadísticos SPSS STATISTICS 22 y SPSS MODELER 14.2.
TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
ANÁLISIS ESTADÍSTICO DE DATOS
La base empleada, de datos transaccionales de los clientes de la entidad bancaria que cuentan con una tarjeta de crédito, fue una data previamente tratada por la misma entidad.
MODELO DE REGRESIÓN LOGÍSTICA
MODELO CART
MODELO CHAID EXHAUSTIVO
COMPARACIÓN DE MODELOS
PERFILES DE POSIBLES CLIENTES CON MAYOR PROPENSIÓN DE FUGA
RESULTADOS
CONCLUSIONES
El modelo de Regresión Logística permitió predecir la Fuga de clientes de la entidad bancaria con un alto grado de calidad predictiva, ya que el área bajo la curva para el grupo de Entrenamiento fue del 78% y 81% para el de Comprobación.
El modelo de Árbol CART, permitió predecir la Fuga de clientes de la entidad bancaria con un alto grado de calidad predictiva, ya que el área bajo la curva para el Grupo de Entrenamiento resultó ser del 79% y 80% para el de Comprobación.
El modelo de Árbol CHAID Exhaustivo, permitió predecir la Fuga de clientes de la entidad bancaria con un alto grado de calidad predictiva, ya que el área bajo la curva para el Grupo de Entrenamiento fue del 78% y para el Grupo de Comprobación fue del 79%.
Al comparar la capacidad predictiva de los modelos construidos, y al tratarse de un “Problema de Rarezas” (ya que el conjunto de clientes Activos y clientes en Fuga se encuentran desbalanceados), se consideró como mejor opción realizar un análisis y comparación de sus Curvas COR, concluyendo que el Modelo CART (con un 79.2% de área bajo la curva) es el modelo que se ajusta mejor a los datos y el que permitía realizar una mejor predicción de los clientes en estado de Fuga, ya que presentaba un área bajo la curva superior.
Respecto al perfil de los clientes con mayor probabilidad a cancelar su tarjeta de crédito se puede afirmar que de los clientes que en el mes de Noviembre del 2014 presentaron un consumo mensual menor a los 23,5 nuevos soles y que además en el mes de Diciembre de ese mismo año presentaron un consumo mensual casi nulo, el 61.5% de ellos canceló su tarjeta de crédito en el mes de Marzo del 2015.
SUGERENCIAS
Considerando que no todos los clientes tiene las mismas características y que suelen presentar distintos comportamientos dependiendo de la época del año, es recomendable construir modelos específicos y particulares que se ajuste correctamente a los datos de cada entidad.

Para contribuir con la correcta toma de decisiones en las entidades bancarias, se recomienda realizar una correcta exploración de datos y una adecuada utilización de técnicas y métodos estadísticos para llegar a conclusiones válidas y confiables, garantizando:
-> Incremento de las utilidades
-> Disminución de costos
-> Mejores soluciones en menor tiempo posible

Para investigaciones posteriores, se recomienda contar con una cosecha un poco más grande, ya que esto puede ser más favorable para la investigación.
*Organismo encargado de la regulación y supervisión del Sistema Financiero de Seguros y del Sistema Privado de Pensiones en el Perú.
* Prevención y detección del lavado de activos y del financiamiento del terrorismo.
Incrementar utilidades
OBJETIVOS ESPECÍFICOS
Determinar la capacidad predictiva del modelo de Árbol CHAID EXHAUSTIVO, para predecir la fuga de clientes con tarjeta de crédito en una entidad bancaria del Perú
Comparar la capacidad predictiva de los modelos construidos, eligiendo al modelo que se ajusta mejor a los datos y que permita realizar una mejor predicción de los clientes en estado de Fuga.
Describir el perfil de los clientes con tarjeta de crédito en una entidad bancaria del Perú con mayor probabilidad de Fuga.
Determinar qué modelo es el que mejor predice la fuga de clientes con tarjeta de crédito en una entidad bancaria del Perú, usando Árboles de Clasificación y Regresión Logística. Octubre-Diciembre, 2014.
VENTAJAS
Uso: Medios electrónicos, cajeros automáticos.
Medio de seguridad en las transacciones.
Brinda información respecto al tarjetahabiente
Facilidades para adquisición de bienes y servicios
DESVENTAJAS
Posibilidad de fraude, robo o pérdida
Descontrol en los gastos
Uso excesivo del financiamiento
El COEFICIENTE LOGÍSTICO compara la probabilidad de ocurrencia de un suceso con la probabilidad de que no ocurra.
Este ODDS RATIO puede expresarse como:
Los datos son partidos en 2 grupos mutuamente excluyentes.

El nodo inicial es llamado nodo raíz o grupo padre y se divide en dos grupos hijos o nodos hijo

Las divisiones se seleccionan de modo que “la impureza” de los hijos sea menor que la del grupo madre y éstas dependen de la variable explicativa anterior (Deconinck et al, 2006).


El procedimiento de partición es aplicado a cada grupo hijo por separado.
OBJETIVO:
Particionar la respuesta en grupos homogéneos y mantener el árbol razonablemente pequeño.

Para dividir los datos se requiere un criterio de particionamiento el cual determinará la medida de impureza, esta establecerá el grado de homogeneidad entre los grupos.
Ventajas:
Robustez a outliers
Invarianza en su estructura por transformaciones de variables independientes
Interpretabilidad
En SPSS, la opción "Agrupación Previa" permite generar Intervalos Óptimos para reducir tiempo de procesamiento.
Cant. intervalos procesados = Cant. valores de la variable
CHAID: Chi-square Automatic Interaction Detector.
(Kass, 1980)
CHAID EXHAUSTIVO
trata a todas las variables por igual, independentemente del tipo y número de categorías.
CHAID
penaliza en exceso a variables con muchos niveles.
Controla error tipo I pero presenta error tipo II muy grande.
(Pérez, 2008)
CHAID
Algoritmo más conocido
No es binario
Genera un árbol más ancho
Aprovecha valores perdidos
Funde intervalos óptimos si no son significativaente distintos respecto a VD.
En cambio, el Análisis Discriminante: puede tener de dos a más grupos en la variable dependiente
Variables en Estudio
Constante significativa
Especificidad = 3222/3387 x 100% = 95.2%
Sensibilidad = 259/890 x 100% = 28.8%
Efectividad = (3222+259)/4277 x 100%=81.4%
Se utilizó la misma partición que para el modelo de Regresión Logística. (80% y 20%)
“Problema de Rarezas” o “Problema de Clases Desbalanceadas”
Las categorías o valores de la variable objetivo corresponde a un conjunto de datos significativo pero pequeño
En “Mining with rarity: A unifying framework”
(Weiss, 2004)
, se sugiere utilizar la Curva COR a modo de evaluación generalizada al tratarse con clases desbalanceadas.
El porcentaje de buena clasificación de las Tablas de Clasificación se ven influenciadas por el valor del punto de corte empleado
Técnica:
Observación documental

Instrumento:
Formato SPSS de extracción de datos de
la base de datos original
HIPÓTESIS
El modelo que mejor predice la fuga de clientes con tarjeta de crédito en una entidad bancaria del Perú, usando Árboles de Clasificación y Regresión Logística. Octubre-Diciembre, 2014, son los Árboles de Clasificación.
JUSTIFICACIÓN E IMPORTANCIA
Actualmente las empresas carecen de métodos para gestionar el riesgo de fuga de sus clientes. Ante esta necesidad, se desarrolló el presente trabajo de investigación con la finalidad de dar solución al problema en cuestión.

Se realizó esta investigación para poder aportar con propuestas de solución a un problema de actualidad en nuestro medio, contribuyendo a aumentar las utilidades de las empresas y ayudando a disminuir sus costos.
Determinar la capacidad predictiva del modelo de Árbol CART, para predecir la fuga de clientes con tarjeta de crédito en una entidad bancaria del Perú.
OBJETIVO GENERAL
Determinar la capacidad predictiva del modelo de Regresión Logística, para predecir la fuga de clientes con tarjeta de crédito en una entidad bancaria del Perú.
Full transcript