Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

"Modelo de Credit Scoring para predecir el otorgamiento de crédito personal"

No description
by

Pilar Medina

on 30 December 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of "Modelo de Credit Scoring para predecir el otorgamiento de crédito personal"

Justificación e Importancia
“MODELO DE CREDIT SCORING PARA PREDECIR EL OTORGAMIENTO DE CRÉDITO PERSONAL EN UNA COOPERATIVA DE AHORRO Y CRÉDITO”
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO
FACULTAD DE CIENCIAS FÍSICAS Y MATEMATICAS
ESCUELA PROFESIONAL DE ESTADÍSTICA

..............
Introducción
Problema
¿Cuál es el modelo de Credit scoring que permite predecir el otorgamiento de crédito personal en una cooperativa de ahorro y crédito?
Marco Teórico
Entrevista personal al Administrador de cooperativa de ahorro y crédito objeto de estudio.

La principal fuente de información fue conformada por el historial crediticio de los clientes pertenecientes a la cartera de crédito personal, obtenida de la base de datos de la Cooperativa de Ahorro y Crédito objeto de estudio.

Técnicas e instrumentos de recolección de los datos
TESIS
Para optar el título profesional de:
LICENCIADO EN ESTADÍSTICA


Medina Rodríguez, María del Pilar
Ulfe Rentería, Henry Gustavo


Lic. Est. Hugo Lorgio Saavedra Saavedra
M.Sc. Lilian Roxana Paredes López
M.Sc. Luis Enrique Tuñoque Gutiérrez

Presidente
Secretaria
Vocal

Presentada por:
Asesorada por:
M.Sc. Alfonso Tesén Arroyo
Miembros del Jurado:
Objetivos
Identificar al menos una variable explicativa que pueda ser considerada en la construcción de un modelo de credit scoring.
Construir modelos mediante las técnicas de Regresión Logística, Arboles de Clasificación y Redes Neuronales que permitan predecir la probabilidad de incumplimiento del crédito personal.
Determinar el mejor modelo basado en indicadores eficiencia y predictibilidad.
Estimar el score de cada cliente y determinar los puntos de corte para clasificar los créditos personales solicitados en intervalos de (aceptación, análisis manual y rechazo).
Objetivo General
Construir un modelo de credit scoring que permita predecir el otorgamiento de crédito personal en la cooperativa de ahorro y crédito.
Hipótesis
Existe al menos un mejor modelo basado en indicadores de eficiencia y predictibilidad.
Existe al menos una variable explicativa que es significativa para la construcción del modelo de predicción de incumplimiento de pago.
Existe al menos un modelo capaz de estimar la probabilidad de que un cliente incumpla con el crédito personal.
Hipótesis General
Hipótesis Específica 1
Hipótesis Específica 2
Se construyeron modelos estadísticos utilizando las técnicas de Regresión Logística, Árboles de Clasificación y Redes Neuronales.

La elección del mejor modelo predictivo para el otorgamiento del crédito personal se realizó mediante comparación de estadísticos como: Matriz de confusión (sensibilidad, especificidad, valor predictivo positivo, precisión o error de clasificación), la curva ROC, índice de GINI, el estadístico de Kolmogorov Smirnov (KS) y la Curva de Porcentaje Acumulado de Respuesta Capturada (CAPC).

El análisis se realizó mediante el software estadístico SAS versión 9.4, SAS Enterprise Miner Workstation 13.1, R Project 3.2.0.

Análisis Estadístico de datos
La población de estudio está constituida por 3000 clientes que forman parte de la cartera de crédito personal de la Cooperativa de Ahorro y Crédito a julio del 2013.

Población
Materiales y Métodos
Conclusiones
El modelo de credit scoring se debe calibrar al menos cada tres meses para que se mantenga actualizado, acorde con las necesidades de la institución y resulte efectivo en sus operaciones en el transcurso del tiempo.
Implementar mediante un software el modelo de credit scoring disenado para la cartera de crédito personal, a fin de que las operaciones crediticias sean más ágiles y eficientes.
Se recomienda enfocarse en la fase de la comprensión del negocio; si no se logra desarrollar esta capacidad, ningún algoritmo por muy sofisticado que sea, permitirá obtener resultados fiables.
Si bien esta investigación concluyó que la regresión logística por agrupación interactiva es el mejor modelo capaz de predecir eficientemente, cabe aclarar que existe una gran variedad de técnicas utilizadas para la construcción de modelos credit scoring.
Sugerencias
Justificación teorica-práctica
Importancia
Un modelo de credit scoring favorecerá no solamente a la institución sino también a los clientes
-Mejorar la calidad de la cartera crediticia y el servicio de crédito personal que se brinda.
-Ayudar al analista de crédito en la toma de decisiones de forma más rápida y objetiva.
-Predecir el comportamiento de futuros créditos con el fin de aumentar utilidades y reducir costos.
Teórica
Práctica
El modelo construido evaluará al cliente mediante un score y lo clasificará como un buen o mal pagador para un futuro crédito personal, contribuyendo con la cooperativa de ahorro y crédito a realizar un adecuado proceso de otorgamiento de crédito y disminuir el índice de morosidad que presenta.
Porque generará reflexión y discusión sobre el conocimiento existente del área investigada, ya que por medio de las técnicas estadísticas se construirán modelos scoring que permitan estimar la probabilidad de incumplimiento de pago
Crédito
Modelos
Credit Scoring
Técnicas Aplicadas en
los modelos Scoring
Modelo de Proceso
CRISP-DM
Son diversos los modelos de proceso que han sido propuestos para el desarrollo de proyectos de Data Mining tales como SEMMA (Sample, Explore, Modify, Model, Assess), DMAMC (Definir, Medir, Analizar, Mejorar, Controlar) o CRISP-DM; sin embargo uno de los modelos principalmente utilizados en los ambientes académico e industrial es el modelo CRISP- DM.
Riesgo
Riesgo de Crédito
Utilidades
-Discriminar entre probables buenos y malos pagadores.

-Asignar probabilidades de incumplimiento de pago a los clientes para otorgar el crédito de acuerdo a estas probabilidades.

-Identificar las variables que afectan el riesgo crediticio (medido por la probabilidad de default).

-Concentrar esfuerzos de supervisión sobre los prestatarios más riesgosos.

-Presupuestar provisiones de acuerdo al riesgo crediticio esperado.

-Fijar las tasas de interés de acuerdo al riesgo – crédito esperado y a la meta establecida de Ingreso Financiero.


Tipos de Scoring
Marketing Score
Bureau Score
Behavior Score
Adquisition Score
Ventajas y Desventajas
• La evaluación del crédito es objetiva y consistente en el tiempo de riesgo.

• Tiene un proceso más eficiente en tiempo, por lo tanto se traduce en menores costos.

• Al tener cada crédito una puntuación desde el inicio, esto nos permite un control estadístico del portafolio.

• Esta herramienta permite calificar a cada uno de los clientes.
Beneficios
Dificultades o limitaciones
• Son procesos que pueden tomar bastante tiempo.

• Son modelos de predictibilidad limitada.

• Son sistemas que se deterioran con el tiempo.

• Se hace necesario contar con un área especial.
Se basan en el comportamiento pasado para predecir el futuro.

Explota la información de la persona existente en el sistema, tanto negativa como positiva. Permiten sintetizar en un indicador único y muy eficiente el historial de crédito de un cliente.

Permite disponer de una primera calificación de riesgo de cualquier persona con referencias sin necesidad de solicitar ningún tipo de información.

Excelente herramienta para selección de clientes potenciales en una campaña. Se alcanzan niveles de eficiencia muy elevados independientemente del grado de vinculación del cliente con la entidad.
Centrados en la retención y adquisición de nuevos de clientes.
Mejorar la estimación del éxito de las ofertas en curso y crear nuevas ofertas sin aumentar el riesgo.
Realizar campañas de marketing selectivo sobre los clientes de mayor valor y probabilidad de respuesta de una manera efectiva en términos de reducción de costos.
Centrar los esfuerzos en los clientes de mayor valor mediante estrategias de fidelización.

Se utiliza este puntaje para la aceptación o rechazo de las solicitudes de crédito.
Las variables utilizadas son de tipo demográficas y de buró.
Este puntaje estima la probabilidad de incumplimiento de pago de un posible cliente y de esta manera se decide si se acepta o rechaza como posible consumidor de crédito.
Da una estimación de su puntualidad de pago en el futuro, de tal manera que se optimice la tasa de aprobación de las solicitudes.
Predice la probabilidad de incumplimiento de los clientes que ya son objeto de crédito en la institución.
Se utilizan las variables de comportamiento de las cuentas dentro de la propia institución.
Permite dar seguimiento al comportamiento de los clientes lo que permitirá al departamento de cobranzas emplear técnicas para que un cliente siga siendo rentable para la empresa.
Regresión Logística
Árboles de Clasificación
Redes Neuronales
Construcción de un modelo scoring
Objetivo Específico 1
Objetivo Específico 2
Objetivo Específico 3
Objetivo Específico 4
Definir el grupo objetivo sobre el cual se desea realizar las predicciones.
Aplicar una metodología que contemple (Validar la muestra, Análisis exploratorio, Máximos indicadores de calidad).

Validar el modelo.
Puntos de corte (Cut off).
Recolectar todas las características que mejor definan a los componentes del grupo objetivo.

Definir claramente el evento a predecir y su espacio temporal de ocurrencia: definición de mora.

Aplicar diversas técnicas para tratar la muestra de datos y obtener un modelo que represente el comportamiento de la misma respecto al evento a predecir.
Curva de ROC
Matriz de Confusión
Indice de Gini
Medida de desigualdad entre 0 y 1, donde el 0 corresponde a la perfecta igualdad.
El mejor modelo es el que tiene el GINI más alto.
Es la matriz conformada por el cruce entre los valores verdaderos de la variable respuesta con los valores estimados por el modelo.
Estadístico KS
-La Distancia KS mide la maxima distancia entre la distribución acumulada de los acreditados bueno y los malos.
-Cuanto mayor sea la distancia mejor será el modelo.
Existen varios modelos predictivos que pueden ser empleados para estimar la probabilidad de incumplimiento de pago del crédito personal. Se eligió el modelo de Regresión Logística por Agrupación Interactiva obtenido con los datos sin transformaciones, porque permite identificar con una mayor eficiencia a qué clientes se les puede otorgar un crédito a futuro.
El modelo construido depende exclusivamente de los datos que la institución obtenga del cliente. Las variables que fueron incluidas en el modelo son propias de la institución y probablemente no sean útiles para otro modelo de credit scoring, puesto que lo que es significativo para una entidad no lo es para otra.
El credit scoring representa una herramienta útil en la evaluación del sujeto a manera de sugerencia de aceptación o rechazo de una futura solicitud de crédito, por lo que, no deberá tomarse como una decisión definitiva, la última palabra la tendrá el área de análisis crediticio encargada de filtrar solicitudes y ajustar los créditos en beneficio de la institución.
Para lograr una herramienta dinámica y aceptable, el credit scoring puede sufrir cambios de acuerdo a las necesidades de la institución, esto dependerá en gran medida de las políticas que se tengan y de la información suficiente que se obtenga del cliente.
El nivel de riesgo que la institución esté dispuesto a correr será el indicador para aceptar o rechazar solicitudes futuras. La determinación de los puntos de corte depende de cada institución, cuidando siempre las metas propuestas y la condición financiera de la entidad.
Muchas Gracias

Objetivo General
Construir un modelo de Credit scoring que permita predecir el otorgamiento de crédito personal en la cooperativa de ahorro y crédito.

Objetivos Específicos
- Identificar al menos una variable explicativa que pueda ser considerada en la construcción de un modelo de Credit scoring.
- Construir modelos mediante las técnicas de Arboles de Clasificación, Redes Neuronales y Regresión Logística que permitan predecir la probabilidad de incumplimiento del crédito personal.
- Determinar el mejor modelo basado en indicadores eficiencia y predictibilidad.
- Maximizar la rentabilidad.
- Optimizar la asignación de crédito.
- Automatizar el sistema de aprobación de crédito.
- Minimizar el riesgo de incumplimiento de pago del crédito.
Objetivos del negocio
Objetivos del proyecto
Plan del proceso de Mineria de Datos
COMPRENSIÓN DE LOS DATOS
PREPARACIÓN DE LOS DATOS
EVALUACIÓN
COMPRENSIÓN DEL NEGOCIO
IMPLEMENTACIÓN
(Fase Futura)
Recolección de datos
Los datos fueron obtenidos de la cartera de crédito personal de la Cooperativa de ahorro y crédito con fecha de corte a Julio del 2013.
Descripción de los Datos
Exploración de datos
Verificación de la Calidad de los Datos
Operacionalización de Variables

-Transformaciones simples:

Log, Square Root, Inverse,Square,Exponential,Standardize,

-Transformaciones por Agrupación:

Bucket, Quantile, Optimal Binning for Relationship to Target Transformation.
Limpieza de Datos
Estructuración de Datos
Arboles de Clasificación
Regresión Logística
Redes Neuronales
Comparación de los mejores modelos
El mejor modelo es la Regresión logística por agrupación interactiva (Reg. Log.A.I).
Construcción de modelos
MODELADO
Se utilizaron tres técnicas: Regresión Logística, Arboles de Clasificación y Redes neuronales.

Se particionó la población planteándose que un 50% de los datos fueran destinados al conjunto de entrenamiento y el otro 50% al conjunto de validación.
Se realizó el scoring de los clientes que validaron el modelo de acuerdo a la PD, luego se estableció 20 percentiles los cuales permitieron clasificar el otorgamiento de crédito.

Por ser el objetivo de la cooperativa de ahorro y crédito maximizar la rentabilidad, se estableció los puntos de corte asignando un 30% para rechazo automático, 5% para decisión del analista de crédito y un 65% para aprobación automática.
Clasificación de los Clientes
Análisis del Modelo Óptimo
Parámetros del Modelo
- NumVerFinac24: Número de Verificaciones Financieras en los últimos 24 meses.
- PLCredSal: Porcentaje de Líneas de Crédito con Saldo.
- TLCredMor306024: Número Total de Líneas de Crédito con morosidad de 30 o 60 días en los últimos 24 meses.
- TLCredMor6024: Número Total de Líneas de Crédito con morosidad de 60 días o más en los últimos 24 meses.
- TLCredSat: Porcentaje de Líneas de Crédito Satisfactorias.
- TTransPLCred: Tiempo transcurrido desde la apertura de la Primera Línea de Crédito.

Prueba de Desvianza para los Coeficientes de los parámetros
El nivel de significancia 0.05>0.0001, por lo tanto existe prueba suficiente para afirmar que los (
Bi
) son diferentes de cero.
Análisis de efectos por Parámetros
Estimación de los Parámetros
Interpretación del Modelo
Full transcript