Audio Transcript Auto-generated
- 00:01 - 00:03
hoy a Juan como estas Mi nombre, Belén Bernal tiene
- 00:03 - 00:05
y te quería contar un poco el trabajo que estuve
- 00:06 - 00:11
realizando para el banco, para hacer una retención, pero actividad
- 00:11 - 00:12
de clientes premium.
- 00:13 - 00:17
Y el objetivo de nuestro análisis fue poder predecir aquellos
- 00:18 - 00:20
clientes que podríamos llegar a perder en enero de dos
- 00:21 - 00:21
mil Veintiuno.
- 00:22 - 00:25
Con esto enfocó más que nada porque no quería.
- 00:25 - 00:28
Queremos tratar de retener aquellos clientes posibles de que se
- 00:28 - 00:31
vayan Dhaka un mes o de acá dos mesas para
- 00:31 - 00:32
arrancar este análisis.
- 00:32 - 00:36
Lo que hicimos fue arregladas de datos de noviembre dos
- 00:36 - 00:39
mil veinte para poder un poco masticar estos datos, entender
- 00:40 - 00:42
qué es lo que están pasando y lo que yo
- 00:42 - 00:44
entendí. Lo que empezamos a ver es que hay una
- 00:44 - 00:47
desproporción de la cantidad de información entre los clientes que
- 00:47 - 00:50
deciden en la empresa y aquellos que se van, lo
- 00:50 - 00:53
cual es genial, es buenísimo para empresa, pero pero nosotros
- 00:53 - 00:56
como detrás Aventis Eso fue lo más complicado porque Nada
- 00:57 - 00:58
una ese dato de Valencia.
- 00:59 - 01:00
Así todo.
- 01:01 - 01:05
Seguimos adelante con nuestro análisis y para arrancar decidió utilizar
- 01:06 - 01:10
así scripts que tenemos en nuestro repositorio Y para poder
- 01:10 - 01:14
masticar un poquito la información, decir armar árboles, decisión con
- 01:14 - 01:18
la librería, reparar primero para poder entender y obviamente como
- 01:18 - 01:21
primer parámetro, sí a aquellos clientes que yo le hago
- 01:21 - 01:23
una campaña y no lo tengo.
- 01:24 - 01:25
Para mí es una partida de mil dos, cientos, cincuenta
- 01:26 - 01:29
pesos. Pero sí logró retener ese cliente va a ser
- 01:29 - 01:32
una ganancia de cuarenta y ocho mil siete cincuenta Así
- 01:33 - 01:36
todo como era muy sencillo y esto no es suficiente
- 01:37 - 01:40
para para mí nadie si, es decir, por la optimización
- 01:40 - 01:43
veneciana, donde se empezaron a combinar muchísimo más las variables
- 01:43 - 01:46
para poder empezar a entender si hay una correlación entre
- 01:47 - 01:49
ellas. Y ahí se empezó a dar una mejora.
- 01:50 - 01:54
Y eso mejoró muchísimo más cuando logramos obtener la base
- 01:54 - 01:56
de datos de los últimos tres años del dos mil
- 01:56 - 01:57
dieciocho, dos mil diecinueve, dos mil veinte.
- 01:59 - 02:05
Emm estuvo genial, pero lo que queríamos era un poquito
- 02:05 - 02:08
más no empezar a analizar un poco más y que
- 02:08 - 02:11
nos encontramos que en junio dos mil veinte había una
- 02:12 - 02:16
gran cantidad de datos que estaban vacíos, que eran nulos
- 02:16 - 02:19
y eso nos empeoraba nuestra para formas.
- 02:19 - 02:22
O puede ser a cejar en nuestro modelo, por lo
- 02:22 - 02:26
cual decidimos sacarlo de la base de datos y lo
- 02:26 - 02:28
voy a dar también con los datos que teníamos a
- 02:28 - 02:33
empezar a combinar lo sabes si conseguíamos nuevas variables Esto
- 02:34 - 02:38
al aplicarlo tuvimos una gran de ventaja que nos consumía
- 02:39 - 02:42
muchísimo tiempo y con las herramientas que tenemos hoy en
- 02:43 - 02:46
día, que tenemos de abierto al mar fins de Gul
- 02:46 - 02:50
y con ciertas condiciones que estamos eligiendo justamente para no
- 02:50 - 02:53
generar costos extras a la empresa, por lo cual nos
- 02:53 - 02:54
pareció que no era el camino.
- 02:55 - 02:59
Y justamente para evitar seguir perdiendo tiempo y plata, decidimos
- 02:59 - 03:02
cambiar a otro escrito, que es el el ahí, si
- 03:02 - 03:06
bien En este la media performances muchísimo.
- 03:07 - 03:09
Y para ponerte un poco en contexto, cuando hablo de
- 03:09 - 03:12
par formas Mi objetivo era siempre ver que los árboles
- 03:12 - 03:16
de decisión, todo, cuánto, cuánto era la profundidad de los
- 03:16 - 03:19
mismos y cuantos datos podría obtener en cada hijo de
- 03:19 - 03:22
los mismos En la inciden también.
- 03:22 - 03:26
A su vez, pudimos reducir la proporción que teníamos de
- 03:26 - 03:30
los clientes que se mantenían en la empresa y aquellos
- 03:30 - 03:31
que decían irse.
- 03:31 - 03:34
Reducir un poco este volumen de debata, deje de clientes
- 03:34 - 03:38
que continúan y eso permitió que se optimizará muchísimo más
- 03:39 - 03:42
el tiempo de proceso que bajó a la mitad de
- 03:42 - 03:46
estas veinticuatro horas corriendo donde las instancias no se lograban
- 03:47 - 03:52
completar nuestro nuestro n siempre las ciento cincuenta instancias y
- 03:52 - 03:54
no lográbamos llevar las ciento cincuenta con la y si
- 03:54 - 03:56
bien se lo era eso en la mitad de tiempo
- 03:58 - 04:01
Pero decimos utilizar una última herramienta, que es la de
- 04:01 - 04:03
esta Qing donde empezamos a combinar todos los árboles generados
- 04:04 - 04:08
por la y si bien y eso no genera una
- 04:08 - 04:11
mejor por formas con menos variables, no?
- 04:11 - 04:15
Y decidimos quedarnos con este árbol que baje Saca con
- 04:16 - 04:20
este modelo quiero decir que justamente lo que se ve
- 04:20 - 04:25
es que logramos reducir la cantidad de de del IGSS
- 04:25 - 04:28
y la cantidad de data en cada una de esas
- 04:28 - 04:34
Lips. Eso lo que nos permite aprender con el LG
- 04:35 - 04:40
bien es que justamente nosotros podemos predecir y especificar cuál
- 04:40 - 04:43
va a ser el grupo de clientes que realmente tienen
- 04:43 - 04:44
probabilidad de que se basan.
- 04:45 - 04:49
Entonces no es un indicador que nos muestra que el
- 04:49 - 04:53
modelo está funcionando correctamente con la decidirán que no volvería
- 04:54 - 04:56
a repetir que también me consigo muchísimo tiempo.
- 04:57 - 05:02
Intente agregar el dos mil dieciocho tres años enteros en
- 05:02 - 05:03
la y si bien y eso.
- 05:03 - 05:07
La verdad es que fue una pérdida de tiempo porque
- 05:07 - 05:10
hizo más ruido en lo que fue mi modelo y
- 05:10 - 05:14
a su vez no agregaría estas variables que intente armar
- 05:14 - 05:19
confiterías serían como resultados y del análisis que había hecho
- 05:20 - 05:20
de los distintos roles.
- 05:21 - 05:24
Vea que estos datos se repetían como correlaciones y dijo
- 05:24 - 05:26
que esto fue una cuestión de criterio.
- 05:27 - 05:30
Podían estar relacionados entre sí, haciendo proporciones como los gastos
- 05:31 - 05:35
de la tarjeta Visa con El ingreso por trabajar la
- 05:36 - 05:40
dependencia o préstamos personales, versos del sueldo o la proporción
- 05:40 - 05:43
del descubierto contra LA.
- 05:43 - 05:46
La cantidad pedida en la cuenta a Faldo, o sea,
- 05:46 - 05:47
la garantía de plata que tienen en general entre sus
- 05:48 - 05:51
distintos tipos de cuentas, entre otros que esto es la
- 05:51 - 05:53
realidad, es que hizo generar más ruido.
- 05:54 - 05:57
Puede justamente como que empezó a perder precisión de los
- 05:57 - 05:58
datos del cliente.
- 05:59 - 05:59
Así todo.
- 05:59 - 06:02
Estoy dispuesta a escuchar su feedback y superó.
- 06:02 - 06:05
Agradezco porque tu tiempo cosa de poder seguir mejorando esto