Identificación de clientes en campañas para una entidad financiera usando el método Stacking
Resumen
La presente investigación, tiene como objetivo general determinar si el método de ensamble Stacking predice con mayor precisión a los clientes potenciales a quienes se les otorgará o desembolsará préstamos en las ofertas de campaña de una entidad financiera, que los algoritmos de aprendizaje supervisado de Machine Learning: Random Forest, Regresión Logística y Árbol de Decisión. La evaluación se realizó comparando el método Stacking con los modelos individuales de Regresión Logística, Árbol de Decisión y Random Forest. Para dicha evaluación se usaron los indicadores Auc, Gini, Logloss y Kolmogorov. Los resultados de sensibilidad en orden de importancia que se obtuvieron con los modelos estadísticos fueron lo siguiente: Regresión Logística 88.9%, seguido del método Stacking con 87.9%, luego el Árbol de Decisión con un 84% y por último Random Forest con un 82.7%. Mientras, que al evaluar la especificidad el de mayor importancia fue el modelo de Random Forest con un 84.8%, Árbol de Decisión 82.8%, método Stacking 81.6% y por último Regresión Logística 78.4%. Respecto a los indicadores evaluados, el que presentó mayor Auc es el método Stacking 0.9117, seguido de Random Forest con un 0.9074, la Regresión Logística reportó un 0.9064 y Árbol de Decisión 0.9074. Con respecto al indicador Gini, el que tiene mayor Gini es el método de Stacking con 0.8235, seguido de Random Forest con un 0.8148, la Regresión Logística cuyo resultado fue de 0.8128 y en última posición el Árbol de Decisión con 0.7885. Con relación al indicador Logloss, el que mostró mejor desempeño fue el método Stacking con 0.3177, seguido de Random Forest con 0.3435, Árbol de Decisión 0.3886 y Regresión Logística 0.3959. Finalmente, con respecto al indicador Kolmogorov, el que tiene mejor resultado es el método Stacking con 0.7124, seguido por Random Forest con 0.7028, Árbol de Decisión 0.6907 y por último la Regresión Logística con 0.6751. The general objective of this research is to determine if the Stacking assembly method predicts with greater precision the potential clients who will be granted or disbursed loans in the campaign offers of a financial institution, than the Machine Learning supervised learning algorithms. : Random Forest, Logistic Regression and Decision Tree. The evaluation was carried out by comparing the Stacking method with the individual models of Logistic Regression, Decision Trees and Random Forest. For this evaluation were used the indicators Auc, Gini, Logloss and Kolmogorov. The results obtained with the confusion matrix were: the Logistic Regression presents greater sensitivity with 88.9%, followed by the Stacking method with 87.9%, then the Decision Tree with 84% and finally Random Forest was 82.7%. While, in the specificity the highest is Random Forest 84.8%, Decision Tree 82.8%, the stacking method 81.6% and finally Logistic Regression 78.4%. Respect to the evaluated indicators, the one with the greatest Auc is the method Stacking 0.9117, followed Random Forest with a 0.9074, Logistic regression reported a 0.9064 y Decision tree with a 0.9074. Also, the one with the greatest Gini is the method of Stacking with 0.8235, followed Random Forest with a 0.8148, the Logistic regression whose result was 0.8128 and Decision tree result 0.7885. Regarding, the indicator Logloss showed better performance is the stacking method 0.3177, then Random Forest 0.3435, Decision tree 0.3886 y Logistic regression 0.3959. Finally, the Kolmogorov indicator, the one with the best indicator is the stacking method 0.7124, followed by Random Forest 0.7028, Decision tree 0.6907 and finally Logistic regression 0.6751.
Colecciones
- EPL-EI Tesis [82]
El ítem tiene asociados los siguientes ficheros de licencia: