Segmentación de usuarios que visitan el sitio web de una empresa utilizando la regresión logística con la técnica de sobremuestreo
Resumen
El trabajo de monografía se desarrolló en una empresa consultora líder en Latinoamérica especializada en soluciones analíticas para las áreas de marketing digital de empresas multinacionales. El trabajo consistió en la implementación y automatización de un modelo de regresión logística binaria para determinar los segmentos de los usuarios que visitan la Web de la empresa. Para realizar el modelo estadístico mencionado se empezó desde el análisis univariante de cada variable independiente, seguido por una técnica de sobremuestreo “SMOTE” para evitar el desbalance de las clases en la variable dependiente, se realizó además una matriz de confusión en la cual se obtuvo una precisión del 76%, hasta finalmente validar la predictibilidad analizando la curva ROC. Los resultados de la investigación ayudaron a demostrar y concluir que existen variables que son significativas para determinar si un usuario que visita la Web realiza una transacción. Por ejemplo: Los usuarios que usan canales orgánicos sin medios publicitarios como referencia y directo o pagados como las redes sociales contribuyen negativamente a la probabilidad de que el usuario haga la transacción, así como también se observó que tanto el tiempo de la visita o si el usuario visita la Web recurrentemente contribuyen a que la probabilidad de hacer la transacción se incremente. Finalmente, la segmentación que se realizó basado en las puntuaciones calculadas por la regresión logística binaria para tener tres segmentos bien diferenciadas que son alto, medio y bajo probabilidad. Al final del trabajo, la empresa aceptó y mostró su satisfacción con los resultados obtenidos. The monograph work was developed in a leading consulting company in Latin America specialized in analytical solutions for the digital marketing areas of multinational companies. The work consisted in the implementation and automation of a binomial logistic regression model to describe the segments of users who visit one of the client's website. Therefore, to perform the aforementioned statistical model, it started from the univariate analysis of each independent variable, followed by a “SMOTE” oversampling technique to avoid the imbalance of classes in the dependent variable, then with a matrix confusion with an accurate of 76% until finally validating the predictability by analyzing the ROC curve. The results of the research helped to demonstrate and conclude that there are variables that are significant in determining whether a user visiting the Web makes a transaction. Users who use organic channels without advertising media as a reference and direct or paid such as social networks negatively contribute to the likelihood of the user making the transaction. It was also observed that both the time of the visit or if the user visits the Web recurrently contribute to the probability of making the transaction is increased. Finally, the segmentation was performed based on the scores calculated by the binomial logistic regression to have three welldifferentiated segments that are high, medium and low probability. At the end of the work, the company accepted and showed its satisfaction with the results obtained
Colecciones
- EPL-EI Tesis [82]
El ítem tiene asociados los siguientes ficheros de licencia: