Identificación de las reglas de asociación utilizando los algoritmos secuenciales Spade y GSP
Resumen
Hoy en día los datos secuenciales son de gran importancia, debido a que pueden encontrarse en distintas aplicaciones como: registros de ventas, registros médicos de pacientes, registros webs, bolsa de valores, base de datos en geofísica, etc. Es por esta razón que se han estudiado las tendencias o patrones a través del tiempo con el algoritmo secuencial. En esta investigación se estudia con mayor profundidad el algoritmo secuencial Sequential Pattern Discovery using Equivalent Class (SPADE, por sus siglas en inglés), debido a que usa una eficiente búsqueda de las reglas que se generan por el algoritmo, reduciendo el número de reglas y costos de la memoria. En primer lugar, se ilustra el procedimiento para obtener las reglas de asociación y luego con un conjunto de datos se identifican las reglas de asociación computacionalmente. Por último se compara los resultados obtenidos con el algoritmo Generalized Sequential Patterns (GSP, por sus siglas en inglés), debido a que ambos algoritmos tienen el mismo enfoque. Uno de los resultados más resaltantes fue “el cliente compra pavo en un tiempo máximo de tres meses, dado que compró antes costilla de cordero”. Los resultados que se obtuvieron sirven para incrementar las ventas del establecimiento a través de ventas cruzadas. El algoritmo SPADE permitió obtener reglas más completas que el GSP. Today, sequential data are of great importance, because they can be found in various applications such as: sales records, patient medical records, web registries, stock exchange, geophysics database, etc. Trends have been studied over time with the sequential algorithm. Sequential discovery of the pattern using the equivalent class (SPADE), by an efficient search of the rules that are generated by the algorithm, reducing the number of rules and costs of memory. First, Illustrates the procedure for obtaining the association rules, and then with a set of data, they identify the association rules computationally. Generalized sequential schemes (GSP), because both algorithms have the same approach. One of the most remarkable results was "the customer buys turkey in a maximum time of three months, since he bought before lamb rib". The results obtained are used to increase sales through cross-selling. The SPADE algorithm allowed to obtain more complete rules than the GSP.
Colecciones
- EPL-EI Tesis [82]
El ítem tiene asociados los siguientes ficheros de licencia: