Vamos a usar un análisis de canasta, como una una poderosa técnica de la minería de datos aplicada a un Supermercado para así mirar las posibles asociaciones, en la compra en los productos del área de salud y belleza frente a los productos de la papelería. Para lo cual vamos a usar SAS Enterprise Miner.
Los metadatos son importados desde las librerías propias del programa, estos datos se denominarán como de rol transaccional.
Cuando se le da un rol de tipo transaccional, se le dice al programa que los datos los lea, debe ser en un orden especifico y con un tipo de agrupación que para nuestro la variable Cluster va a ser el ID.
Para lo cual es necesario como mínimo que la configuración del nodo de asociación tenga los siguientes parámetros:
Finalmente el diagrama importa la data y se conecta el modelo a asociación tal como se muestra en la siguiente gráfica:
El nodo de asociación permite realizar diferentes cambios en cuanto a la configuración de del nodo, esto con el fin de depurar posibles relaciones obvias, o por el contrario si se quiere examinar a una mayor profundidad las reglas de asociación. Entre las cuales cabe mencionar que se puede las parametrizaciones:
- Configurar la cantidad máxima de productos o elementos a asociar.
- Niveles mínimos de confianza.
- Cantidad de reglas a mostrar.
- Criterios de clasificación de las reglas.
Al ejecutar los dos nodos, salen los siguientes resultados.
En particular vamos a mirar el ranking de cada una de las reglas, esto se hace por que esta tabla contiene el estadístico de elevación o Lift, el cual realmente me muestra la fuerza de asociación y causalidad de las reglas.
Soporte: Se puede interpretar como la probabilidad de que se "vendan conjuntamente" los productos sobre el total de transacciones.
Confianza: La confianza se puede mirar como una probabilidad condicional donde se analiza la aparición de un evento dada una condición.
Confianza Esperada: Probabilidad que se tenga el producto de la derecha de la regla.
Lift: Un valor mayor a uno indica que la regla aparece un numero superior a lo esperado, bajo las condiciones de independencia, por ende se puede plantear que existe una relación mas de lo normal entre un conjunto de producto.
Teniendo en cuenta lo anterior podríamos decir que para la primera regla:
Perfume >> Cepillo de dientes
Confianza: Del total de transacciones donde se lleva Perfume el 24.26% lleva también Crema dental.
Soporte: Del total de transacciones que compran conjuntamente perfume y cepillo de dientes solo esta combinación tiene una participación del 2.6%.
Otro gráfico interesante a analizar es el diagrama de asociación, el cual nos representa gráficamente como es la interacción entre productos.
Comentarios