Ir al contenido principal

Aplicando Data Miner haciendo uso de un Análisis de Canasta en el Retail

Vamos a usar un análisis de canasta, como una una poderosa técnica de la minería de datos aplicada a un Supermercado para así mirar las posibles asociaciones, en la compra en los productos del área de salud y belleza frente a los productos de la papelería. Para lo cual vamos a usar SAS Enterprise Miner.


Los metadatos son importados desde las librerías propias del programa, estos datos se denominarán como de rol transaccional.


Cuando se le da un rol de tipo transaccional, se le dice al programa que los datos los lea, debe ser en un orden especifico y con un tipo de agrupación que para nuestro la variable Cluster va a ser el ID. 
Para lo cual es necesario como mínimo que la configuración del nodo de asociación tenga los siguientes parámetros:



Finalmente  el diagrama  importa la data y se conecta el modelo a asociación tal como se muestra en la siguiente gráfica:


El nodo de asociación permite realizar diferentes cambios en cuanto a la configuración de del nodo, esto con el fin de depurar posibles relaciones obvias, o por el contrario si se quiere examinar a una mayor profundidad las reglas de asociación. Entre las cuales cabe mencionar que se puede las parametrizaciones:

  • Configurar la cantidad máxima de productos o elementos a asociar.
  • Niveles mínimos de confianza.
  • Cantidad de reglas a mostrar.
  • Criterios de clasificación de las reglas.



Al ejecutar los dos nodos, salen los siguientes resultados.



En particular vamos a mirar  el ranking de cada una de las reglas, esto se hace por que esta tabla contiene el estadístico de elevación o Lift, el cual realmente me muestra la fuerza de asociación y causalidad de las reglas.


Soporte: Se puede interpretar como la probabilidad de que se "vendan conjuntamente" los productos sobre el total de transacciones.

Confianza:   La confianza se puede mirar como una probabilidad condicional donde se analiza la aparición de un evento dada una condición.

Confianza Esperada: Probabilidad que se tenga el producto de la derecha de la regla.

Lift:  Un valor mayor a uno indica que la regla aparece un numero superior a lo esperado, bajo las condiciones de independencia, por ende se puede plantear que existe una relación mas de lo normal entre un conjunto de producto.

Teniendo en cuenta lo anterior podríamos decir que para la primera regla:

Perfume >> Cepillo de dientes

Lift: Es 3.6 veces mas probable de que una persona que habiendo llevado un perfume lleve en su compra un cepillo de dientes, frente a alguien que  lleve solo  cepillo de dientes.

Confianza: Del total de transacciones donde se lleva Perfume el 24.26% lleva también Crema dental.

Soporte: Del total de transacciones que compran conjuntamente  perfume y cepillo de dientes solo esta combinación tiene una participación del 2.6%.

Otro gráfico interesante a analizar es el diagrama de asociación, el cual nos representa gráficamente como es la interacción entre productos.



Comentarios

Entradas populares de este blog

Items importantes para la construcción de Dashboard.

  A través de la elaboración de diversos reportes y del análisis de múltiples artículos que ofrecen recomendaciones sobre su construcción, he identificado una serie de pasos esenciales, los cuales se asemejan a los ingredientes de una receta para el éxito en la creación de dashboards. Definición de Roles Dependiendo del tamaño de la organización, algunos usuarios pueden cumplir más de un rol. En una organización más pequeña, una persona podría ser responsable de crear contenido y administrar el sistema. En organizaciones más grandes, puede haber departamentos enteros para cada Rol Para la elaboración de reportes efectivos, es fundamental iniciar con la definición de roles, asignando responsabilidades claras a cada miembro del equipo. Se recomienda la estandarización de colores y formatos, garantizando una apariencia uniforme en todos los gráficos y visualizaciones. Antes de comenzar, es crucial definir qué información se desea conocer y confirmar que se cuenta con los datos correct...

Un Gráfico de pastel para elecciones presidenciales 2010 en Colombia que no suma el 100%.

No se si este sumando mal pero a este grafico de pastel no le da el 100%; al parecer le falta un 8.4%. Y al parecer el 23.3% de Sanin ocupa más espacio en la torta que los demás candidatos. fuente: http://www.laopinion.com.co/noticias/index.php?option=com_content&task=view&id=347881&Itemid=31

LAS 8 ETAPAS PARA REALIZAR UNA INVESTIGACIÓN ESTADÍSTICA

Muchos profesionales de diferentes áreas se preguntan cuales son las etapas necesarias para implementar un apropiado estudio estadístico. El siguiente documento no pretende ser una guía estricta de los pasos necesarios para hacer un estudio, si no por el contrario es una guía sencilla y simple a la hora de hacer una investigación. 1. Definir la Problemática. Acá de define el porque es necesario realizar el análisis, lo cual es acompañado con la contextualización de los objetivos lo cual debe estar acompañado de cuales son las hipótesis que desean comprobar o rechazar paralelamente se podría plantear la estimación de los parámetros que se quiere llegar. Todo esto debe estar acompañado de un plan de presupuestos y el tiempo estimado para el cual se va a finalizar el estudio estadístico. 2. Limitación de la Población. En este paso se pretende dejar claro cual es la población objeto de estudio, sus limites y alcances, cabe anotar que es muy importante analizar la representabilidad d...