Ir al contenido principal

Entradas

Mostrando las entradas etiquetadas como Contraste de Hipotesis

Minería de Datos: Correlación de variables cuantitativas

En el próximo vídeo vamos a ver asociación de variables numéricas (Cuantitativas) en donde se aplicara el coeficiente de correlación de  Pearson, ANOVA y mapas de calor. El Coeficiente de Correlación  consiste en medir la fuerza de asociación lineal entre una variables c uantitativas ,  La asociación puede variar  entre entre -1 y 1, cuando el valor es negativa la relación es inversa por ejemplo, cuando el consumo del agua potable aumenta los casos de cólera disminuyen. el otro tipo de relación es cuando el coeficiente es cercano a uno,  por ejemplo cuando el precio del petroleo aumenta los precios de la gasolina también  lo hacen,  en cambio cuando  una asociación es cercana a 0 esto quiere decir que no tiene relación lineal.  

Mineria de datos: Pruebas de independencia para Tablas con más de dos variables

En siguiente vídeo se muestra como es la forma en la cual se debe de inferir correctamente la existencia de correlación entre más de dos variables.

PROCESAMIENTO DE DATOS

Nosotros como investigadores en muchas ocasiones nos debemos de enfrentar a una gran cantidad de retos a la hora de la transformación de datos en información comprensible. Partiendo que mucha de nuestra información se encuentra localizada en  diferentes servidores, en bases de datos tipo Oracle, Microsoft SQL Server, RDBMS o los free como son PostgreSQL  o MySQL es necesario contar con un adecuado software que pueda  ordenar, crear, transformar, nuevas variables y llevar los análisis y gráficos a plataformas interactivas o a informes html  Cuando empezamos a ver los datos, uno de estos problemas presentados son la identificación y adaptación de las diferentes fuentes de información, igualmente está, la calidad de la Data, en donde veremos información corrupta, incompleta y hasta incomprensible, ante estos problemas la herramienta analítica se deberá adaptase y: Eliminar recalcular filas. Crear, transformar suprimir variables. Crear, reno...

LAS 8 ETAPAS PARA REALIZAR UNA INVESTIGACIÓN ESTADÍSTICA

Muchos profesionales de diferentes áreas se preguntan cuales son las etapas necesarias para implementar un apropiado estudio estadístico. El siguiente documento no pretende ser una guía estricta de los pasos necesarios para hacer un estudio, si no por el contrario es una guía sencilla y simple a la hora de hacer una investigación. 1. Definir la Problemática. Acá de define el porque es necesario realizar el análisis, lo cual es acompañado con la contextualización de los objetivos lo cual debe estar acompañado de cuales son las hipótesis que desean comprobar o rechazar paralelamente se podría plantear la estimación de los parámetros que se quiere llegar. Todo esto debe estar acompañado de un plan de presupuestos y el tiempo estimado para el cual se va a finalizar el estudio estadístico. 2. Limitación de la Población. En este paso se pretende dejar claro cual es la población objeto de estudio, sus limites y alcances, cabe anotar que es muy importante analizar la representabilidad d...

Comparando inventarios Aplicación en auditoría

Buen día, me permito compartir otra aplicación estadística con datos y hechos reales. Me presentaron dos inventarios hechos por dos entidades diferentes,  tomados como parte de una pequeña auditoría a una bodega, me preguntaron si las diferencias significativas entre uno y otro  para concluir de que existían errores o un posible fraude en alguno de los dos auditores. Cajas Auditor 1 Auditor 2 Producto 1   126 133 Producto 2    180 197 Producto 3 5 17 Producto 4 15 17 Producto 5 113 122 Producto 6 61 66 Producto 7 45 50 Producto 8 89 113 Producto 9 209 218 Producto 10 57 64 Producto 11 132 136 Producto 12 200 211 Continua..... PRUEBA ESTADÍSTICA DE DIFERENCIA DE INVENTARIOS  Estadísticos A1 A2 Media 70.4 78.3 V...

Call Center, un punto de vista estadístico.

Hoy les escribire sobre una experiencia que he tenido con los Call Center y no es precisamente haciendo un reclamo. Estos puntos de recepción  se han convertido gracias a los avances tecnologicos en  grandes centros de acopio de información, permitiendole a las empresas disponer de las heramientas necesarias para conocer de primera fuente las inquietudes y las preferencias de sus clientes.  Al empezar a analizar y a modelar los tiempos de atención me encontre lo interesante y lo "bonito" de la distribución de los datos. Modelo Empirico de los tiempos de atención:   Se observa una caida casi asintotica, lo cual me transporta a mis clases de probabilidad en donde vi distribuciones muy simulares, entre las cuales esta la distrubución Exponencial.    Esta distribución se utiliza para el modelamiento de los tiempos de atención. El paso a seguir es comprobar si efectivamente los datos se adaptan al modelo teorico, en donde se utilizan diferentes pr...