Ir al contenido principal

Un poco de Estadística Descriptiva

De la ficción a la realidad hay mucho trecho, o de lo que se cree esta muy lejos de ser verdad, esto pasa en muchas ocasiones con muchos profesionales que desconocen la influencia que tiene una variabilidad en un conjunto de datos, conllevando a que se utilice pocos o ningún criterio estadístico en un análisis de datos. Para ello voy a traerles un ejemplo REAL  y CLARO  de una pésima, interpretación de la realidad. 
Para contextualizar un poco el caso me permito decir, Colombia es un país de grandes desigualdades económicas donde gran parte de su población es pobre, cuyos habitantes se mueve en un comercio un poco informal, del cual se destaca las tiendas de barrios, que no son mas que una familia pobre que utiliza su casa para vender productos detrás de un mostrador. Según cifras de Nielsen existen al rededor de 250.000 establecimiento con estas características. En estos establecimientos se comercializa los principales y más necesarios productos de la canasta familiar entre estos esta el Aceite vegetal. Una empresa de consumo masivo quiso saber cuanto compraban estas tiendas en el segmento aceite en la ciudad de Cali y sus alrededores. concluyeron que sus compras anuales por tienda eran de $16.416 pesos al rededor de 9,12 U$. Pero sacando una simple gráfica y uno pocos estadísticos de dispersión.

Se observa que la distribución de las compras de los aceites por parte de las tiendas se encuentran sesgadas a la derecha por la influencia de unas cuantos establecimientos que compran grandes cantidades del aceite, haciendo poco representativo a la media como estadístico que muestre la realidad del mercado. Pero si vemos la mediana se observa que la mitad de los establecimientos realizan compras menores a $4.691 pesos (2,6 U$), siendo quizás este sea un mejor indicador de la realidad del mercado. Esto nos permite plantear una nueva hipótesis, con respecto a la población, de que existe dos tipos de tiendas (Grandes y Pequeñas), conllevando a posiblemente a segmentar los datos y poder así aplicar como próximo paso un poco de estadística multivariada.    
   

Comentarios

Entradas populares de este blog

Importación de un archivo csv utilizando SAS Vs R Vs Python

E n el siguiente articulo, se realizara una comparación entre tres software, en cuanto a la velocidad, cantidad de caracteres del código, lógica y entendimiento de los lenguajes. Acá los resultados: El Archivo Se trata de un documento .CSV, llamado CaseStudy1. Y son datos de empleados de una compañía, la tabla contiene 8 variables y 424 registros. Figura 1: Tabla CaseStudy1 Importación SAS: Para importar el archivo usando SAS, es necesario clarificar que se esta trabajando desde un servidor llamado  On Demand For Academic, la cual es una interfaz de mi PC hacia SAS que se conecta vía web a un servidor a estados unidos. Abrir la version web de SAS que es el SAS Studio. Introducir el usuario y contraseña.  Figura 2: Credenciales Le damos clic en la area del SAS Studio, la cual nos va a llevar a version web de SAS. Como no es posible leer los archivos directamente desde mi equipo es necesario realizar un puente para poder importar los datos, para l...

Items importantes para la construcción de Dashboard.

  A través de la elaboración de diversos reportes y del análisis de múltiples artículos que ofrecen recomendaciones sobre su construcción, he identificado una serie de pasos esenciales, los cuales se asemejan a los ingredientes de una receta para el éxito en la creación de dashboards. Definición de Roles Dependiendo del tamaño de la organización, algunos usuarios pueden cumplir más de un rol. En una organización más pequeña, una persona podría ser responsable de crear contenido y administrar el sistema. En organizaciones más grandes, puede haber departamentos enteros para cada Rol Para la elaboración de reportes efectivos, es fundamental iniciar con la definición de roles, asignando responsabilidades claras a cada miembro del equipo. Se recomienda la estandarización de colores y formatos, garantizando una apariencia uniforme en todos los gráficos y visualizaciones. Antes de comenzar, es crucial definir qué información se desea conocer y confirmar que se cuenta con los datos correct...

DATOS DEL AUTOR DEL BLOG

Mi nombre, es Laureano Romero Velásquez soy Estadístico de la Universidad del Valle, esta foto es con el profesor Víctor Guerrero de la UNAM, México (derecha) durante el cursillo Estimación de tendencias de series de tiempo mediante mínimos cuadrados penalizados, en el First International Workshop on Applied Statistics, Universidad Santo Tomas Bogotá Colombia 2009. Este BLOG tendrá como objetivo ser una fuente de discusión de temas estadísticos y como estos influyen en nuestro entorno. Bienvenidos!!!