De la ficción a la realidad hay mucho trecho, o de lo que se cree esta muy lejos de ser verdad, esto pasa en muchas ocasiones con muchos profesionales que desconocen la influencia que tiene una variabilidad en un conjunto de datos, conllevando a que se utilice pocos o ningún criterio estadístico en un análisis de datos. Para ello voy a traerles un ejemplo REAL y CLARO de una pésima, interpretación de la realidad.
Para contextualizar un poco el caso me permito decir, Colombia es un país de grandes desigualdades económicas donde gran parte de su población es pobre, cuyos habitantes se mueve en un comercio un poco informal, del cual se destaca las tiendas de barrios, que no son mas que una familia pobre que utiliza su casa para vender productos detrás de un mostrador. Según cifras de Nielsen existen al rededor de 250.000 establecimiento con estas características. En estos establecimientos se comercializa los principales y más necesarios productos de la canasta familiar entre estos esta el Aceite vegetal. Una empresa de consumo masivo quiso saber cuanto compraban estas tiendas en el segmento aceite en la ciudad de Cali y sus alrededores. concluyeron que sus compras anuales por tienda eran de $16.416 pesos al rededor de 9,12 U$. Pero sacando una simple gráfica y uno pocos estadísticos de dispersión.
Se observa que la distribución de las compras de los aceites por parte de las tiendas se encuentran sesgadas a la derecha por la influencia de unas cuantos establecimientos que compran grandes cantidades del aceite, haciendo poco representativo a la media como estadístico que muestre la realidad del mercado. Pero si vemos la mediana se observa que la mitad de los establecimientos realizan compras menores a $4.691 pesos (2,6 U$), siendo quizás este sea un mejor indicador de la realidad del mercado. Esto nos permite plantear una nueva hipótesis, con respecto a la población, de que existe dos tipos de tiendas (Grandes y Pequeñas), conllevando a posiblemente a segmentar los datos y poder así aplicar como próximo paso un poco de estadística multivariada.
Comentarios