Ir al contenido principal

EL ESTADISTA

EL ESTADISTA




La falta de cultura estadística hace que ha menudo se cometan muchos errores no solo ha la hora de interpretar los datos sino también al momento de nombrar a los estadísticos. Vamos primero con los errores de interpretación:







Los datos de accidentes automovilísticos son casi siempre ha menos de 140 Km por hora . Eso quiere decir que es más seguro de que no me accidente si manejo a más de 140 Km? La respuesta es NO!!! Por que las correlaciones estadísticas no siempre muestran causas y efectos. La gran mayoría de personas circulan ha una velocidad moderada, por lo tanto bajo esta velocidad se producirá la mayoría de accidentes.
Siguiendo este orden de ideas un estudio reciente mostro que las mujeres al volante sufren menos accidentes, y por ende las mujeres manejan mejor que los hombres, personalmente creo sin ser machistas que los hombres manejamos mejor, pero considero que este estudio tendría que estar basado cantidad de horas en las que se esta frente al volante cada uno de los géneros.

Un estudio psicopedagógico mostro que los niños con la planta del pie mas grande, leen mucho mejor que los de tiene pie pequeño. Si analizamos este estudio de más de cerca podemos ver que a medida que un niño crece leen mejor y por lo tanto su nivel de lectura no tiene nada que ver con el tamaño se su pie.

Y así hay muchos más casos reales ... de que casi la mitad del aguardiente que circula en la ciudad de Cali es adulterado fuente: http://elpais.com.co/paisonline/notas/Diciembre062009/licor.html

Ahora vamos con otro ejemplo, el portal el empleo.com que es el portal mas grande e importante de Colombia. En este no existe los estadísticos pero si hay estadistas.... será que hay mucho estadista buscando empleo en este estado burócrata colombiano ... personalmente creo que no!!




Comentarios

Entradas populares de este blog

Importación de un archivo csv utilizando SAS Vs R Vs Python

E n el siguiente articulo, se realizara una comparación entre tres software, en cuanto a la velocidad, cantidad de caracteres del código, lógica y entendimiento de los lenguajes. Acá los resultados: El Archivo Se trata de un documento .CSV, llamado CaseStudy1. Y son datos de empleados de una compañía, la tabla contiene 8 variables y 424 registros. Figura 1: Tabla CaseStudy1 Importación SAS: Para importar el archivo usando SAS, es necesario clarificar que se esta trabajando desde un servidor llamado  On Demand For Academic, la cual es una interfaz de mi PC hacia SAS que se conecta vía web a un servidor a estados unidos. Abrir la version web de SAS que es el SAS Studio. Introducir el usuario y contraseña.  Figura 2: Credenciales Le damos clic en la area del SAS Studio, la cual nos va a llevar a version web de SAS. Como no es posible leer los archivos directamente desde mi equipo es necesario realizar un puente para poder importar los datos, para lo cual es

Un Gráfico de pastel para elecciones presidenciales 2010 en Colombia que no suma el 100%.

No se si este sumando mal pero a este grafico de pastel no le da el 100%; al parecer le falta un 8.4%. Y al parecer el 23.3% de Sanin ocupa más espacio en la torta que los demás candidatos. fuente: http://www.laopinion.com.co/noticias/index.php?option=com_content&task=view&id=347881&Itemid=31

Fácil y desde cero, Minería de datos. Aplicaciones casos reales. (Arboles)

Un banco quiere tener un modelo estadístico, en el cual permita medir el riesgo de realizar un préstamo hipotecario (pagos e impagos de la deuda), para poder cuantificar este riesgo se va a tener en cuenta una serie de variables que según el científico de datos puede llegar a ser relevantes.Para esto se selecciona una muestra representativa de la población de usuarios del banco. Los datos describen el comportamiento de cada cliente al corte de un periodo dado, de tal manera que se tendrá dentro de la muestra personas que están al día  o en mora con su crédito hipotecario. A continuación se realizará una descripción de las variables que quizás puedan influenciar en el resultado del modelo. En resumen, son variables que indican numero de obligaciones, en diferentes cortes de tiempo, cantidad de consultas a la centrales de riesgo, porcentajes de deudas, saldos de deudas, tiempos trascurridos desde el ultimo pago etc ... Siguiendo la metodología de minería de datos lo prime