Ir al contenido principal

Video del Profesor Roberto Behar

Les hablare sobre una conferencia que fue impartida en España por el profesor Roberto Behar el cual pertenece a la escuela de ingeniería industrial y estadística de la Universidad del Valle.

En esta conferencia el profesor habla sobre paradigmas e ideas confusas que existente en algunos conceptos importantes de la estadística.

El primer tema que trata, es la gran importancia que tiene la variabilidad en nuestro mundo cotidiano y que aveces sin darnos cuenta, la aplicamos para tomar decisiones.

Habla también de un Paradigma existente, que la muestra tiene que ser el 10% de la población, un ejemplo muy bueno que utiliza el profesor es el de la sopa:

Una cocinera para mirar si le echa mas sal o menos sal a la sopa,  no se toma el 10% de la sopa para saber si esta buena; con este ejemplo postulamos la importancia del concepto de homogeneidad.

Otro ejemplo:  para conocer el tipo de sangre no es necesario que le saquen el 10% de la sangre; lo que equivale a aproximadamente a medio litro; imaginense que a uno le saquen de una sola toda esa cantidad de tejido fluido  para mirar solo el RH.

Otro tema muy importante es el Contrate de Hipótesis y pone como ejemplo el Juicio al reo.

Donde Ho: el reo es inocente.

De tal manera que se realizara un proceso de recolección de evidencia para contrastar la hipótesis de inocencia. Si no se logra generar la duda necesaría, entonces las pruebas no fueron suficientes eso no quiere decir que la hipótesis sea cierta. Lo que en realidad quiere decir es que no existe evidencia suficiente para no aceptar la hipótesis nula

Entonces la presunción de inocencia del reo esta directamente asociada a la hipótesis nula. Ahora miraremos un ejemplo que yo tomo de nuestra folclórica patria bananera cuando declaran a culpable a un inocente este es un ejemplo de error tipo I y esto fue lo que paso macabramente en Colombia hace pocos meses durante el ministerio de defensa del candidato a la presidencia de la república y quizás futuro presidente de Colombia Juan Manuel Santos en donde unos inocentes fueron pasados como suversivos; y luego fusilados por algunos miembros del ejercito y que ahora estos últimos por el vencimiento de términos están saliendo libres en donde quizás estemos cometiendo error tipo II que es no condenar a los culpables de estas muertes.

El profesor habla en su conferencia de la importancia Puntos atípico y cuando es conveniente eliminarlos; El concepto geométrico como punto de equilibrio de la media aritmética; de que la probabilidad de elegir la balota premiada sin reemplazo no depende del orden de elegir la balota; la confianza esta asociada al procedimiento que genera el intervalo; a la hora de seleccionar las variables de regresión lo importante es ver cuanto y que explica estas variables al estudio.

enlace de este buen  video:
http://upcommons.upc.edu/video/handle/2099.2/256

Comentarios

Entradas populares de este blog

Importación de un archivo csv utilizando SAS Vs R Vs Python

E n el siguiente articulo, se realizara una comparación entre tres software, en cuanto a la velocidad, cantidad de caracteres del código, lógica y entendimiento de los lenguajes. Acá los resultados: El Archivo Se trata de un documento .CSV, llamado CaseStudy1. Y son datos de empleados de una compañía, la tabla contiene 8 variables y 424 registros. Figura 1: Tabla CaseStudy1 Importación SAS: Para importar el archivo usando SAS, es necesario clarificar que se esta trabajando desde un servidor llamado  On Demand For Academic, la cual es una interfaz de mi PC hacia SAS que se conecta vía web a un servidor a estados unidos. Abrir la version web de SAS que es el SAS Studio. Introducir el usuario y contraseña.  Figura 2: Credenciales Le damos clic en la area del SAS Studio, la cual nos va a llevar a version web de SAS. Como no es posible leer los archivos directamente desde mi equipo es necesario realizar un puente para poder importar los datos, para lo cual es

Un Gráfico de pastel para elecciones presidenciales 2010 en Colombia que no suma el 100%.

No se si este sumando mal pero a este grafico de pastel no le da el 100%; al parecer le falta un 8.4%. Y al parecer el 23.3% de Sanin ocupa más espacio en la torta que los demás candidatos. fuente: http://www.laopinion.com.co/noticias/index.php?option=com_content&task=view&id=347881&Itemid=31

Fácil y desde cero, Minería de datos. Aplicaciones casos reales. (Arboles)

Un banco quiere tener un modelo estadístico, en el cual permita medir el riesgo de realizar un préstamo hipotecario (pagos e impagos de la deuda), para poder cuantificar este riesgo se va a tener en cuenta una serie de variables que según el científico de datos puede llegar a ser relevantes.Para esto se selecciona una muestra representativa de la población de usuarios del banco. Los datos describen el comportamiento de cada cliente al corte de un periodo dado, de tal manera que se tendrá dentro de la muestra personas que están al día  o en mora con su crédito hipotecario. A continuación se realizará una descripción de las variables que quizás puedan influenciar en el resultado del modelo. En resumen, son variables que indican numero de obligaciones, en diferentes cortes de tiempo, cantidad de consultas a la centrales de riesgo, porcentajes de deudas, saldos de deudas, tiempos trascurridos desde el ultimo pago etc ... Siguiendo la metodología de minería de datos lo prime