Ir al contenido principal

Entradas

Mostrando las entradas etiquetadas como Promedio

Algunas consideraciones adicionales sobre los datos Anomalos.

La primera opción que se considera cuando se presentan valores anómalos es eliminarlos, pero esta practica es poco recomendable sin antes contextualizar la realidad del estudio, por ejemplo estos datos nos pueden estar mostrando interesantes comportamientos  que en ultimas pueden ser documentados. Si, no se encuentra alguna relación entre estos datos y el estudio, se recomienda lo siguiente: Omitir los registros que presente valores perdidos. Omitir las variables que tiene tiene exceso de valores perdidos. Forzar a convertir estos valores dentro del rango de no atipicidad este puede ser dentro de las +- 3 desviaciones estándar con respecto a la media o (Q1,Q2 ) +- 1.5* IQR.  Pronosticar los valores anómalos analizando la estructura y la secuencia de los registros y variables. Reemplazar los valores anómalos por registros valederos, siempre y cuando la cantidad a cambiar sea pequeña. Acá les comparto un vídeo en donde se convierten  los datos  a ran...

PROCESAMIENTO DE DATOS

Nosotros como investigadores en muchas ocasiones nos debemos de enfrentar a una gran cantidad de retos a la hora de la transformación de datos en información comprensible. Partiendo que mucha de nuestra información se encuentra localizada en  diferentes servidores, en bases de datos tipo Oracle, Microsoft SQL Server, RDBMS o los free como son PostgreSQL  o MySQL es necesario contar con un adecuado software que pueda  ordenar, crear, transformar, nuevas variables y llevar los análisis y gráficos a plataformas interactivas o a informes html  Cuando empezamos a ver los datos, uno de estos problemas presentados son la identificación y adaptación de las diferentes fuentes de información, igualmente está, la calidad de la Data, en donde veremos información corrupta, incompleta y hasta incomprensible, ante estos problemas la herramienta analítica se deberá adaptase y: Eliminar recalcular filas. Crear, transformar suprimir variables. Crear, reno...

códigos sencillos en SAS

CREACIÓN DE UN ARCHIVO DATA ARCHIVO; RUN ; CREACIÓN DE UN ARCHIVO MAS VARIABLES Y SE REALIZA OPERACIONES DATA PRIMER_ARCHIVO; INPUT ID $ EDAD ESTATURA PESO COEF; COEF=EDAD/PESO* 100 ; DATALINES ; 01 23 1.45 65 02 40 1.76 80 ; RUN ; PROC PRINT ; RUN ; CREAR  CALCULAR Y GUARDAR UN ARCHIVO SACANDO MEDIAS: DATA "C:\Users\USUARIO\Documents\SAS\PROGRAMAS\PRIMER_ARCHIVO" ; INPUT ID $ EDAD ESTATURA PESO COEF; COEF= ESTATURA/PESO* 100 ; DATALINES ; 01 23 1.45 65 02 40 1.76 80 03 18 1.67 70 05 45 1.76 69 ; RUN ; PROC MEANS ; RUN ;

Un poco de Estadística Descriptiva

De la ficción a la realidad hay mucho trecho, o de lo que se cree esta muy lejos de ser verdad, esto pasa en muchas ocasiones con muchos profesionales que desconocen la influencia que tiene una variabilidad en un conjunto de datos, conllevando a que se utilice pocos o ningún criterio estadístico en un análisis de datos. Para ello voy a traerles un ejemplo REAL  y CLARO  de una pésima, interpretación de la realidad.  Para contextualizar un poco el caso me permito decir, Colombia es un país de grandes desigualdades económicas donde gran parte de su población es pobre, cuyos habitantes se mueve en un comercio un poco informal, del cual se destaca las tiendas de barrios, que no son mas que una familia pobre que utiliza su casa para vender productos detrás de un mostrador. Según cifras de Nielsen existen al rededor de 250.000 establecimiento con estas características. En estos establecimientos se co...

Videos educativos

Buscando una información en la WEB me encontré unos muy buenos vídeos educativos de la universidad Carlos III, que me complace compartir algunos link con ustedes. Amplitud Min Max: No adjunto mas vídeos, por que estos me bloquean el Blogger,

Pasos para realizar un estudio Estadístico Descriptivo

En algunas ocasiones muchos investigadores  no saben por donde comenzar o que pasos seguir en un estudio descriptivo, por eso les comparto un documento guia muy fácil de entender, el cual permite dar una idea de lo que se debe o no se debe hacer a la hora se realizar un estudio estadístico

Video del Profesor Roberto Behar

Les hablare sobre una conferencia que fue impartida en España por el profesor Roberto Behar el cual pertenece a la escuela de ingeniería industrial y estadística de la Universidad del Valle . En esta conferencia el profesor habla sobre paradigmas e ideas confusas que existente en algunos conceptos importantes de la estadística. El primer tema que trata, es la gran importancia que tiene la variabilidad en nuestro mundo cotidiano y que aveces sin darnos cuenta, la aplicamos para tomar decisiones. Habla también de un Paradigma existente, que la muestra tiene que ser el 10% de la población, un ejemplo muy bueno que utiliza el profesor es el de la sopa: Una cocinera para mirar si le echa mas sal o menos sal a la sopa,  no se toma el 10% de la sopa para saber si esta buena; con este ejemplo postulamos la importancia del concepto de homogeneidad. Otro ejemplo:  para conocer el tipo de sangre no es necesario que le saquen el 10% de la sangre;...

Blanco ó Negro ?

Voy a hablar del controvertido libro The Bell Curve escrito por Charles Murray y Richard J. Herrnstein, en una parte de esta obra literaria se afirma que las personas de color de piel blanca son más inteligentes. Para realizar esta afirmación los autores se basan en métodos estadísticos de correlación. En el libro se plantea lo siguiente. Se tiene dos poblaciones, una de blancos (B) y otra de negros (N). En ambas poblaciones se miden dos características que son: Inteligencia (I) Aptitud (A), se asume que en ambas poblaciones la aptitud es la misma, pero por circunstancias de educación y ambiente la variable Inteligencia tiene un mayor valor en los blancos. Digamos que se sea predecir la Aptitud conociendo la Inteligencia, bajo este planteamiento se podría llegar a la conclusión de que las personas de color de piel blanca tendrán una mayor calificación que los individuos de color negro. Pero la anterior argumentación esta sesgada, y quizas mal intensionada ya que el  resultad...

Estadística en JAVA

Navegando en Internet, me encontré una interesante pagina , en donde se muestra las diferentes aplicaciones de estadística y probabilidad en el programa JAVA . Me llamo mucho la atención por que es muy fácil de visualizar y de utilizar, tan solo se debe de incluir unos parámetros básicos. Ademas estas paginas muestran la teoría estadística de una forma muy dinámica, ilustrativa y divertida.

NORMAL BIVARIADA EN EXCEL

Es un ejercicio en excel donde se realiza una representación gráfica de la función de densidad normal bivariada donde las medias son cero, las varianzas son uno y el coeficiente de correlación es uno.                               Se optiene una superficie en forma de campana, donde el max corresponde a las medias y la forma de la figura es controlada por las varianzas y el coeficiente de correlación.

EL PROMEDIO ES SINONIMO DE BELLEZA ?

Quiero compartirles un artículo que me parece interesante en donde dice que las mujeres con proporciones faciales cercanas al promedio son hermosas: "Women with facial proportions that are closest to average are considered the most beautiful by their peers, research suggests.” … y que los humanos, tenemos un prototipo mental de belleza, el cual asimila el promedio de las proporciones faciales con un rostro bello, igualmente este estudio dice que la simetría en un rostro indica buena salud y por ende belleza. “Though it is unknown why faces that follow these proportions are considered lovelier, researchers say one theory is that humans have a mental prototype that represents an average of all faces and those that are closest to it are considered the most appealing. Previous research has shown that those with symmetrical faces are also perceived as more beautiful, possibly because the symmetry indicates good health. It is possible that evolutionary biology dictates that average face...