Ir al contenido principal

LAS 8 ETAPAS PARA REALIZAR UNA INVESTIGACIÓN ESTADÍSTICA

Muchos profesionales de diferentes áreas se preguntan cuales son las etapas necesarias para implementar un apropiado estudio estadístico. El siguiente documento no pretende ser una guía estricta de los pasos necesarios para hacer un estudio, si no por el contrario es una guía sencilla y simple a la hora de hacer una investigación.

1. Definir la Problemática.
Acá de define el porque es necesario realizar el análisis, lo cual es acompañado con la contextualización de los objetivos lo cual debe estar acompañado de cuales son las hipótesis que desean comprobar o rechazar paralelamente se podría plantear la estimación de los parámetros que se quiere llegar. Todo esto debe estar acompañado de un plan de presupuestos y el tiempo estimado para el cual se va a finalizar el estudio estadístico.

2. Limitación de la Población.
En este paso se pretende dejar claro cual es la población objeto de estudio, sus limites y alcances, cabe anotar que es muy importante analizar la representabilidad de la población y si esta cumple requisitos matemáticos, metodológicos necesarios para el cumplimiento se los objetivos definidos en el punto punto 1.

3. Comprensión de las variables.
Siempre es importante conocer  cuales y que significan cada una de las variables necesarias  para responder el objetivo del estudio, de tal manera que estas variables describan de forma fidedigna  las características de la población.

4. Elección del método estadístico.
En esta fase se propone un método estadístico que pretenda llegar a los resultados que pretendan responder los hipótesis y objetivos propuestos en la parte 1, es comprensible que a medida que se avance, la metodología estadística escogida inicialmente vaya cambiando, por eso considero que esta fase tiene que ir paralelamente durante todo el estudio y en continua comprobación de idoneidad del método escogido.

5.  Diseño de experimento
En esta parte de define si se trabaja con una parte representativa de la población o por  el contrario se utiliza todas las unidades del universo, igualmente se define los métodos comparativos, los errores junto con los niveles de confianza paralelamente dado caso se debe definir todo el andamiaje para la recolección de la información, como son sus fuentes, accesibilidad confiabilidad y soporte de los datos.

6. Recolección de los datos.
Esta etapa es suprema mente importante, de hacerse bien  no nos va a traer dolores de cabeza posteriormente, esta recolección debe estar en una continua inspección y comprobación de los instrumentos de recolección para así evitar los errores.

7.  Procesamiento de los datos.
Acá nos basamos en la estadística descriptiva y en un adecuado programa estadístico. lo cual nos entregará gráficos y parámetros me permiten hacernos una idea del comportamiento de la población, esto es como resumir una gran cantidad de datos en una información las resumida que describa la  forma de nuestra data, es importante aclarar que es una fase descriptiva donde explora las posibles causas de los fenómenos descritos por lo tanto no es prudente asumir estos resultados como explicación de lo  que pasa en el estudio.

8 Inferencia de la información.
Esta parte es donde sacamos las conclusiones y describimos con algún nivel de incertidumbre los resultados del estudio, en donde se describe el método establecido en la parte 4, esto debe estar acompañado de dos informes uno técnico y otro ejecutivo para el primero se expondrá la fundamentación matemática del estudio, el segundo informe estará mas enfocado a los resultados y explicarlos de tal manera que estos sean tenidos en cuenta por parte de las gerencias en la toma de decisiones.



Comentarios

Entradas populares de este blog

Importación de un archivo csv utilizando SAS Vs R Vs Python

E n el siguiente articulo, se realizara una comparación entre tres software, en cuanto a la velocidad, cantidad de caracteres del código, lógica y entendimiento de los lenguajes. Acá los resultados: El Archivo Se trata de un documento .CSV, llamado CaseStudy1. Y son datos de empleados de una compañía, la tabla contiene 8 variables y 424 registros. Figura 1: Tabla CaseStudy1 Importación SAS: Para importar el archivo usando SAS, es necesario clarificar que se esta trabajando desde un servidor llamado  On Demand For Academic, la cual es una interfaz de mi PC hacia SAS que se conecta vía web a un servidor a estados unidos. Abrir la version web de SAS que es el SAS Studio. Introducir el usuario y contraseña.  Figura 2: Credenciales Le damos clic en la area del SAS Studio, la cual nos va a llevar a version web de SAS. Como no es posible leer los archivos directamente desde mi equipo es necesario realizar un puente para poder importar los datos, para lo cual es

Un Gráfico de pastel para elecciones presidenciales 2010 en Colombia que no suma el 100%.

No se si este sumando mal pero a este grafico de pastel no le da el 100%; al parecer le falta un 8.4%. Y al parecer el 23.3% de Sanin ocupa más espacio en la torta que los demás candidatos. fuente: http://www.laopinion.com.co/noticias/index.php?option=com_content&task=view&id=347881&Itemid=31

Fácil y desde cero, Minería de datos. Aplicaciones casos reales. (Arboles)

Un banco quiere tener un modelo estadístico, en el cual permita medir el riesgo de realizar un préstamo hipotecario (pagos e impagos de la deuda), para poder cuantificar este riesgo se va a tener en cuenta una serie de variables que según el científico de datos puede llegar a ser relevantes.Para esto se selecciona una muestra representativa de la población de usuarios del banco. Los datos describen el comportamiento de cada cliente al corte de un periodo dado, de tal manera que se tendrá dentro de la muestra personas que están al día  o en mora con su crédito hipotecario. A continuación se realizará una descripción de las variables que quizás puedan influenciar en el resultado del modelo. En resumen, son variables que indican numero de obligaciones, en diferentes cortes de tiempo, cantidad de consultas a la centrales de riesgo, porcentajes de deudas, saldos de deudas, tiempos trascurridos desde el ultimo pago etc ... Siguiendo la metodología de minería de datos lo prime