Ir al contenido principal

Relación no es lo mismo que causalidad.

Un error que muchas veces se comerte  (puede ser de forma intencional)  con la información es confundir una correlación de variables con una causalidad directa entre ambas, durante un proceso de investigación casi siempre vamos a querer identificar el nivel de asociación de las variables y poderla cuantificar. Por ejemplo:
  1. El consumo de agua tiene una relación directa con la compra de vestidos de baño, pero ninguna es causalidad de la otra, dado que en época de verano el consumo de las dos variables aumenta.
  2. El precio de la energía eléctrica esta relacionado  con mi edad, pero mi longevidad no es producto del precio del componente eléctrico, aunque  están relacionadas matemáticamente.
  3. La aplicación de una vacuna contra el papiloma humano con la aparición de síntomas alérgicos, 6 meses después en una pequeña población del sur de Bolívar (Colombia), ante este ultimo ejemplo se deben de examinar todos las variables que rodea a la población para dar un veredicto sobre las posibles causas de los síntomas alérgicos.
  4. Al relacionar inteligencia y aptitud, da como resultado que los blancos son  mas inteligentes que los negros. postulado que es falso  ( ver articulo


En primer ejemplos se debe identificar si estamos ante la presencia de una o varias Confusoras:

Sin V. Confusora:
             Agua >>>> Ropa de Baño

Con V. Confusora:
            Temperatura >>> agua 
                               >>> Ropa de Baño


En este caso la variable confusora es  temperatura la cual es la posible causa que las personas consuman mas agua y compren ropa de baño. 

En el segundo ejemplo no existe variable confusora dado que ambas variables (edad y precio energía) están totalmente desligadas y no existe un eslabón que las pueda unir.

Ya por ultimo se debe tener en cuenta que las relaciones no siempre son  lineales ( crecimientos uniformes de ambas variables) se pueden dar de diferentes maneras (Logistica, exponencial etc..) y que los valores atípicos influyen significativamente en la relación de variables.

Ya teniendo claro esta parte de saber que relación no es lo mismo que causalidad  entonces para nuestro próximo ejemplo de riesgo crediticio nos podemos hacer las siguientes preguntas:

  • ¿ Existirán variables confusoras? ¿se pueden acceder a ellas?, ¿son fáciles de identificar?.
  • ¿ Existe causalidad o es mera relación entre variables?
    • ¿El riesgo crediticio crece con el ingreso?.
    • ¿Existen diferencias entre hombres y mujeres respecto al riesgo crediticio?.
    • ¿Si una persona que tiene gran cantidad de tarjetas y prestamos esto hace que mejore su riesgo crediticio?

Comentarios

Entradas populares de este blog

Importación de un archivo csv utilizando SAS Vs R Vs Python

E n el siguiente articulo, se realizara una comparación entre tres software, en cuanto a la velocidad, cantidad de caracteres del código, lógica y entendimiento de los lenguajes. Acá los resultados: El Archivo Se trata de un documento .CSV, llamado CaseStudy1. Y son datos de empleados de una compañía, la tabla contiene 8 variables y 424 registros. Figura 1: Tabla CaseStudy1 Importación SAS: Para importar el archivo usando SAS, es necesario clarificar que se esta trabajando desde un servidor llamado  On Demand For Academic, la cual es una interfaz de mi PC hacia SAS que se conecta vía web a un servidor a estados unidos. Abrir la version web de SAS que es el SAS Studio. Introducir el usuario y contraseña.  Figura 2: Credenciales Le damos clic en la area del SAS Studio, la cual nos va a llevar a version web de SAS. Como no es posible leer los archivos directamente desde mi equipo es necesario realizar un puente para poder importar los datos, para l...

Items importantes para la construcción de Dashboard.

  A través de la elaboración de diversos reportes y del análisis de múltiples artículos que ofrecen recomendaciones sobre su construcción, he identificado una serie de pasos esenciales, los cuales se asemejan a los ingredientes de una receta para el éxito en la creación de dashboards. Definición de Roles Dependiendo del tamaño de la organización, algunos usuarios pueden cumplir más de un rol. En una organización más pequeña, una persona podría ser responsable de crear contenido y administrar el sistema. En organizaciones más grandes, puede haber departamentos enteros para cada Rol Para la elaboración de reportes efectivos, es fundamental iniciar con la definición de roles, asignando responsabilidades claras a cada miembro del equipo. Se recomienda la estandarización de colores y formatos, garantizando una apariencia uniforme en todos los gráficos y visualizaciones. Antes de comenzar, es crucial definir qué información se desea conocer y confirmar que se cuenta con los datos correct...

DATOS DEL AUTOR DEL BLOG

Mi nombre, es Laureano Romero Velásquez soy Estadístico de la Universidad del Valle, esta foto es con el profesor Víctor Guerrero de la UNAM, México (derecha) durante el cursillo Estimación de tendencias de series de tiempo mediante mínimos cuadrados penalizados, en el First International Workshop on Applied Statistics, Universidad Santo Tomas Bogotá Colombia 2009. Este BLOG tendrá como objetivo ser una fuente de discusión de temas estadísticos y como estos influyen en nuestro entorno. Bienvenidos!!!