Ir al contenido principal

Entradas

Mostrando las entradas etiquetadas como Riesgo

Modelando en la minería de datos: Arboles de decisión

Antes de entrar al tema de arboles de decisión, se tratará de explicar el termino de modelo. Un modelo es la abstracción de una  realidad palpable,  representada por medio de algoritmos matemáticos y apoyada por potentes software informáticos, lo cual se ha convertido en una imperiosa necesidad para los diferentes sectores de análisis del mundo. El modelo estadístico pretende cumplir esto, por medio de una simple igualdad matemática, que en la mayoría de casos esta compuesta por una relación en donde interviene un error. A lo largo de la historia se han podido clasificar en tres grupos los modelos estadísticos. Modelos asociativos: Estos modelos pretenden identificar un orden de acontecimientos, que permitan describir a tiempo una cadena de sucesos, por ejemplo: ¿que serie de sucesos pasa para que un suscriptor cancele un servicio televisivo?. Primero llama, luego va personalmente a quejarse,  después manda una carta,... (¿?)...., por ultimo cancela. Es...

Minería de Datos: Correlación de variables cuantitativas

En el próximo vídeo vamos a ver asociación de variables numéricas (Cuantitativas) en donde se aplicara el coeficiente de correlación de  Pearson, ANOVA y mapas de calor. El Coeficiente de Correlación  consiste en medir la fuerza de asociación lineal entre una variables c uantitativas ,  La asociación puede variar  entre entre -1 y 1, cuando el valor es negativa la relación es inversa por ejemplo, cuando el consumo del agua potable aumenta los casos de cólera disminuyen. el otro tipo de relación es cuando el coeficiente es cercano a uno,  por ejemplo cuando el precio del petroleo aumenta los precios de la gasolina también  lo hacen,  en cambio cuando  una asociación es cercana a 0 esto quiere decir que no tiene relación lineal.  

Algunas consideraciones adicionales sobre los datos Anomalos.

La primera opción que se considera cuando se presentan valores anómalos es eliminarlos, pero esta practica es poco recomendable sin antes contextualizar la realidad del estudio, por ejemplo estos datos nos pueden estar mostrando interesantes comportamientos  que en ultimas pueden ser documentados. Si, no se encuentra alguna relación entre estos datos y el estudio, se recomienda lo siguiente: Omitir los registros que presente valores perdidos. Omitir las variables que tiene tiene exceso de valores perdidos. Forzar a convertir estos valores dentro del rango de no atipicidad este puede ser dentro de las +- 3 desviaciones estándar con respecto a la media o (Q1,Q2 ) +- 1.5* IQR.  Pronosticar los valores anómalos analizando la estructura y la secuencia de los registros y variables. Reemplazar los valores anómalos por registros valederos, siempre y cuando la cantidad a cambiar sea pequeña. Acá les comparto un vídeo en donde se convierten  los datos  a ran...

El mundo financiero y la Estadística. (Teoría del Proceso Estocástico Browniano)

La metodología estocástica en el mundo financiero  fue propuesta por Case y Shiller (1989), la cual se fundamenta en retomar de forma consecutiva los precios cada vez que estos se transan en periodos de tiempo t , en donde el comportamiento de los precios se caracterizan como un proceso estocástico el cual postula que el cambio en el precio de las acciones es aleatorio e impredecible, entonces se propone utilizar  el método Browniano el cual es un caso particular del proceso estocástico Markov [1] con media cero y varianza uno por un periodo T. Un proceso estocástico es una familia de variables aleatorias definida sobre un espacio de probabilidad. Tendremos que X es una función de dos argumentos. Fijado w=w0, obtenemos una función determinista,El espacio de estados S de un proceso estocástico es el conjunto de todos los posibles valores que puede tomar dicho proceso. Para esclarecer el tema, se propone un ejemplo de proceso estocástico adaptado al mercado de acc...

Un índice Estadístico para la bolsa de valores

   Grafica 1.  Variaciones entre el IGVR y el IGBC año 2001 Base: 100 Fuente: Excel Grafica 2. Bandas de Bollinger, IGBC Agosto 2001 – Marzo 2007. Base 100     Grafica 3. Bandas de Bollinger, IGVR Agosto 2001 – Marzo 2007. Base 100 El mercado de las acciones de la Bolsa de Valores de Colombia presenta eventualmente cambios relevantes, sin embargo los indicadores necesarios para su medición no presentan este mismo desarrollo; las posibles razones por las que no hay un proceso paralelo entre los índices actuales y el mercado de acciones, se debe principalmente por la deficiencias de cobertura, falta de ponderación y una estructura no adecuada para fines de análisis. Actualmente, la BVC utiliza un índice complejo ponderado el cual se fundamenta en una metodología de canasta fija de acciones con lo que obtiene un indicador que modela el precio de mismas, tiene la desventaja que la cantidad de elementos que utiliza no varí...