Ir al contenido principal

Entradas

Mostrando las entradas etiquetadas como SPSS

Modelando en la minería de datos: Arboles de decisión

Antes de entrar al tema de arboles de decisión, se tratará de explicar el termino de modelo. Un modelo es la abstracción de una  realidad palpable,  representada por medio de algoritmos matemáticos y apoyada por potentes software informáticos, lo cual se ha convertido en una imperiosa necesidad para los diferentes sectores de análisis del mundo. El modelo estadístico pretende cumplir esto, por medio de una simple igualdad matemática, que en la mayoría de casos esta compuesta por una relación en donde interviene un error. A lo largo de la historia se han podido clasificar en tres grupos los modelos estadísticos. Modelos asociativos: Estos modelos pretenden identificar un orden de acontecimientos, que permitan describir a tiempo una cadena de sucesos, por ejemplo: ¿que serie de sucesos pasa para que un suscriptor cancele un servicio televisivo?. Primero llama, luego va personalmente a quejarse,  después manda una carta,... (¿?)...., por ultimo cancela. Es...

Minería de Datos: Correlación de variables cuantitativas

En el próximo vídeo vamos a ver asociación de variables numéricas (Cuantitativas) en donde se aplicara el coeficiente de correlación de  Pearson, ANOVA y mapas de calor. El Coeficiente de Correlación  consiste en medir la fuerza de asociación lineal entre una variables c uantitativas ,  La asociación puede variar  entre entre -1 y 1, cuando el valor es negativa la relación es inversa por ejemplo, cuando el consumo del agua potable aumenta los casos de cólera disminuyen. el otro tipo de relación es cuando el coeficiente es cercano a uno,  por ejemplo cuando el precio del petroleo aumenta los precios de la gasolina también  lo hacen,  en cambio cuando  una asociación es cercana a 0 esto quiere decir que no tiene relación lineal.  

Inteligencia Predictiva!!, con la Minería de datos: Relacionando de Forma gráfica las categorías de las variables

Utilizando un Análisis de Malla, logramos asociar  características de una población de datos. En el siguiente vídeo se muestran de una forma sencilla y gráfica como se relacionan simultáneamente varias categorías de una población.

Procesamiento de la información en un proyecto de mineria de datos.

Simultáneamente cuando se esta identificando los datos anómalos, nos podemos dar cuenta que se necesita estructurar la base de datos, para que su lectura sea mucho mas eficiente, por ejemplo necesitaríamos segmentar aquellas registros atípicos ya identificados, clasificar las variables que cuentan unas características especiales, crear nuevos campos o registros, o cambiar el tipo de la variable y hacer transformaciones para que la información sea coherente. En este documento vamos a identificar los diferentes procedimientos que se pueden hacer para mejorar nuestra base de datos: Cambio de nombre en los campos:  Esta funcionalidad consiste en renombrar una variable o varios campos. El origen de hacer estas modificaciones es muy amplia, algunas de las causas son: que algunos programas de captura, solo soportan  8 caracteres, o que no existe espacio entre palabras del titulo, o que estén escritos de los encabezados estén en otro idioma.  También puede pasar que se es...

Que hacer cuando se tiene valores anómalos

Ya identificados los valores anómalos, existen diferentes métodos que permiten dar un tratamiento a la base de datos, en el siguiente vídeo se muestra la primera opción que es eliminar fácilmente  los registros que presenten datos atípicos o nulos.

Identificación de Valores atípicos, perdidos o nulos

Para cumplir los objetivos de un proyecto es muy importante tener definido los objetivos del estudio, los cuales deben estar alineados con la consecución de la información, cobrando relevancia la calidad  y el acceso de la data. En muchas ocasiones las mismas características que rodea a las bases de datos hacen que se pierdan y se cometan errores en los registros, desembocando en tener que identificar estas fallas, para ser  corregidas oportunamente, al tener una buena calidad de información vamos a tener una mayor precisión en el calculo de mis estadísticos, que a su vez va a dar como resultado un modelo mas útil al cumplimiento de los objetivos trazados inicialmente en el estudio.    No debemos sorprendernos al encontrar valores nulos, por ejemplo si medimos la variable salario en algunos campos probablemente vamos a identificar campos sin datos, lo importante es identificarlos, conocerlos y ver si existe alguna secuencia reiterativa de perdida de inf...

Introducción al SPSS Modeler. 3 Importación de Archivos

Les comparto otro vídeo sobre el manejo de SPSS MODELER, en donde se puede apreciar la forma en la cual se importa diferentes archivos tipo .XLS, TXT, y SAV.

Interacción de Iconos en Modeler SPSS

Les dejo otro archivo introductorio donde se puede ver como se realiza la manipulación de los iconos en el lienzo de SPSS MODELER.

Un video de ambientación del SPSS Modeler

Les comparto un vídeo en donde se muestra la interfaz de usuario del programa de minería de datos Modeler. en donde se muestra y se explica los menús las diferentes pestañas que la componen.

MIDIENDO SATISFACCIÓN Y RESOLUCIÓN SE DIVIDE Y SE GANA

Para  entender muchas cosas o solucionar problemas a veces debemos de segmentar, tal como lo hace el calculo diferencial cuando se tiene integrales de difícil solución, en estos casos se acude a la derivación por partes, esto mismo se realiza cuando hacemos análisis exploratorios o descriptivos con datos de difícil comprensión lo cual en ultimas nos dará gratas recompensas. Por eso quiero aprovechar para mostrarles un caso muy particular que me trate; donde queríamos medir la satisfacción del cliente y la solución que se le da a este, después de una capacitación a  los médicos que atienden a los usuarios.  Para lo cual implemente la técnica de análisis de correspondencias simples donde nos suministra un mapa de ubicación de los individuos de una ciudad dependiendo de las características de las variables. En el primer cuadro de la izquierda se segmento por quienes hicieron la capacitación y quienes no la realizaron, a primera vista NO SE VEN DIFERENCIAS, pero al ...

UN BUEN R-CUADRADO PERO...

Buenos días mis lectores de diferentes partes del mundo, quiero compartirles un caso real, de un buen R-cuadrado pero... algo pasa. Este articulo va dirigido a muchas personas, empresas que solo ven el R-cuadrado y si este es mayor a 0.60 consideran que el modelo es bueno y por ende apropiado para modelar la realidad del fenómeno. También quiero enfatizar que en mucha literatura acepta la validez del modelo tan solo evaluando el coeficiente de determinación; Algo que no es del todo cierto ya que un modelo estadístico, por mas sencillo que sea, debe de cumplir una serie de normas o supuestos. Aquí evaluaremos levemente el no cumplimiento de unos supuestos con sus respectivas implicaciones. Vamos a hacerlo de la manera mas sencilla posible tomando dos variables reales. Entonces se evaluaran dos variables X que es la cantidad de viviendas en un barrio, y Y que es la cantidad de predios conectados al gas natural domiciliario, en la ciudad de Cali Colombia. El primer paso es cuantificar el ...

LA ESTADÍSTICA Y EL TERRORISMO

Quiero compartirles esta noticia que hace poco SPSS empresa perteneciente ha la IBM dio un reconocimiento al banco más importante de Colombia, Bancolombia por darle un buen uso ha las herramientas estadísticas que conducían ha detectar con mayor precisión el financiamiento al terrorismo, el lavado de activos y otras formas ilegales de transacción. Una parte del articulo dice: " La Dirección de Cumplimiento recibe esta distinción por el uso de herramientas que permiten detectar clientes con operaciones inusuales" Ver el articulo en http://www.grupobancolombia.com/home/saladeprensa/noticias/2009/2009-premioDireccionCumplimiento.asp Como pueden observar ahora la estadística se esta convirtiendo en la principal aliado que tiene el gobierno y las entidades privadas para combatir y prevenir el terrorismo.