Ir al contenido principal

Entradas

Importación de un archivo csv utilizando SAS Vs R Vs Python

E n el siguiente articulo, se realizara una comparación entre tres software, en cuanto a la velocidad, cantidad de caracteres del código, lógica y entendimiento de los lenguajes. Acá los resultados: El Archivo Se trata de un documento .CSV, llamado CaseStudy1. Y son datos de empleados de una compañía, la tabla contiene 8 variables y 424 registros. Figura 1: Tabla CaseStudy1 Importación SAS: Para importar el archivo usando SAS, es necesario clarificar que se esta trabajando desde un servidor llamado  On Demand For Academic, la cual es una interfaz de mi PC hacia SAS que se conecta vía web a un servidor a estados unidos. Abrir la version web de SAS que es el SAS Studio. Introducir el usuario y contraseña.  Figura 2: Credenciales Le damos clic en la area del SAS Studio, la cual nos va a llevar a version web de SAS. Como no es posible leer los archivos directamente desde mi equipo es necesario realizar un puente para poder importar los datos, para lo cual es
Entradas recientes

10 Buenas Practicas para sus Representar Datos en un Dashboard

10 Buenas Practicas para sus Representar Datos en un Dashboard En muchas ocasiones representar los datos se ha convertido en un dolor de cabeza y esto sucede muchas veces porque se pierde el objetivo o de tergiversa las ideas que queremos representar, por eso en este articulo les presentare algunos "tips" para que sus informes sean los mejores. 1. Defina el Objetivo principal del reporte. 2. Defina que preguntas debe resolver el reporte a primera vista. 3. En muchas ocasiones lo mas simple es mejor. 4. Determine su objetivo principal usando uno KPI o varios Indicadores. 5. Sea sagaz al representar sus datos, la lectura siempre va de izquierda a derecha y de arriba hacia abajo, procure seguir este orden para ubicar sus principales indicadores o gráficas.  6. Imagine que esta escribiendo un articulo de un periódico (titulo, subtitulo y desarrollo), por ende la estructura de la representación de datos debe ir de lo general a lo par

Fácil y desde cero, Minería de datos. Aplicaciones casos reales. (Arboles)

Un banco quiere tener un modelo estadístico, en el cual permita medir el riesgo de realizar un préstamo hipotecario (pagos e impagos de la deuda), para poder cuantificar este riesgo se va a tener en cuenta una serie de variables que según el científico de datos puede llegar a ser relevantes.Para esto se selecciona una muestra representativa de la población de usuarios del banco. Los datos describen el comportamiento de cada cliente al corte de un periodo dado, de tal manera que se tendrá dentro de la muestra personas que están al día  o en mora con su crédito hipotecario. A continuación se realizará una descripción de las variables que quizás puedan influenciar en el resultado del modelo. En resumen, son variables que indican numero de obligaciones, en diferentes cortes de tiempo, cantidad de consultas a la centrales de riesgo, porcentajes de deudas, saldos de deudas, tiempos trascurridos desde el ultimo pago etc ... Siguiendo la metodología de minería de datos lo prime

Aplicando Data Miner haciendo uso de un Análisis de Canasta en el Retail

Vamos a usar un análisis de canasta, como una una poderosa técnica de la minería de datos aplicada a un Supermercado para así mirar las posibles asociaciones, en la compra en los productos del área de salud y belleza frente a los productos de la papelería. Para lo cual vamos a usar SAS Enterprise Miner. Los metadatos son importados desde las librerías propias del programa, estos datos se denominarán como de rol transaccional. Cuando se le da un rol de tipo transaccional, se le dice al programa que los datos los lea, debe ser en un orden especifico y con un tipo de agrupación que para nuestro la variable Cluster va a ser el ID.  Para lo cual es necesario como mínimo que la configuración del nodo de asociación tenga los siguientes parámetros: Finalmente  el diagrama  importa la data y se conecta el modelo a asociación tal como se muestra en la siguiente gráfica: El nodo de asociación permite realizar diferentes cambios en cuanto a la configuración