Ir al contenido principal

Importación de un archivo csv utilizando SAS Vs R Vs Python

En el siguiente articulo, se realizara una comparación entre tres software, en cuanto a la velocidad, cantidad de caracteres del código, lógica y entendimiento de los lenguajes.

Acá los resultados:



El Archivo
Se trata de un documento .CSV, llamado CaseStudy1. Y son datos de empleados de una compañía, la tabla contiene 8 variables y 424 registros.

Figura 1: Tabla CaseStudy1

Importación SAS:

Para importar el archivo usando SAS, es necesario clarificar que se esta trabajando desde un servidor llamado On Demand For Academic, la cual es una interfaz de mi PC hacia SAS que se conecta vía web a un servidor a estados unidos.

  • Abrir la version web de SAS que es el SAS Studio.
  • Introducir el usuario y contraseña. 
Figura 2: Credenciales
  • Le damos clic en la area del SAS Studio, la cual nos va a llevar a version web de SAS.
  • Como no es posible leer los archivos directamente desde mi equipo es necesario realizar un puente para poder importar los datos, para lo cual es necesario traer la tabla csv a la meta data de SAS.
  • Creamos la carpeta en la siguiente ruta : odaws02-prod-us > Archivos (Inicio) > sobre esa dirección damos clic derecho Nuevo >Carpeta
  •                                      
  •                                                         Figura 2: Creación de Carpeta
  • Con la nueva carpeta seleccionada, se procede a cargar los archivos , esto nos permite elegir cualquier tipo de archivos de nuestro equipo y subirlos a la metadata de SAS.
Figura 3: Elección de  archivos

Ya habiendo cargado los datos .csv en la metadata, se procede a crear el codigo para importar los datos.

Vamos a hacer uso de la sentencia Proc import:


Las lineas nos dice: 
Proc Import : Procedimiento de Importar.
Datafile: Ruta del archivo.
dbms: Tipo del archivo.
out: donde lo vamos a guardar.
run: ejecución.  

Pyton:
La programación también es muy fácil y se hace de la siguiente manera haciendo uso del editor de texto 
Import: Las lineas nos dice nos crea una libreria llamada pd, de donde se van a importar un archivo.
pru: Lee un archivo, el cual tiene un encabezado.
Print: Imprime el archivo

R:
La programación en R me parece que es similar a las dos anteriores, para lo cual voy a usar el R Studio.


La explicación consiste, en la creación de un archivo llamado pru, la cual lee una ruta, se especifica la existencia de un encabezado y un separador.

Comentarios

Entradas populares de este blog

Un Gráfico de pastel para elecciones presidenciales 2010 en Colombia que no suma el 100%.

No se si este sumando mal pero a este grafico de pastel no le da el 100%; al parecer le falta un 8.4%. Y al parecer el 23.3% de Sanin ocupa más espacio en la torta que los demás candidatos. fuente: http://www.laopinion.com.co/noticias/index.php?option=com_content&task=view&id=347881&Itemid=31

Análisis de Canasta

El Análisis de canasta es un una metodología  muy utilizada de minería de datos que permite describir asociaciones  entre diferentes items.  Este método permite que fácilmente que  por ejemplo que identifiquemos las asociaciones propias en un lanzamiento de un nuevo producto, y conocer cual producto juega como  rol  apalancador y cual de soporte, de tal manera que permita de una mejor forma describir la causalidad entre productos a analizar.  Para entender un poco mas este concepto vamos a poner el siguiente ejemplo: En un día tenemos 5 transacciones en donde por cada compra una tenemos 3 productos: De donde se pueden desprender unas relaciones entre productos a los cuales se les puede llamar reglas y unas probabilidades llamadas soporte y confianza. Soporte : Se puede interpretar como la probabilidad de que se "vendan conjuntamente" los productos sobre el total de transacciones. De tal manera que si:  A >>D el cual tiene un soporte de 2/5 , (Veces