Ir al contenido principal

Data Mining Parte I

Con el paso de cada segundo, la cantidad de información crece de forma exponencial, por ejemplo, durante el tiempo que usted ha leído este articulo, varias personas  han llamado a una central telefónica a registrar, actualizar y dejar nueva información sobre sus transacciones, todo esto se suma a la gran montaña de información que se esta acumulando desde hace años  la cual va cambiando segundo a segundo. Este crecimiento  de la data es tan solo comparable con la expansión acelerada del universo. Ante este panorama un poco desalentador para las empresas, se enfrentan al reto de poder almacenar de forma eficiente los datos, para luego poderlos administrar y tomar decisiones acertadas sobre el negocio. 

La parte de Hardware y Software empiezan a ser muy relevantes para tener un control efectivo de la data, tener uno o varios servidores lo suficientemente robusto con la capacidad de almacenaje, procesamiento y eficiencia se convierte en un pilar fundamental a la hora de manejar datos; esto debe ir acompañando de excelentes programas que permita extraer, clasificar, modelar la información realmente importante, que permita hacer la diferencia entre un antes y un después  con poca información, esto nos lleva al concepto de  data niminig  lo cual se asemeja a la extracción de oro, que para obtener un gramo del importante metal se debe extraer varias toneladas. para tener buenos resultados se recomienda seguir los siguientes pasos, los cuales no pretenden ser una receta pero si ser una guía.

  1. Disponibilidad y accesibilidad de la información.
  2. Identificar la cantidad de datos basura que tenemos los cuales pueden estar sesgando nuestra información.
  3. Cantidad suficiente de datos  correctos que permitan un  análisis de estos.
  4. Se debe contar con expertos familarizados con los datos de tal manera que ellos nos permitan traducir y conocer la funcionalidad de muchas variables.
En el siguiente articulo les estaré escribiendo mas sobre Data Mining .

Comentarios

Entradas populares de este blog

Items importantes para la construcción de Dashboard.

  A través de la elaboración de diversos reportes y del análisis de múltiples artículos que ofrecen recomendaciones sobre su construcción, he identificado una serie de pasos esenciales, los cuales se asemejan a los ingredientes de una receta para el éxito en la creación de dashboards. Definición de Roles Dependiendo del tamaño de la organización, algunos usuarios pueden cumplir más de un rol. En una organización más pequeña, una persona podría ser responsable de crear contenido y administrar el sistema. En organizaciones más grandes, puede haber departamentos enteros para cada Rol Para la elaboración de reportes efectivos, es fundamental iniciar con la definición de roles, asignando responsabilidades claras a cada miembro del equipo. Se recomienda la estandarización de colores y formatos, garantizando una apariencia uniforme en todos los gráficos y visualizaciones. Antes de comenzar, es crucial definir qué información se desea conocer y confirmar que se cuenta con los datos correct...

Un Gráfico de pastel para elecciones presidenciales 2010 en Colombia que no suma el 100%.

No se si este sumando mal pero a este grafico de pastel no le da el 100%; al parecer le falta un 8.4%. Y al parecer el 23.3% de Sanin ocupa más espacio en la torta que los demás candidatos. fuente: http://www.laopinion.com.co/noticias/index.php?option=com_content&task=view&id=347881&Itemid=31

LAS 8 ETAPAS PARA REALIZAR UNA INVESTIGACIÓN ESTADÍSTICA

Muchos profesionales de diferentes áreas se preguntan cuales son las etapas necesarias para implementar un apropiado estudio estadístico. El siguiente documento no pretende ser una guía estricta de los pasos necesarios para hacer un estudio, si no por el contrario es una guía sencilla y simple a la hora de hacer una investigación. 1. Definir la Problemática. Acá de define el porque es necesario realizar el análisis, lo cual es acompañado con la contextualización de los objetivos lo cual debe estar acompañado de cuales son las hipótesis que desean comprobar o rechazar paralelamente se podría plantear la estimación de los parámetros que se quiere llegar. Todo esto debe estar acompañado de un plan de presupuestos y el tiempo estimado para el cual se va a finalizar el estudio estadístico. 2. Limitación de la Población. En este paso se pretende dejar claro cual es la población objeto de estudio, sus limites y alcances, cabe anotar que es muy importante analizar la representabilidad d...