Data cleaning con Open Refine

Debemos asumir que vivimos en un mundo imperfecto donde aquellas cosas que no controlamos difieran de lo ideal para nosotros. En ese sentido, todo analista de datos debe desconfiar de sus fuentes y, antes de proceder al análisis de datos, examinarlos y depurarlos. A este proceso se le llama Data Cleaning o Limpieza de Datos.

Un proceso de Data Cleaning identifica datos incompletos, incorrectos o no pertinentes y los substituye o elimina para que sean compatibles con otros conjuntos de datos de nuestro sistema.

Seguir leyendo “Data cleaning con Open Refine”

Herramientas de Business Intelligence de Microsoft (III)

Con este post llegamos al final de la serie de entradas relativas a las herramientas de Business Intelligence de Microsoft. Hemos reservado para el final la que, en mi humilde opinión, es la joya de la corona de todas ellas. Me refiero a Power BI. Seguidamente explicaremos en qué consiste, cómo podemos utilizarla y porqué considero que es una herramienta de BI muy interesante.

¿Qué es Power BI?

Power BI es un conjunto de aplicaciones de análisis de negocio que permite analizar datos y compartir información. Está formado por 3 componentes: Seguir leyendo “Herramientas de Business Intelligence de Microsoft (III)”

Herramientas de Business Intelligence de Microsoft (II)

Continuando con la serie de entradas relativas a las herramientas de Business Intelligence de Microsoft, en este post hablaremos de 2 componentes para Excel que nos posibilitan visualizar nuestros datos de una forma novedosa. Estos componentes son Power View y Power Map.

Power View

Power View utiliza los datos almacenados en un Excel o Power Pivot para dar vida a informes interactivos. Esta herramienta nos permite de una forma intuitiva explorar, visualizar y presentar nuestros datos mediante informes ad hoc. Seguir leyendo “Herramientas de Business Intelligence de Microsoft (II)”

Segmentación de datos y KPIs de Power Pivot

Siguiendo con la línea del post anterior, hoy veremos dos herramientas de visualización del programa Excel. Éstas son la segmentación de datos y el uso de KPIs a partir del componente Power Pivot. Ambas se podrían considerar como herramientas de business intelligence puesto que tienen la utilidad de mostrarnos información almacenada en un conjunto de datos de manera visual e interactiva.

En esta entrada explicaremos qué son, para qué nos pueden servir y cómo las podemos utilizar. Como en la entrada de la semana pasada nos apoyaremos en ejemplos prácticos para ilustrar nuestra explicación. Para ello utilizaremos un conjunto de datos de ejemplo almacenado en el fichero “chicago_narcotics” (Haga clic en el enlace para bajarse el fichero de ejemplo). Seguir leyendo “Segmentación de datos y KPIs de Power Pivot”

Minigráficos y Heatmap como herramientas de visualización

En este post nos desviaremos ligeramente del anterior para profundizar en dos herramientas de visualización de datos de Excel que considero bastante interesantes. Estas son los minigráficos y los Heatmaps.

Para ayudarnos con la explicación nos apoyaremos en un archivo de Excel “chicago_narcotics” proporcionado por Microsoft y que contiene un conjuntos de datos de demostración. (Haga clic en el enlace para bajarse el fichero de ejemplo) Seguir leyendo “Minigráficos y Heatmap como herramientas de visualización”

Componentes de un sistema de Business Intelligence

Un sistema de Business Intelligence está compuesto por una serie de componentes que se relacionan entre sí y que tienen cada uno su función específica. En este post se hará una pequeña descripción de cada uno de estos componentes básicos.

Fuentes de datos

De las fuentes de datos es de dónde mana el rio de información. Es por ello que es clave que haya “calidad de datos”, es decir, que los datos sirvan para el uso que se quiere realizar.

Las fuentes de datos pueden ser de dos tipos dependiendo del origen:

  1. De origen interno de la organización. Dentro de esta clasificación encontramos diferentes tipos de fuentes:
  2. De origen externo a la organización: por ejemplo datos de Redes Sociales o de Fuentes de Datos Abiertos Gubernamentales (Opendata).

Una vez identificadas todas las fuentes de datos donde extraeremos aquella información que nos interesa, empezaría el proceso de ETL. Seguir leyendo “Componentes de un sistema de Business Intelligence”

Explicación sencilla de un sistema de Business Intelligente

La palabra “Business Intelligence” suena muy bien, como cualquier anglicismo, pero es un concepto que no es para nada nuevo. Básicamente consiste en la obtención, transformación e interpretación de los datos que se generan en la actividad diaria de una empresa para obtener mediante este proceso información relevante para la toma de decisiones operativas y/o estratégicas.

Hoy en día existen multitud de compañías tecnológicas (Oracle, SAP, Microsoft) que ofrecen productos de BI, todos ellos muy válidos y completos. No obstante, cualquier empresario que sienta la necesidad de dotarse de un sistema de BI puede, con unos conocimientos mínimos de ofimática, crearse uno por su cuenta.

En este post se tratarán los siguientes puntos:

  • Objetivos que un sistema de BI debería tener
  • Tipos de usuarios a los que debería estar orientado
  • Pequeño esquema con los componentes básicos de todo sistema de BI

Seguir leyendo “Explicación sencilla de un sistema de Business Intelligente”