Data cleaning con Open Refine

Debemos asumir que vivimos en un mundo imperfecto donde aquellas cosas que no controlamos difieran de lo ideal para nosotros. En ese sentido, todo analista de datos debe desconfiar de sus fuentes y, antes de proceder al análisis de datos, examinarlos y depurarlos. A este proceso se le llama Data Cleaning o Limpieza de Datos.

Un proceso de Data Cleaning identifica datos incompletos, incorrectos o no pertinentes y los substituye o elimina para que sean compatibles con otros conjuntos de datos de nuestro sistema.

Seguir leyendo “Data cleaning con Open Refine”

¿Cuándo y con quién España va bien?

En este post veremos cómo realizar un proyecto de Open Data utilizando herramientas de Business Intelligent para su visualización. Para llevar a cabo este proyecto debemos pasar por 5 fases:

  1. Definir nuestra hipótesis y escoger unos indicadores que la validarán.
  2. Buscar y obtener datos.
  3. Preparar los datos para su análisis.
  4. Diseñar la visualización.
  5. Sacar conclusiones.

Seguir leyendo “¿Cuándo y con quién España va bien?”

Introducción a Open Data

En este post haremos una aproximación teórica al mundo de los datos abiertos o “Open Data”. A continuación veremos en qué consiste, sus objetivos, cómo deben ser los datos, los obstáculos que afronta esta filosofía y, por último, veremos algunos ejemplos de utilización de datos abiertos.

¿Qué es Open Data?

Es una filosofía y práctica que persigue la obertura de datos públicos en formatos digitales estándares y abiertos para que puedan ser reutilizados de forma automática. Estos datos pueden ser utilizados gratuitamente por cualquiera, cuándo y cómo quiera, con la única condición que se reconozca el autor de la fuente. Seguir leyendo “Introducción a Open Data”

Herramientas de Business Intelligence de Microsoft (III)

Con este post llegamos al final de la serie de entradas relativas a las herramientas de Business Intelligence de Microsoft. Hemos reservado para el final la que, en mi humilde opinión, es la joya de la corona de todas ellas. Me refiero a Power BI. Seguidamente explicaremos en qué consiste, cómo podemos utilizarla y porqué considero que es una herramienta de BI muy interesante.

¿Qué es Power BI?

Power BI es un conjunto de aplicaciones de análisis de negocio que permite analizar datos y compartir información. Está formado por 3 componentes: Seguir leyendo “Herramientas de Business Intelligence de Microsoft (III)”

Herramientas de Business Intelligence de Microsoft (II)

Continuando con la serie de entradas relativas a las herramientas de Business Intelligence de Microsoft, en este post hablaremos de 2 componentes para Excel que nos posibilitan visualizar nuestros datos de una forma novedosa. Estos componentes son Power View y Power Map.

Power View

Power View utiliza los datos almacenados en un Excel o Power Pivot para dar vida a informes interactivos. Esta herramienta nos permite de una forma intuitiva explorar, visualizar y presentar nuestros datos mediante informes ad hoc. Seguir leyendo “Herramientas de Business Intelligence de Microsoft (II)”

Segmentación de datos y KPIs de Power Pivot

Siguiendo con la línea del post anterior, hoy veremos dos herramientas de visualización del programa Excel. Éstas son la segmentación de datos y el uso de KPIs a partir del componente Power Pivot. Ambas se podrían considerar como herramientas de business intelligence puesto que tienen la utilidad de mostrarnos información almacenada en un conjunto de datos de manera visual e interactiva.

En esta entrada explicaremos qué son, para qué nos pueden servir y cómo las podemos utilizar. Como en la entrada de la semana pasada nos apoyaremos en ejemplos prácticos para ilustrar nuestra explicación. Para ello utilizaremos un conjunto de datos de ejemplo almacenado en el fichero “chicago_narcotics” (Haga clic en el enlace para bajarse el fichero de ejemplo). Seguir leyendo “Segmentación de datos y KPIs de Power Pivot”

Minigráficos y Heatmap como herramientas de visualización

En este post nos desviaremos ligeramente del anterior para profundizar en dos herramientas de visualización de datos de Excel que considero bastante interesantes. Estas son los minigráficos y los Heatmaps.

Para ayudarnos con la explicación nos apoyaremos en un archivo de Excel “chicago_narcotics” proporcionado por Microsoft y que contiene un conjuntos de datos de demostración. (Haga clic en el enlace para bajarse el fichero de ejemplo) Seguir leyendo “Minigráficos y Heatmap como herramientas de visualización”