Economías de Sudamérica: Proyecto de BI en Tableau

En esta entrada veremos un proyecto de Business Intelligence presentado recientemente en un bootcamp de Data Analytics que estoy cursando actualmente en Ironhack BCN. Para la elaboración de este proyecto, Sergio Irazusta (compañero del curso) y yo hemos utilizado:

  • Herramientas de ETL en lenguaje de programación de Python (Jupyter Notebook) y de bases de datos relacionales (Excel y Postgresql)
  • Tableau para la visualización interactiva de la información.
Seguir leyendo «Economías de Sudamérica: Proyecto de BI en Tableau»

Data cleaning con Open Refine

Debemos asumir que vivimos en un mundo imperfecto donde aquellas cosas que no controlamos difieran de lo ideal para nosotros. En ese sentido, todo analista de datos debe desconfiar de sus fuentes y, antes de proceder al análisis de datos, examinarlos y depurarlos. A este proceso se le llama Data Cleaning o Limpieza de Datos.

Un proceso de Data Cleaning identifica datos incompletos, incorrectos o no pertinentes y los substituye o elimina para que sean compatibles con otros conjuntos de datos de nuestro sistema.

Seguir leyendo «Data cleaning con Open Refine»

¿Cuándo y con quién España va bien?

En este post veremos cómo realizar un proyecto de Open Data utilizando herramientas de Business Intelligent para su visualización. Para llevar a cabo este proyecto debemos pasar por 5 fases:

  1. Definir nuestra hipótesis y escoger unos indicadores que la validarán.
  2. Buscar y obtener datos.
  3. Preparar los datos para su análisis.
  4. Diseñar la visualización.
  5. Sacar conclusiones.

Seguir leyendo «¿Cuándo y con quién España va bien?»

Introducción a Open Data

En este post haremos una aproximación teórica al mundo de los datos abiertos o “Open Data”. A continuación veremos en qué consiste, sus objetivos, cómo deben ser los datos, los obstáculos que afronta esta filosofía y, por último, veremos algunos ejemplos de utilización de datos abiertos.

¿Qué es Open Data?

Es una filosofía y práctica que persigue la obertura de datos públicos en formatos digitales estándares y abiertos para que puedan ser reutilizados de forma automática. Estos datos pueden ser utilizados gratuitamente por cualquiera, cuándo y cómo quiera, con la única condición que se reconozca el autor de la fuente. Seguir leyendo «Introducción a Open Data»