En esta entrada veremos un proyecto de Business Intelligence presentado recientemente en un bootcamp de Data Analytics que estoy cursando actualmente en Ironhack BCN. Para la elaboración de este proyecto, Sergio Irazusta (compañero del curso) y yo hemos utilizado:
- Herramientas de ETL en lenguaje de programación de Python (Jupyter Notebook) y de bases de datos relacionales (Excel y Postgresql)
- Tableau para la visualización interactiva de la información.
Contexto histórico
La historia reciente de Sudamérica es una historia de grandes esperanzas de libertad y progreso truncadas por crisis económicas y políticas. A nivel económico y en términos generales desde 1980 y hasta final de siglo XX las ideas neoliberales gozaron de gran éxito entre los gobiernos sudamericanos. Estas políticas económicas pretendían hacer las economías más competitivas y menos dependientes de la intervención estatal. Sin embargo, las privatizaciones de grandes empresas públicas y la desregularización de los mercados provocaron en muchas ocasiones escandalosos casos de corrupción, crisis bancarias y aumento de las desigualdades. Con la llegada del nuevo siglo movimientos populares hacen saltar por los aires los gobiernos neoliberales sustituyéndolos por otros de ideología opuesta y que, en muchos casos, se autodenominan socialistas del siglo XXI. La crisis de Venezuela de 2013 vuelve a poner en alza las ideas neoliberales entre la población de subcontinente y los gobernantes neoliberales vuelven a dominar poco a poco el terreno de juego político.
Objetivos del proyecto
El objetivo de este proyecto es el descubrir si la ideología económica de los gobernantes de un país influye determinantemente en la evolución de la economía de este país a lo largo de los años.
Para responder a la pregunta anterior queremos mostrar y comparar cómo ha evolucionado la economía de 5 países sudamericanos a lo largo de las 4 últimas décadas (1980-2020). ¿Cómo mostraremos y compararemos la evolución de las economías? A través de 5 indicadores macroeconómicos y, a partir de su evolución, elaboraremos un ranking para cada década donde clasificaremos cada país en función del progreso económico alcanzado.
Indicadores y países seleccionados
Por un lado los indicadores que han sido seleccionados para mostrar la evolución de cada economía son:
- Crecimiento porcentual del PIB (calculado a precios constantes)
- Índice de Desarrollo Humano (sólo hay datos a partir de 1990)
- Tasa de desempleo
- Deuda Externa sobre el PIB anual (a precios corrientes expresados en $)
- Índice de Precios al Consumidor
Por otro, los países que hemos seleccionado para nuestro análisis son: Argentina, Brasil, Chile, Paraguay y Venezuela.
Ideando nuestros dashboards
Antes de ponernos a trabajar en la extracción y transformación de los datos decidimos pararnos a pensar cómo debía de ser expuesta la información. Para ello no hay nada mejor que coger papel y lápiz y dibujar varios esbozos de dashboards hasta encontrar aquel que más nos satisfaga. Para nuestro proyecto decidimos exponer la información en 5 dashboards: uno para cada década y uno con la evolución acumulada. En cada uno de estos dashboards distribuimos las visualizaciones de la siguiente forma:
- A la izquierda: un mapa de Sudamérica que nos muestre los países coloreados por ideología del gobernante de turno y que al seleccionar cada país nos apareciese un resumen de la historia económica durante el periodo filtrado.
- A la derecha: gráficos de líneas que nos muestren la evolución de cada indicador a lo largo de los años.
- En la parte superior: los títulos e imágenes descriptivas y una tabla con un ranking de los países en función de la evolución global de sus indicadores.
Fase de recopilación de datos
Al no encontrar una única fuente de datos donde se agrupasen todos los datos necesarios tuvimos que crear nuestro dataset a partir de las siguientes fuentes:
- Wikipedia.org: famosa enciclopedia online donde obtuvimos información política e histórica. En concreto obtuvimos los gobernantes de cada país, las ideologías del partido político de cada gobernante y la historia económica de cada uno de los países.
- CEPALSTAT: página web de datos abiertos de CEPAL (comisión regional de las Naciones Unidades para América Latina y el Caribe). Aquí hemos obtenido datos para el PIB, Tasa de paro, Deuda Externa y IPC.
- World Bank: Esta institución mundial financiera dispone de una amplia base de datos económicos sobre la mayoría de país del mundo. Aquí hemos obtenido los datos que nos faltaba para el PIB.
- Programa de las Naciones Unidas para el Desarrollo: Agencia de las Naciones Unidas cuyo objetivo es la erradicación de la pobreza y la reducción de las desigualdades de los países. En su página web obtuvimos los datos del IDH desde 1990.
Fase de transformación de datos
Una vez descargados los datos de las fuentes hemos ido importando y transformando cada archivo en tablas. Estas tablas debían ser lo más homogéneas posibles para luego poder relacionarlas todas en una base de datos. Para ello hemos usado la plataforma Jupyter Notebook para programar los procesos ETL en Python usando las herramientas principales de la librería de Pandas. El resultado final son 14 tablas (o dataframes según la terminología de Pandas) independientes.
Fase de carga y relación de tablas
Uno de los objetivos colaterales a la creación de este proyecto ha sido el de aprender a usar PostgreSQL.
PostgreSQL es un sistema de gestión de datos relacional de código abierto y en la nube.
Gracias a la carga de nuestras 14 tablas en PostgreSQL disponemos de un almacenamiento en la nube que nos permitirá actualizar y cargar nuestros dashboards en cualquier dispositivo. Sin embargo, En el momento de relacionar nuestras tablas nos encontramos con la complejidad que suponía relacionarlas en este programa. Esto es así porque la única herramienta para este fin disponible es una barra de consulta de lenguaje SQL. Por este motivo, decidimos relacionar nuestras tablas directamente en Tableau.
Por último, creamos un nuevo proyecto de Tableau y nos conectamos a nuestra base de datos de PostgreSQL.
Los dashboards
Para llevar a la práctica nuestros esbozos iniciales hemos usado Tableau, un famoso programa de visualización de datos y storytelling.
Al igual que PowerBI, Tableau es una herramienta de business intelligence donde se pueden representar datos en visualizaciones interactivas y, con un poco de maña, se pueden llegar a desarrollar potentes historias visuales.
A continuación se muestran los dashboards resultantes de nuestro humilde proyecto de visualización y storytelling:





Conclusiones
Llegados a este punto podemos intentar responder la pregunta que nos planteamos al principio de este post: ¿La ideología económica de los gobernantes de un país influye determinantemente en la evolución de la economía de este país? Se observa que si bien los países que han tendido a tener gobiernos de ideología neoliberal han presentado mejores indicadores no podemos afirmar que sea determinante. Por ejemplo en Chile se fue alternando gobernantes liberales y socialdemócratas y no afectó a su evolución económica.
Un indicador con mayor relevancia podría ser la estabilidad social y política. Por ejemplo: Las sociedades chilena y paraguaya ha gozado de una mayor estabilidad si las comparamos con las argentinas y venezolanas.
Enlaces y agradecimientos
Si te interesa puedes acceder al código y los datos de este proyecto en el siguiente repositorio público de Github.
Por último me gustaría agradecer el esfuerzo y la dedicación de mi compañero de proyecto Sergio Irazusta. También debo agradecer la ayuda proporcionada por nuestros profesores Alberto y Paula, especialmente en aquello referente al uso de los programas PostgreSQL y Tableau.