Diseño de procesos ETL con mapas mentales

En este post quiero compartir un método que llevo usando desde hace un cierto tiempo para representar procesos ETL de una forma muy gráfica. Este método consiste básicamente en representar todos los elementos y pasos que componen un ETL mediante un mapa mental. Para crear estos mapas mentales utilizo un programa gratuito en nube llamado MindMup 2.0. Seguir leyendo “Diseño de procesos ETL con mapas mentales”

Data cleaning con Open Refine

Debemos asumir que vivimos en un mundo imperfecto donde aquellas cosas que no controlamos difieran de lo ideal para nosotros. En ese sentido, todo analista de datos debe desconfiar de sus fuentes y, antes de proceder al análisis de datos, examinarlos y depurarlos. A este proceso se le llama Data Cleaning o Limpieza de Datos.

Un proceso de Data Cleaning identifica datos incompletos, incorrectos o no pertinentes y los substituye o elimina para que sean compatibles con otros conjuntos de datos de nuestro sistema.

Seguir leyendo “Data cleaning con Open Refine”

Herramientas de Business Intelligence de Microsoft (I)

Con en este post inicio una serie de entradas en la que procuraré hacer una aproximación bastante resumida a las 5 herramientas de Bussines Intelligence que Microsoft ha sacado al mercado en estos últimos años.

4 de ellas son de pago (Power Pivot, Power View, Power Query y Power Map) y la otra, Power BI, es gratuita (salvo en su versión premium).

Desde que sacaron la versión de Office 2010, pero especialmente desde la versión de 2013, los chicos de Microsoft han apostado fuertemente por hacer accesibles herramientas de BI a un público generalista que suele utilizar Excel. Ya que, es de sobras conocido que en la gran mayoría de empresas se utiliza el Excel como herramienta de ofimática por excelencia. Seguir leyendo “Herramientas de Business Intelligence de Microsoft (I)”

Componentes de un sistema de Business Intelligence

Un sistema de Business Intelligence está compuesto por una serie de componentes que se relacionan entre sí y que tienen cada uno su función específica. En este post se hará una pequeña descripción de cada uno de estos componentes básicos.

Fuentes de datos

De las fuentes de datos es de dónde mana el rio de información. Es por ello que es clave que haya “calidad de datos”, es decir, que los datos sirvan para el uso que se quiere realizar.

Las fuentes de datos pueden ser de dos tipos dependiendo del origen:

  1. De origen interno de la organización. Dentro de esta clasificación encontramos diferentes tipos de fuentes:
  2. De origen externo a la organización: por ejemplo datos de Redes Sociales o de Fuentes de Datos Abiertos Gubernamentales (Opendata).

Una vez identificadas todas las fuentes de datos donde extraeremos aquella información que nos interesa, empezaría el proceso de ETL. Seguir leyendo “Componentes de un sistema de Business Intelligence”

Explicación sencilla de un sistema de Business Intelligente

La palabra “Business Intelligence” suena muy bien, como cualquier anglicismo, pero es un concepto que no es para nada nuevo. Básicamente consiste en la obtención, transformación e interpretación de los datos que se generan en la actividad diaria de una empresa para obtener mediante este proceso información relevante para la toma de decisiones operativas y/o estratégicas.

Hoy en día existen multitud de compañías tecnológicas (Oracle, SAP, Microsoft) que ofrecen productos de BI, todos ellos muy válidos y completos. No obstante, cualquier empresario que sienta la necesidad de dotarse de un sistema de BI puede, con unos conocimientos mínimos de ofimática, crearse uno por su cuenta.

En este post se tratarán los siguientes puntos:

  • Objetivos que un sistema de BI debería tener
  • Tipos de usuarios a los que debería estar orientado
  • Pequeño esquema con los componentes básicos de todo sistema de BI

Seguir leyendo “Explicación sencilla de un sistema de Business Intelligente”