Datacleansing

BI y Data quality Open source con Pentaho y DataCleaner

Ver vídeo

Cómo se utiliza DataCleaner con Pentaho Data Integrator para integrar funcionalidades de calidad de datos en procesos de ETL

Google Refine 2.0 - Enriquecimiento de datos

Ver vídeo

En este tercer video sobre Google refine se muestra cómo utilizar esta herramienta para enriquecer nuestros datos. Vemos cómo crear enlaces que llamen a servicios web para obtener automáticamente coordenadas geográficas con Google Geocoding API a partir de campos de dirección, o traducciones a diferentes idiomas con la API de Google Translate.

Google Refine 2.0 - Transformacion de datos

Ver vídeo

En este segundo video de Google Refine se muestra la manera en que realiza la parte de Transformación de datos, separando datos de una columna en diferentes columnas, transformando datos con reglas, reutilizando estas reglas para diferentes juegos de datos, etc.

Introduccion a Google Refine 2.0

Ver vídeo

Introducción al funcionamiento de Google Refine, el software de limpieza de datos que Google ofrece como herramienta Open Source, que se puede descargar desde aqui.

En este primer video se muestra cómo comenzar a analizar la calidad de los datos, identificar problemas, inconsistencias de valores o de texto, outliers, diferentes nomenclaturas para identificar lo mismo..

Distribuir contenido