Análisis de Big Data con Apache Pig

¿Quién dice que los "cerdos" no pueden volar?

Del archivo de developerWorks

Ricardo Barranco Fragoso

Fecha de archivado: 06-04-2017 | Primera publicación: 25-09-2012

La necesidad de analizar grandes cantidades de datos ha tenido un crecimiento significativo en los últimos años. Una solución a este problema se resolvió mediante el uso del paradigma MapReduce ,cuya implementación open source es Apache Hadoop. Los programas de Hadoop están escritos en el API de Java, sin embargo, otros lenguajes utilizan un enfoque más abstracto con base en el paradigma MapReduce, como Pig o Jaql. Este artículo tiene como objetivo mostrar, mediante un ejemplo práctico, el uso de Pig para analizar grandes volúmenes de datos.

Este contenido no estará siendo actualizado. Puede acceder al articulo completo en versión PDF. Dado el rápido avance de la tecnología algunas imágenes o pasos pueden haber cambiado.



static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=90
Zone=Information mgmt
ArticleID=837413
ArticleTitle=Análisis de Big Data con Apache Pig
publish-date=09252012