Netezza Map/Reduce
La fonction map/reduce est un cadre logiciel qui vous permet d'implémenter des applications MapReduce et de les exécuter sur Netezza Performance Server Avec l'approche Netezza Performance Server, les données d'entrée sont stockées dans une table distribuée. Le résultat d'un travail est également stocké dans la base de données. Les tâches de mappage travaillent sur des parties indépendantes d'un tableau d'entrée, appelées tranches de données. Les résultats de la carte sont triés et redistribués aux tâches de réduction. Le cadre crée et exécute la requête SQL appropriée pour effectuer le flux de données map/reduce. Les colonnes de la base de données (champs d'enregistrement) sont mises en correspondance avec les concepts de clés et de valeurs du "modèle MapReduce.
- Exemple simple pour débuter - Décrit comment écrire et exécuter rapidement votre premier programme map/reduce.
- Interfaces utilisateur - Contient des informations de base sur l'API. Pour plus d'informations, consultez le manuel IBM Netezza Analytics map/reduce API Reference.
- Fonctionnalité avancée - Décrit des concepts plus avancés, tels que les options génériques de ligne de commande, les compteurs et la journalisation.
- Netezza Analytics Map/Reduce Examples - Fournit quatre exemples map/reduce basés sur les JARs distribués avec le logiciel map/reduce.
- Netezza Analytics Map/Reduce Streaming - Explique le streaming map/reduce, qui vous permet d'exécuter des programmes map/reduce écrits dans des langages autres que Java.