MapReduce est un élément essentiel et fait partie intégrante du fonctionnement de l'environnement Hadoop.
MapReduce facilite les traitements concurrents en divisant les péta-octets de données en volumes plus petits et en les traitant en parallèle sur des serveurs standard dédiés à Hadoop.
MapReduce envoie un ensemble complet de données à chaque nœud du réseau, et si un nœud ou un élément matériel tombe en panne, toutes les données sont préservées et peuvent être récupérées automatiquement.
Quand commence l'exécution de la phase de Reduce ? Pourquoi ne pas exécuter la fonction de Reduce sur les paires intermédiaires stockées sur les disques des machines de Map? À la toute fin du processus, quand le dernier reducer a terminé.