Hadoop - Cloudera pour développeurs

Développement de solutions Hadoop Cloudera

Paris

Contenu

Initialement proposé par Google qui devait faire face à un volume croissant de données à analyser et fournir aux internautes des résultats de recherche pertinents, MapReduce , combiné à d’autres publications telles que Google File System et BigTables, est à l’origine de Hadoop. Confronté à des problèmes similaires à ceux rencontrés par la firme de Mountain View, Doug Cutting, alors chez Yahoo !, lance au milieu des années 2000, sous forme de projet de la fondation Apache, le Framework Hadoop. Devant le succès rencontré par sa solution, il rejoint Cloudera qui propose alors sa propre distribution d’Hadoop, la plus utilisée à ce jour. Outre un support sur le produit, la société propose également une suite d’outils permettant des traitements temps réel de très gros volumes de données.

Objectifs

Connaître Hadoop 2.0 et Hadoop Distributed File System_x000D_
Comprendre comment mettre en œuvre le nouveau Framework YARN dans Hadoop 2.0_x000D_
Apprendre à programmer avec « MapReduce »_x000D_
Savoir optimiser une tache MapReduce en suivant les meilleures pratiques_x000D_
Être en mesure de créer des workflows avec Oozie_x000D_
Comprendre comment créer et éxécuter des requêtes Hive sur des données HDFS_x000D_
Créer des tâches MapReduce permettant d’analyser des données avec Pig_x000D_
Savoir débugger des programmes « MapReduce » pour les fiabiliser

Prérequis

Il est important d’avoir une expérience dans le développement, si possible avec Java._x000D_
Une compréhension des algorithmes est un plus.

Diplôme visé

NA

Cette formation est pour moi
Paris 1790 3 jour(s)
Cette formation est pour moi
Ajouter
Partager

Veuillez remplir ce formulaire pour que nous puissions vous mettre en relation avec l'organisme de formation.
Cet organisme vous recontactera très prochainement.