Analyse de données en environnement Hadoop

Connaître les outils spécifiques au métier de Data Analyst

Paris

Contenu

Comprendre les besoins métier pour livrer aux décideurs des indicateurs fiables et pertinents, tel est le rôle des Data Analysts. Précisément conçu pour leur apprendre à mettre en œuvre une solution de Big Data en environnement Hadoop, solution émergente pour les traitements Big Data, ce programme reprend le cheminement logique d’un projet d’analyse de données. De la mise en place d’une solution de stockage HDFS permettant d’organiser un très grand volume d’information, à la réalisation de programmes Pig et Hive qui, convertis en tâches MapReduce, permettent d’agréger et de filtrer les données, tous les aspects seront abordés.

Objectifs

Comprendre ce que sont Hadoop et YARN_x000D_
Connaître les différents outils et les Framework dans un environnement Hadoop 2.0_x000D_
Découvrir comment HDFS Federation fonctionne dans Hadoop 2.0_x000D_
Appréhender MapReduce_x000D_
Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle_x000D_
Comprendre comment exécuter une tâche de MapReduce sur YARN_x000D_
Savoir écrire des requêtes HiveSQL pour manipuler des données_x000D_
Comprendre comment utiliser le HCatalog avec Pig et Hive

Prérequis

Les participants doivent connaitre les principes de la programmation et avoir de l’expérience dans le développement de logiciels_x000D_
Une connaissance de SQL est un plus_x000D_
Une connaissance d’Hadoop n’est pas nécessaire

Diplôme visé

NA

Cette formation est pour moi
Paris 1690 3 jour(s)
Cette formation est pour moi
Ajouter
Partager

Veuillez remplir ce formulaire pour que nous puissions vous mettre en relation avec l'organisme de formation.
Cet organisme vous recontactera très prochainement.