Formation - Big Data - Intégration SQL, Hive, Spark DataFrames
Référence : R7MVeTdsfPmP
Durée : 14 h sur 2 j
Logo - M2i Formation
M2i Formation
Mougins
Intra-Entreprise
Une formation intra-entreprise réunit dans une même session les salariés d'une seule entreprise. Elle se déroule généralement dans les locaux de l'entreprise. Le tarif est convenu pour la formation d'un groupe de salarié.

Détails de la formation

Méthodes et outils pédagogiques

Formation délivrée en présentiel ou distanciel* (blended-learning, e-learning, classe virtuelle, présentiel à distance).
Le formateur alterne entre méthode** démonstrative, interrogative et active (via des travaux pratiques et/ou des mises en situation).
Variables suivant les formations, les moyens pédagogiques mis en oeuvre sont :

  • Ordinateurs Mac ou PC (sauf pour certains cours de l'offre Management), connexion internet fibre, tableau blanc ou paperboard, vidéoprojecteur ou écran tactile interactif (pour le distanciel)
  • Environnements de formation installés sur les postes de travail ou en ligne
  • Supports de cours et exercices

En cas de formation intra sur site externe à M2i, le client s'assure et s'engage également à avoir toutes les ressources matérielles pédagogiques nécessaires (équipements informatiques...) au bon déroulement de l'action de formation visée conformément aux prérequis indiqués dans le programme de formation communiqué.
* nous consulter pour la faisabilité en distanciel
** ratio variable selon le cours suivi

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Expliquer les connexions existantes entre les mondes relationnels et NoSQL en environnement Big Data
  • Mettre en oeuvre Hive et Pig, Impala, les Spark DataFrames.

Méthodes d'évaluation

  • Analyse des résultats individuels produits par chaque participant lors des travaux pratiques, correction au fur et à mesure du déroulé de la formation - Réalisation d'un test complet sur un projet global de fin de formation, et analyse par le consultant formateur - Un QCM individuel d'évaluation des acquis est proposé en fin de chaque session

Pré-requis

Avoir des connaissances générales des systèmes d'informations et des bases de données.

Public cible

Tous publics

Programme

1
Présentation
-Besoin : adéquation entre les objectifs et les outils-Faciliter la manipulation de gros volumes de données en conservant une approche utilisateurs-Rappels sur le stockage (HDFS, Cassandra, HBase) et les formats de données (parquet, orc, raw, clés / valeurs)-Les outils : Hive, Impala, Tez, Presto, Drill, Pig, SparkQL
2
Hive et Pig
-Présentation-Mode de fonctionnement-Rappel sur MapReduce-Hive : le langage HiveQL
-Exemples-Pig : le langage Pig Latin
-Exemples
3
Impala
-Présentation-Cadre d'utilisation-Contraintes-Liaison avec le metastore Hive-Exemple de travaux pratiques (à titre indicatif)
-Atelier : mise en évidence des performances
4
Presto
-Cadre d'utilisation-Sources de données utilisables-Exemple de travaux pratiques (à titre indicatif)
-Atelier : mise en oeuvre d'une requête s'appuyant sur Cassandra et PostgreSQL
5
Spark DataFrame
-Les différentes approches
-Syntaxe SparkQL
-API QL-Compilation Catalyst
-Syntaxe
-Opérateurs-Exemple de travaux pratiques (à titre indicatif)
-Atelier : mise en oeuvre d'une requête s'appuyant sur HBase et HDFS

Sur la même thématique

Logo eDRH Sud PACA - Footer
Nous contacter

Chambre de Commerce
et d’industrie Nice Côte d’Azur

20 Boulevard Carabacel
CS 11259
06005 NICE CEDEX 1

Tel :04 93 13 75 73
(Appel gratuit depuis un poste fixe)