Formation - Big Data - Les techniques d'analyse et de visualisation
Référence : onD64oksZpci
Durée : 35 h sur 5 j
Tarif
17 250 €
HT
Logo - M2i Formation
M2i Formation
Mougins
Intra-Entreprise
Une formation intra-entreprise réunit dans une même session les salariés d'une seule entreprise. Elle se déroule généralement dans les locaux de l'entreprise. Le tarif est convenu pour la formation d'un groupe de salarié.

Détails de la formation

Méthodes et outils pédagogiques

Formation délivrée en présentiel ou distanciel* (blended-learning, e-learning, classe virtuelle, présentiel à distance). Le formateur alterne entre méthode démonstrative, interrogative et active (via des travaux pratiques et/ou des mises en situation). Variables suivant les formations, les moyens pédagogiques mis en oeuvre sont : - Ordinateurs Mac ou PC (sauf pour certains cours de l’offre Management), connexion internet fibre, tableau blanc ou paperboard, vidéoprojecteur ou écran tactile interactif (pour le distanciel) - Environnements de formation installés sur les postes de travail ou en ligne - Supports de cours et exercices En cas de formation intra sur site externe à M2i, le client s'assure et s'engage également à avoir toutes les ressources matérielles pédagogiques nécessaires (équipements informatiques...) au bon déroulement de l'action de formation visée conformément aux prérequis indiqués dans le programme de formation communiqué. nous consulter pour la faisabilité en distanciel * ratio variable selon le cours suivi

Objectifs de la formation

A l’issue de cette formation, vous serez capable de :

  • Charger et analyser des données de diverses sources avec Hadoop, NiFi, Kafka et Spark
  • Restituer ces données avec Kibana.

Méthodes d'évaluation

  • En cours de formation, par des études de cas ou des travaux pratiques - Et, en fin de formation, par un questionnaire d'auto-évaluation et/ou un examen M2i

Pré-requis

Avoir des connaissances en langage Python pour l'analyse de données via Spark. Maîtriser le langage de requêtage SQL. Avoir des connaissances en ETL et en BI est un plus.

Public cible

Tous publics

Programme

1
Vue d'ensemble du Big Data
-Introduction au Big Data : de quoi s'agit-il ?-Perspectives offertes par le Big Data-Les acteurs du Big Data-Exemples pratiques-Démystification du Big Data-Big Data et Cloud SaaS, PaaS et FaaS-Les différents métiers du Big Data-Data Lakes vs Data Warehouses vs Lakehouses-Aspects économiques :
-TCO (Total Cost of Ownership)
-Opportunity Cost (coût d'opportunité)
-ROI (retour sur investissement)-Travaux pratiques sur Hadoop-Aspects réglementaires (RGPD) et éthiques
2
Architecture Hadoop
-Les outils de stockage-Les exigences de stockage-Le théorème de CAP-Le NoSQL-L'écosystème Hadoop
-HDFS
-MapReduce
-Tez-Les outils d'ingestion et d'analyse de données
-SparkJour 2-Les outils d'ingestion et d'analyse de données (suite)
-Pig
-Hive
-Impala-La mise en qualité-Le stockage de données
3
<em>Exemple de travaux pratiques (à titre indicatif)</em>
-Création d'un pipeline simple sur Hadoop
4
Fondamentaux du Data Engineering
-Définition du Data Engineering-Cycle de vie et workflow du Data Engineering-Technologies du Data Engineering-Evolution du métier de Data Engineer-Compétences, activités et responsabilités du Data Engineer : Type A vs Type B-Le Data Engineer au sein d'une Data Team-Parties prenantes : producteurs upstream, consommateurs downstream-Data Maturity d'une organisation-Data Engineering, Agilité, DevOps et DataOps-Gouvernance et qualité des données-Nouvelles tendances du Data Engineering: Lakehouse, orchestration, Pipelines as Code
5
<em>Exemple de travaux pratiques (à titre indicatif)</em>
-Mise en pratique par des études de casJour 3

Sur la même thématique

Logo eDRH Sud PACA - Footer
Nous contacter

Chambre de Commerce
et d’industrie Nice Côte d’Azur

20 Boulevard Carabacel
CS 11259
06005 NICE CEDEX 1

Tel :04 93 13 75 73
(Appel gratuit depuis un poste fixe)