Formation - Module 2 - DS : Concevoir et déployer des infrastructures informatiques distribuées pour stocker et traiter des données massives
Référence : pMpOESq80xNo
Durée : 225 h sur 45 j
Logo - Data  ScienceTech Institute
Data ScienceTech Institute
BIOT
Cette unité d’enseignement, sous-ensemble de notre Applied MSc in Data Science & Artificial Intelligence, est composée de 6 cours différents, pour un total de 225 heures. Tous les modules à DSTI sont délivrés en anglais.

Détails de la formation

Méthodes et outils pédagogiques

Avant le début de la formation, un entretien avec un membre de la Direction des Etudes a lieu afin de :

  • Vérifier que le candidat possède les prérequis nécessaires pour suivre le module. Le cas échéant, il lui sera proposé sans surcout des frais de formation, des vidéos ou liens complémentaires de remise à niveau.
  • Préciser avec le candidat l’adéquation du module avec ses objectifs professionnels. Le cas échéant, il sera possible d’ajuster le contenu du module avec d’autres classes pour coller parfaitement à ses besoins.

Objectifs de la formation

  • Participer, avec des Data Engineers, à la rédaction’ un cahier des charges technique pour la conception et la mise en place d’une solution d’analyse des données volumineuses.
  • Exploiter un système distribué d’entrepôt de données structurées et non structurées, notamment via Apache Hadoop & Apache Spark.
  • Contribuer à la définition de l’architecture de stockage de données, en guidant les Data Engineers à prendre en compte les besoins de traitements algorithmiques de l’intelligence artificielle.
  • Concevoir et implémenter des algorithmes pour le traitement des grands volumes de données dans le respect des bonnes pratiques de l’ingénierie logicielle (incluant les approches SQL et NoSQL).
  • Exploiter des infrastructures informatiques distribuées en mode cloud sur la plateforme Amazon AWS pour y déporter des traitements algorithmiques de l’intelligence artificielle (préparation à la certification Amazon AWS Solution Architect – Associate)

Méthodes d'évaluation

  • Questionnaires à choix multiples
  • Projets d’applications
  • Examen externe de certification industrielle « Amazon AWS Solutions Architect – Associate »
  • Mise en situation professionnelle réelle au travers du stage obligatoire d’application.

Les plus

  1. Un enseignement de haut niveau reconnu au niveau international
  2. Une reconnaissance académique: Titre RNCP "expert en science des données"
  3. Des certifications industriels externes: Amazon AWS et SAS
  4. Une employabilité proche de 100% à la fin du cursus
  5. Des compétences utlises et recherchées par les entreprises
  6. Un accompagnement sur-mesure de votre projet professionnel
  7. Un environnement multiculturel avec 70% d'étudiants internationaux
  8. Des campus modernes et digitalisés
  9. Un bootcamp organisé en préambule de la rentrée pour se préparer
  10. L'esprit famille de DSTI, une écoute et un soutien quotidien

Pré-requis

  • CANDIDATS DIPLÔMÉS D'UN NIVEAU BAC+3 : 3 ans d'expérience professionnelle
  • CANDIDATS DIPLÔMÉS D'UN NIVEAU BAC+4 : Expérience professionnelle (y compris les stages)
  • CANDIDATS DIPLÔMÉS D'UN NIVEAU BAC+5 : Aucune condition particulière

Modalités d'enseignement

  • En présentiel
  • En distanciel

Public cible

Tous publics

Programme

1
Data Wrangling with SQL (25 hrs)
Review of relational model and databases management systems – Advanced SQL querie – Dynamic SQL – Stored procedures & triggers
2
SAS BASE Programming (25 hrs)
Preparation to “SAS Base Programming using” with SAS STATS
3
Statistical Analysis of Massive and High Dimensional Data (25 hrs)
Context for new uses of massive datasets (open data, social networks, Twitter…) – Review of conventional statistical methods (tests, regression, classification) and their (un)suitability massive datasets – Latest alternative statistical tools for analysing modern datasets – Implementation in realistic situations using R
4
Amazon AWS “Cloud-Computing DSTI Chair” (50 hrs)
Preparation to AWS Certified Solutions Architect – Associate Certification
5
Hadoop & Spark Ecosystem (50 hrs)
HDFS – Scheduling & resources management – Workflow management & ETL – Dataflow management, -Scalable Enterprise Serial Bus – Realtime processing – Machine Learning – Data Exploration & Visualisation
6
Software Engineering (50 hrs)
Fundamentals of Algorithmics – C programming - Object-oriented programming using Python – Overview of C++

Sur la même thématique

Logo eDRH Sud PACA - Footer
Nous contacter

Chambre de Commerce
et d’industrie Nice Côte d’Azur

20 Boulevard Carabacel
CS 11259
06005 NICE CEDEX 1

Tel :04 93 13 75 73
(Appel gratuit depuis un poste fixe)