Cette unité d’enseignement, sous-ensemble de notre Applied MSc in Data Science & Artificial Intelligence, est composée de 6 cours différents, pour un total de 225 heures. Tous les modules à DSTI sont délivrés en anglais.
Détails de la formation
Méthodes et outils pédagogiques
Avant le début de la formation, un entretien avec un membre de la Direction des Etudes a lieu afin de :
Vérifier que le candidat possède les prérequis nécessaires pour suivre le module. Le cas échéant, il lui sera proposé sans surcout des frais de formation, des vidéos ou liens complémentaires de remise à niveau.
Préciser avec le candidat l’adéquation du module avec ses objectifs professionnels. Le cas échéant, il sera possible d’ajuster le contenu du module avec d’autres classes pour coller parfaitement à ses besoins.
Objectifs de la formation
Participer, avec des Data Engineers, à la rédaction’ un cahier des charges technique pour la conception et la mise en place d’une solution d’analyse des données volumineuses.
Exploiter un système distribué d’entrepôt de données structurées et non structurées, notamment via Apache Hadoop & Apache Spark.
Contribuer à la définition de l’architecture de stockage de données, en guidant les Data Engineers à prendre en compte les besoins de traitements algorithmiques de l’intelligence artificielle.
Concevoir et implémenter des algorithmes pour le traitement des grands volumes de données dans le respect des bonnes pratiques de l’ingénierie logicielle (incluant les approches SQL et NoSQL).
Exploiter des infrastructures informatiques distribuées en mode cloud sur la plateforme Amazon AWS pour y déporter des traitements algorithmiques de l’intelligence artificielle (préparation à la certification Amazon AWS Solution Architect – Associate)
Mise en situation professionnelle réelle au travers du stage obligatoire d’application.
Les plus
Un enseignement de haut niveau reconnu au niveau international
Une reconnaissance académique: Titre RNCP "expert en science des données"
Des certifications industriels externes: Amazon AWS et SAS
Une employabilité proche de 100% à la fin du cursus
Des compétences utlises et recherchées par les entreprises
Un accompagnement sur-mesure de votre projet professionnel
Un environnement multiculturel avec 70% d'étudiants internationaux
Des campus modernes et digitalisés
Un bootcamp organisé en préambule de la rentrée pour se préparer
L'esprit famille de DSTI, une écoute et un soutien quotidien
Pré-requis
CANDIDATS DIPLÔMÉS D'UN NIVEAU BAC+3 : 3 ans d'expérience professionnelle
CANDIDATS DIPLÔMÉS D'UN NIVEAU BAC+4 : Expérience professionnelle (y compris les stages)
CANDIDATS DIPLÔMÉS D'UN NIVEAU BAC+5 : Aucune condition particulière
Modalités d'enseignement
En présentiel
En distanciel
Public cible
Tous publics
Programme
1
Data Wrangling with SQL (25 hrs)
Review of relational model and databases management systems – Advanced SQL querie – Dynamic SQL – Stored procedures & triggers
2
SAS BASE Programming (25 hrs)
Preparation to “SAS Base Programming using” with SAS STATS
3
Statistical Analysis of Massive and High Dimensional Data (25 hrs)
Context for new uses of massive datasets (open data, social networks, Twitter…) – Review of conventional statistical methods (tests, regression, classification) and their (un)suitability massive datasets – Latest alternative statistical tools for analysing modern datasets – Implementation in realistic situations using R
4
Amazon AWS “Cloud-Computing DSTI Chair” (50 hrs)
Preparation to AWS Certified Solutions Architect – Associate Certification
5
Hadoop & Spark Ecosystem (50 hrs)
HDFS – Scheduling & resources management – Workflow management & ETL – Dataflow management, -Scalable Enterprise Serial Bus – Realtime processing – Machine Learning – Data Exploration & Visualisation
6
Software Engineering (50 hrs)
Fundamentals of Algorithmics – C programming - Object-oriented programming using Python – Overview of C++