1. Accueil
  2. Formations
  3. Mastère Spécialisé ®
  4. Expert Big Data Engineer

Programme détaillé du Mastère Spécialisé® Big Data : Analytics avancées pour la décision

Bloc 1 : Généralités et Notions sur le Big Data

uv01 : Introduction au Big Data

Référence : ITB / Durée : 35 H / Crédits : 5 ECTS

Le déluge sans cesse croissant de données hétérogènes et la multiplicité des technologies du Big data constituent les défis majeurs de l’expert en Big Analytics et Métriques. Cette UV a donc pour objectif de fournir une vue d’ensemble sur le sujet du Big Data tout en fournissant les clés d’un système de veille efficace aux étudiants.

A l’issue de cette première UV les étudiants seront capables de poser un diagnostic, de concevoir et de manager un projet data.

Cours 1.1 : Présentation de l’écosystème du Big Data
Cours 1.2 : Transition digitale et changement de paradigme en entreprise
Cours 1.3 : Conception et Management de projets data
 

uv02 : Données d’entreprise : Gouvernance et stratégies

Référence : GSD / Durée : 35 H / Crédits : 4 ECTS

Avec l’émergence des technologies du Big Data, les institutions (privées et publiques) font face à la question de la gouvernance et de la stratégie en matière de possession, de gestion et de transformation de la donnée. L’UV 2 présente de façon méthodique les trois principaux sujets de préoccupation du data scientist et du data strategist : droit des données, sécurité dans le cloud et les risques liés à l’entreposage, l’analyse et l’interprétation de la donnée.

Les étudiants ayant suivi l’UV 2 seront capables de faire l’état des lieux et d’identifier les risques inhérents au stockage et aux traitements des Big data. Ils seront aussi capables de définir une politique de gouvernance respectueuse des lois et des standards de sécurité.

Cours 2.1 : Droit des données et Aspects éthiques
Cours 2.2 : Cloud computing et sécurité
Cours 2.3 : Analyse de risque liée à la donnée

Bloc 2 : Techniques d'Actionnabilité de la Donnée

uv03 : Stockage de données réutilisables

Référence : SDR / Durée : 35 H / Crédits : 4 ECTS

Avec le déluge de données, la possession de données brutes (collectées ou acquises) laisse de plus en plus la place à l’émergence de la notion de données actionnables. Il est donc important pour les entreprises d’une part de disposer des techniques de transformation de la donnée brute en donnée actionnable et d’autre part d’être capable d’entreposer cette donnée afin de se donner la possibilité de la réutiliser. Cette UV est plus orientée sur le caractère opérationnel d’une stratégie de la donnée actionnable que sur la présentation des techniques avancées de grandes masses de données qu’abordera l’UV 5.

À l’issue de cette UV, les étudiants seront capables de proposer, compte tenu des spécificités du contexte, une stratégie de stockage des données réutilisables en fonction de leur valeur intrinsèque et des besoins.

Cours 3.1 : Entrepôts de données opérationnelles
Cours 3.2 : Open Data - enjeux et stratégie
Cours 3.3 : Bases de données actionnables
 

uv04 : Data intelligence & Data as a Service

Référence : DAAS / Durée : 35 H / Crédits : 4 ECTS

La data intelligence désigne la collecte, l’analyse et la prise de décision à partir de multiples sources de données pour valoriser l’activité économique des entreprises. La Data Intelligence nécessite la constitution de compétences pluridisciplinaires capables de caractériser et préparer la donnée et d’utiliser les outils technologiques nécessaires à l’exploitation de ces données. Cette UV abordera également la conception de services orientés données à travers l’étude d’exemples.

À l’issue de cette UV, les étudiants seront capables de proposer une stratégie de monétisation des données et de concevoir et tester des cas d’usage de services basés sur la donnée.

Cours 4.1 : Le MLOps
Cours 4.2 : Serving et déploiement de modèles
Cours 4.3 : L’IA générative

Bloc 3 : Base de Données et Programmations Avancées

uv05 : Conception et gestion de bases de données avancées

Référence : BDD / Durée : 35 H / Crédits : 5 ECTS

L’optimisation des systèmes de stockage et de gestion de la donnée (brute ou prétraitée) constitue l’un des défis majeurs des métiers de data scientist et de data strategist. De plus la spécificité des traitements en fonction des besoins et la forte variabilité des dimensions sous-jacentes imposent un choix (sinon un dosage) judicieux entre des bases de données structurées et les bases de données non structurées.

Les étudiants ayant suivi cette UV seront capables de modéliser, concevoir et gérer des bases de données répondants aux trois dimensions du big data : volume, vélocité, variété tout en prenant en compte les besoins.

Cours 5.1 : SQL vs NoSQL : présentation générale
Cours 5.2 : Bases de données orientées colonne (BigTable, HyperTable, etc.)
Cours 5.3 : Solutions Open Source pour la gestion de données massives
 

uv06 : Langages et outils de programmation

Référence : PRO / Durée : 35 H / Crédits : 4 ECTS

La mise en œuvre des technologies des Big Analytics requiert de réelles compétences dans la programmation avancée. Quels sont les fondements de la programmation pour la mise en place d’algorithmes de traitement de grosses volumétries de données ? Quels sont les langages de programmation les plus adaptés aux Big data ?

À l’issue de l’UV 06, les étudiants seront en mesure de programmer en R et dans un autre langage (tel que Python ou Scala ou Java/JavaScript).

Cours 6.1 : Programmation R pour l’analyse décisionnelle en entreprise
Cours 6.2 : Autres langages de programmation
Cours 6.3 : Indexation et Systèmes de Fichiers

Bloc 4 : Traitement de Grandes Masses de Données

uv07 : Intelligence artificielle en grande dimension

Référence : ARI / Durée : 35 H / Crédits : 5 ECTS

Les approches d’intelligence artificielle connaissent un succès incontesté depuis de nombreuses années. Les géants du high-tech (tels que Apple, Facebook, Google, Microsoft) ainsi qu’un grand nombre de petites entreprises et de start-up à travers le monde l’utilisent pour développer leurs applications. 
Cette UV couvre la résolution automatisée des problèmes complexes sur de grandes quantités de données. Les applications sont nombreuses et couvrent une large gamme de domaines tels que la recherche d’information, la recommandation sociale, la vision par ordinateur, la génomique, etc.

À l’issue de l’UV 07 les étudiants seront capables de mettre en œuvre des algorithmes d’intelligence artificielle pour le traitement de grandes masses de données. L’accent sera surtout mis à la fin de l’UV sur les approches émergentes des méthodes d’apprentissages (basées sur les réseaux de neurones par exemple) pour préparer les étudiants aux situations les plus complexes. 

Cours 7.1 : Introduction au data mining
Cours 7.2 : Machine Learning avancée pour la production d’indicateurs
Cours 7.3 : Deep Learning and applications
 

uv08 : Traitements Distribués

Référence : TRD / Durée : 35 H / Crédits : 4 ECTS

Le calcul distribué a longtemps été utilisé comme une simple technique d’optimisation des calculs pour faire face au problème de réduction de la complexité algorithmique. Aujourd’hui, il apparaît être une étape incontournable tout aussi dictée par la finalité que par la configuration intrinsèque des données et le modèle des traitements. D’autre part, il est important que les étudiants comprennent, lorsque le cas se présente, le compromis entre traitements centralisés et traitements distribués.

À l’issue de cette UV, après avoir appris à différentier les compromis qui peuvent être faits entre le mode centralisé et le mode décentralisé, les étudiants seront en mesure de : reconnaître les cas qui peuvent être implémentés avec Hadoop, comprendre comment mettre en œuvre le MapReduce et écrire des programmes MapReduce sur des cas concrets.

Cours 8.1 : Résolution distribuée des problèmes complexes
Cours 8.2 : Parallélisations en haute dimension
Cours 8.3 : Hadoop & MapReduce par la pratique

bloc 5 : Big Analytics et Visualisation Décisionnelle

uv09 : Information Retrieval (Extraction d’Information)

Référence : IRT / Durée : 35 H / Crédits : 5 ECTS

La taille et la complexité des données (générées par l’activité humaine et technologique) croissent de plus en plus rapidement. Le développement d’approches innovantes pour l’extraction d’information pertinente dans le flow (continue) de données est un axe incontournable du cycle de l’information pour une entreprise innovante.

À l’issue de cette UV, les étudiants seront capables de mettre en œuvre les techniques d’extraction d’information intrinsèques ou par recoupement et interconnexion. 

Cours 9.1 : Knowledge discovery
Cours 9.2 : Outils pour la visualisation de tendances en grandes dimensions
Cours 9.3 : Enrichissement de données et calcul d’indicateurs
Cours 9.4 : Interconnexion et visualisation de graphes sociaux distribués
 

uv10 : Visualisation Dynamique

Référence : DYN / Durée : 35 H / Crédits : 4 ECTS

Aussi contradictoire que cela puisse paraître, le jugement humain reste au centre d’une analyse de données réussie. Il est aujourd’hui admis que sans des outils qui s’appuient sur la cognition humaine, les approches automatiques n’ont pas de réelle valeur ajoutée. Or, très souvent les représentations des données (ou des indicateurs extraits) perdent leur dimension dynamique après les traitements. Il s’agit de ne pas perdre la dimension dynamique au passage de la donnée brute à sa représentation et offrir ainsi à l’utilisateur une visualisation temps-réel.

À l’issue de cette UV, les étudiants seront capables de capturer la variabilité intrinsèque des données cibles pour les restituer lors de la visualisation.

Cours 10.1 : Visualisation interactive
Cours 10.2 : Analyse et visualisation spatio-temporelles
Cours 10.3 : Scalable Multimedia Analytics
 
mise à jour le 10 novembre 2023