- Domaine : Masters du domaine SCIENCES, TECHNOLOGIES, SANTE
- Diplôme : Master
- Mention : Informatique
- Parcours : Technologies de l'information et web
- Unité d'enseignement : Découverte de connaissances dans les données
Nombre de crédits de l'UE : 3
Code APOGEE : INF2418M
UE Obligatoire pour ce parcours
UE valable pour le semestre 3 de ce parcours
Type d'enseignement
Nb heures *
Cours Magistraux (CM)
12 h
Travaux Pratiques (TP)
8 h
Total du volume horaire
26 h
* Ces horaires sont donnés à titre indicatif.
Conditions d'accès à l'UE :
Bases de programmation, d’algorithmique, de bases de données et de logique de niveau M1.
Programme - Contenu de l'UE :
L’ enseignement vise à connaître les bases de la fouille de motifs sous contraintes et des méthodes de partionnement (clustering, bi-clustering, co-clustering) puis de les mettre en oeuvre afin d’analyser des données réelles et produire de la valeur ajoutée sur ces données. Un tour d’horizon des problématiques actuelles est également proposé. L’enseignement est décomposé de la façon suivante :
-
Présentation d’un Processus KDD ou d’un projet Data Science
-
Fouille de motifs fréquents (itemsets et règles d’association) et algorithmes/explorations classiques (Apriori, Eclat, FP-Growth, parcours en largeur/profondeur, beam search)
-
Fouille de motifs sous contraintes : étude et exploitation des propriétés des contraintes (anti-monotonie, contraintes convertibles, contraintes faiblement (anti-)monotone, contraintes monotones/anti-monotones par morceau, convexité)
-
Langage de motifs plus sophistiqués (concepts formels, séquences, graphes, graphes dynamiques, graphes augmentés, …)
-
Partitionnement de données : (Bi-|Co-|Subspace-) Clustering
-
Ouverture vers les problématiques actuelles (analyse de flux de données, fouille de données interactive, parallélisation, instant mining)
Compétences acquises :
Méthodologiques :
Ce cours propose les fondamentaux des méthodes et outils modernes de fouille de données et d’extraction de connaissances pour l’aide à la décision afin de sensibiliser les étudiants aux différents problèmes rencontrés. Sont abordés les thèmes suivants : processus KDD (Knowledge Discovery in Databases), fouille de données descriptives (par exemple, motifs ensemblistes, séquences, graphes, découvertes de sous-groupes, EMM,), clustering (par exemple, clustering hiérarchique, k-means, clustering par densité), classification supervisée (par exemple, mesure d’évaluation, arbre de décision, réseaux bayésiens, SVM, réseaux de neurones profonds) et modèles de régression (prédiction de variables numériques). Les différents concepts abordés seront illustrés sur des applications réelles ciblées web (systèmes de recommandation, analyse de logs, analyse de réseaux sociaux, fouille d’opinion, détection d’événements, etc.). Leur mise en oeuvre sera effectué sur des plateformes libres (Weka, Knime, scikit-learn). Un intérêt particulier sera donné sur les problèmes liés au passage à l’échelle des différentes approches étudiées.
Modalités de contrôle des connaissances et Compétences 2020-2021:
Type | | Libellé | Nature | Coef. | |
CT | Contrôle Terminal | CT : TIW9-DCD | Ecrit session 1 / Ecrit session 2 | 1.5 |
CC | Contrôle Continu | CC : TIW9-DCD | Contrôle Continu | 1.5 |
Liste des autres Parcours / Spécialité / Filière / Option utilisant cette UE :
Date de la dernière mise-à-jour : 13/04/2018
SELECT * FROM parcours INNER JOIN ue_parcours ON PAR_ID_FK=PAR_ID INNER JOIN mention ON MEN_ID = PAR_MENTION_FK WHERE PAR_ACTIVATE = 0 AND UE_ID_FK='20494' ORDER BY UE_ID_FK ASC, PAR_ID_FK ASC