Découverte de connaissances dans les données : Fiche UE : Offre de formation

Accueil >> Master >> Informatique >> Technologies de l'information et web >> Découverte de connaissances dans les données

Domaine : Masters du domaine SCIENCES, TECHNOLOGIES, SANTE
Diplôme : Master
Mention : Informatique
Parcours : Technologies de l'information et web
Unité d'enseignement : Découverte de connaissances dans les données

Nombre de crédits de l'UE : 3
Code APOGEE : INF2418M
UE Obligatoire pour ce parcours
UE valable pour le semestre 3 de ce parcours

Responsabilité de l'UE :

PLANTEVIT MARC

marc.plantevituniv-lyon1.fr

Type d'enseignement

Nb heures *

Cours Magistraux (CM)

12 h

Travaux Dirigés (TD)

6 h

Travaux Pratiques (TP)

8 h

Total du volume horaire

26 h

* Ces horaires sont donnés à titre indicatif.

Conditions d'accès à l'UE :

Bases de programmation, d’algorithmique, de bases de données et de logique de niveau M1.

Programme - Contenu de l'UE :

L’ enseignement vise à connaître les bases de la fouille de motifs sous contraintes et des méthodes de partionnement (clustering, bi-clustering, co-clustering) puis de les mettre en oeuvre afin d’analyser des données réelles et produire de la valeur ajoutée sur ces données. Un tour d’horizon des problématiques actuelles est également proposé. L’enseignement est décomposé de la façon suivante :

Présentation d’un Processus KDD ou d’un projet Data Science
Fouille de motifs fréquents (itemsets et règles d’association) et algorithmes/explorations classiques (Apriori, Eclat, FP-Growth, parcours en largeur/profondeur, beam search)
Fouille de motifs sous contraintes : étude et exploitation des propriétés des contraintes (anti-monotonie, contraintes convertibles, contraintes faiblement (anti-)monotone, contraintes monotones/anti-monotones par morceau, convexité)
Langage de motifs plus sophistiqués (concepts formels, séquences, graphes, graphes dynamiques, graphes augmentés, …)
Partitionnement de données : (Bi-|Co-|Subspace-) Clustering
Ouverture vers les problématiques actuelles (analyse de flux de données, fouille de données interactive, parallélisation, instant mining)

Compétences acquises :

Méthodologiques :
Ce cours propose les fondamentaux des méthodes et outils modernes de fouille de données et d’extraction de connaissances pour l’aide à la décision afin de sensibiliser les étudiants aux différents problèmes rencontrés. Sont abordés les thèmes suivants : processus KDD (Knowledge Discovery in Databases), fouille de données descriptives (par exemple, motifs ensemblistes, séquences, graphes, découvertes de sous-groupes, EMM,), clustering (par exemple, clustering hiérarchique, k-means, clustering par densité), classification supervisée (par exemple, mesure d’évaluation, arbre de décision, réseaux bayésiens, SVM, réseaux de neurones profonds) et modèles de régression (prédiction de variables numériques). Les différents concepts abordés seront illustrés sur des applications réelles ciblées web (systèmes de recommandation, analyse de logs, analyse de réseaux sociaux, fouille d’opinion, détection d’événements, etc.). Leur mise en oeuvre sera effectué sur des plateformes libres (Weka, Knime, scikit-learn). Un intérêt particulier sera donné sur les problèmes liés au passage à l’échelle des différentes approches étudiées.

Modalités de contrôle des connaissances et Compétences 2020-2021:

Type		Libellé	Nature	Coef.
CT	Contrôle Terminal	CT : TIW9-DCD	Ecrit session 1 / Ecrit session 2	1.5
CC	Contrôle Continu	CC : TIW9-DCD	Contrôle Continu	1.5

Liste des autres Parcours / Spécialité / Filière / Option utilisant cette UE :

Technologies de l'information et web (au semestre 3 [UE Obligatoire]) [mention : Informatique]
Bio-informatique moléculaire: méthodes et analyses (au semestre 3 [UE Libre]) [mention : Bio-informatique]

Date de la dernière mise-à-jour : 13/04/2018