Statistiques Inférentielles
Le but de ce cours est d’étudier les outils de statistiques indispensables en actuariat, en particulier nécessaires dans toutes les problématiques de tarification, de calibration, et permettant l’étude de modèles statistiques avancés.
Après quelques rappels de statistique descriptive, ce cours présente la théorie de l’échantillonnage et de l’estimation puis la théorie des tests statistiques.
Sont notamment abordées les notions de modèles statistiques, d’estimation ponctuelle et d’intervalles de confiance. La notion de test statistique est ensuite abordée, ainsi que les principaux tests paramétriques et quelques tests non paramétriques.
Toutes les notions abordées sont mises en œuvre à l’aide du logiciel R.
Analyse des données et clustering
Cet enseignement vise à transmettre, d’une part, les bases théoriques de l’analyse de données et des principales techniques de clustering, et d’autre part, une compétence dans leur mise en œuvre à l’aide de divers packages du logiciel R et l’interprétation des résultats produits.
L’analyse exploratoire de données a pour but l’identification de structures simples, tant au niveau des variables étudiées qu’au niveau de la population. Cette démarche repose souvent sur des méthodes issues de l’analyse factorielle et sur des méthodes de clustering ou segmentation. Les méthodes abordées permettront une première approche de tableaux de données multi-variées quantitatives ou qualitatives : analyse en composantes principales, analyse factorielle de correspondances, analyse factorielle des correspondances multiples. NIPALS sera présentée comme illustration de la gestion de données manquantes quantitatives. L’analyse en composantes principales fonctionnelles pourra également être présentée comme ouverture vers les données fonctionnelles. Ces techniques reposent sur l’analyse de relations simples entre variables basées sur l’utilisation de distances adéquates en fonction du type de données (distance euclidienne, distance du chi-deux, distance ad hoc…).
En ce qui concerne le clustering, la démarche de construction d’une classification sera développée autour des techniques de classification ascendante hiérarchique, de classification non hiérarchique (centres mobiles, nuées dynamiques) et de classification mixte. La recherche de formes stables et leur caractérisation seront abordées.
L’analyse exploratoire conduit souvent à des représentations graphiques. Cet enseignement cherchera également à développer une expérience dans la conception de synthèses graphiques riches.