Classification de variables : le package ClustOfVar
Langue
fr
Communication dans un congrès
Ce document a été publié dans
43èmes Journées de Statistique (SFdS), 43èmes Journées de Statistique (SFdS), 43èmes Journées de Statistique (SFdS), 2011-05-23, Tunis. 2011p. 6 p.
Résumé
Le package R ClustOfVar a été développé spécifiquement pour répondre au problème de la classification de variables. Les variables considérées peuvent être toutes quantitatives, toutes qualitatives ou un mélange des deux. ...Lire la suite >
Le package R ClustOfVar a été développé spécifiquement pour répondre au problème de la classification de variables. Les variables considérées peuvent être toutes quantitatives, toutes qualitatives ou un mélange des deux. Le critère d'homogénéité d'une classe est la somme des carrés des corrélations (pour les variables quantitatives) et des rapports de corrélations (pour les variables qualitatives) à une variable synthétique (quantitative) résumant au mieux les variables de la classe. La variable synthétique qui maximise ce critère est la première composante principale calculée par la méthode PCAMIX. Deux algorithmes sont proposés : un algorithme de classification ascendante hiérarchique et un algorithme de partitionnement de type k-means. Une approche de type bootstrap est proposée pour l'aide au choix du nombre de classes. Les différentes méthodologies sont illustrées sur des données réelles.< Réduire
Mots clés en italien
ALGORITHME
METHODOLOGIE
CLASSIFICATION
CORRELATION
Origine
Importé de halUnités de recherche