Compétitions d'apprentissage automatique avec le package R rchallenge
TODESCHINI, Adrien
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
GENUER, Robin
Institut de Santé Publique, d'Epidémiologie et de Développement [ISPED]
Statistics In System biology and Translational Medicine [SISTM]
Institut de Santé Publique, d'Epidémiologie et de Développement [ISPED]
Statistics In System biology and Translational Medicine [SISTM]
TODESCHINI, Adrien
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
Institut de Mathématiques de Bordeaux [IMB]
Quality control and dynamic reliability [CQFD]
GENUER, Robin
Institut de Santé Publique, d'Epidémiologie et de Développement [ISPED]
Statistics In System biology and Translational Medicine [SISTM]
< Réduire
Institut de Santé Publique, d'Epidémiologie et de Développement [ISPED]
Statistics In System biology and Translational Medicine [SISTM]
Langue
fr
Communication dans un congrès
Ce document a été publié dans
47èmes Journées de Statistique de la SFdS, 2015-06-01, Lille. 2015-06
Résumé
En apprentissage automatique, les performances empiriques obtenues sur données réelles sont déterminantes dans le succès d'une méthode. Ces dernières années ont vu l'apparition d'un grand nombre de compétitions d'apprentissage ...Lire la suite >
En apprentissage automatique, les performances empiriques obtenues sur données réelles sont déterminantes dans le succès d'une méthode. Ces dernières années ont vu l'apparition d'un grand nombre de compétitions d'apprentissage automatique. Ces challenges sont motivés par des applications industrielles (prix Netflix) ou académiques (challenge HiggsML) et mettent en compétition chercheurs et data scientists pour obtenir les meilleures performances. Nous avons souhaité confronter les étudiants à cette réalité en leur soumettant un challenge dans le cadre du cours d'apprentissage automatique. Leur classement est affiché sur une page web mise à jour automatiquement permettant une émulation parmi les étudiants. L'historique des résultats leur permet également de visualiser leur progression au fil des soumissions. De plus, le challenge peut se poursuivre en dehors des sessions encadrées favorisant l'autonomie et l'exploration de nouvelles techniques d'apprentissage et outils informatiques. Le système que nous avons mis en œuvre est disponible sous forme de package R afin d'être réutilisé par d'autres enseignants. S'appuyant sur les outils R Markdown et Dropbox, il ne nécessite aucune configuration réseau et peut être déployé très facilement sur un ordinateur personnel.< Réduire
Résumé en anglais
In machine learning, empirical performance on real data are crucial in the success of a method. Recent years have seen the emergence of a large number of machine learning competitions. These challenges are motivated by ...Lire la suite >
In machine learning, empirical performance on real data are crucial in the success of a method. Recent years have seen the emergence of a large number of machine learning competitions. These challenges are motivated by industrial (Netflix prize) or academic (HiggsML challenge) applications and put in competition researchers and data scientists to obtain the best performance. We wanted to expose students to this reality bysubmitting a challenge in the context of the machine learning course. The leaderboard is displayed on an automatically updated web page allowing emulation among students. The history of the results also allows them to visualize their progress through the submissions. In addition, the challenge can continue outside of the supervised sessions promoting independence and exploration of new learning techniques and computer tools. The system we have implemented is available as an R package for reuse by other teachers. Building on the R Markdown and Dropbox tools, it requires no network configuration and can be deployed very easily on a personal computer.< Réduire
Mots clés
appentissage automatique
enseignement
package R
Mots clés en anglais
machine learning
competition
teaching
R package
Origine
Importé de halUnités de recherche