Contribution à la sélection de modèle via pénalisation Lasso en Épidémiologie
dc.rights.license | open | en_US |
dc.contributor.advisor | Jérôme Saracco (Jerome.Saracco@math.u-bordeaux1.fr, Président) | |
hal.structure.identifier | Statistics In System biology and Translational Medicine [SISTM] | |
hal.structure.identifier | Bordeaux population health [BPH] | |
dc.contributor.author | AVALOS FERNANDEZ, Marta | |
dc.contributor.other | Stéphane Canu (stephane.canu@insa-rouen.fr, Rapporteur) | en_US |
dc.contributor.other | Pascale Tubert-Bitter (pascale.tubert@inserm.fr, Rapporteur) | en_US |
dc.contributor.other | Malu Calle-Rosingana (malu.calle@uvic.cat, Rapporteur) | en_US |
dc.contributor.other | Cécile Delcourt (cecile.delcourt@u-bordeaux.fr, Examinateur) | en_US |
dc.contributor.other | Rodolphe Thiébaut (rodolphe.thiebaut@u-bordeaux.fr, Garant) | en_US |
dc.contributor.other | Emmanuel Lagarde (emmanuel.lagarde@u-bordeaux.fr, Invité) | en_US |
dc.date | 2018-12-11 | |
dc.date.accessioned | 2021-04-22T12:47:07Z | |
dc.date.available | 2021-04-22T12:47:07Z | |
dc.identifier.uri | https://oskar-bordeaux.fr/handle/20.500.12278/27041 | |
dc.description.abstract | Mes travaux portent principalement sur le développement, l’adaptation, l’implémentation et l’application de méthodes statistiques de sélection de modèle. Ma principale contribution consiste à adapter des méthodes de l'apprentissage statistique supervisé qui sont devenues très populaires lors de la dernière décennie, les régressions pénalisées de type Lasso, à l'analyse de données issues d'études épidémiologiques. L'enjeu est de s'attaquer aux problèmes des données volumineuses (\textit{Big Data}) tout en respectant les objectifs et spécificités de la discipline. Le volume important se réfère ici au fait que le nombre d'observations et/ou le nombre de variables est bien plus important que celui qui était classique dans le domaine, sans exclure le cas où le nombre de variables est supérieur au nombre d'observations (données de grande dimension). Le contexte de la pratique épidémiologique est en plein changement avec les évolutions technologiques et la conséquente disponibilité croissante des Big Data. Le Système National des Données de Santé (SNDS), regroupant les principales bases de données de santé publique existantes en France, constitue un exemple de Big Data en santé. Le données ``omiques'' (génomiques, transcriptomiques, protéomiques, métabolomiques, microbiomiques, mycobiomiques, viromiques,$\ldots$) issues des avancées des techniques de séquençage à haut débit constituent un autre exemple de Big Data en santé. Enfin, les mesures de l'\textit{exposome} (par opposition aux facteurs génétiques), qui désigne en épidémiologie l’ensemble des expositions environnementales que subit un individu au long de sa vie peut également constituer une source de Big Data.Ce document s'articule autour de trois chapitres. Il résume mon activité de recherche depuis 2005, soit depuis mon recrutement à l’Université de Bordeaux après ma thèse. Le premier chapitre est une introduction générale dans laquelle je contextualise, motive et énonce la problématique abordée tout au long de mes recherches. Le deuxième chapitre est consacré à mes travaux en lien avec les études sur les traumatismes accidentels et expositions médicamenteuses à partir des données du SNDS. Le troisième chapitre est consacré à mes travaux en lien avec des études biomédicales: la prédiction de la charge virale censurée par un seuil de détection à partir des mutations du VIH, d'une part, et l'automatisation de la détection des seuils d'anomalie des hémogrammes en population générale, d'autre part. | |
dc.language.iso | EN | en_US |
dc.subject | Sélection de modèle | |
dc.subject | sélection de variables | |
dc.subject | Lasso | |
dc.subject | épidémiologie | |
dc.subject.en | Model selection | |
dc.subject.en | variable selection | |
dc.subject.en | epidemiology | |
dc.title | Contribution à la sélection de modèle via pénalisation Lasso en Épidémiologie | |
dc.title.en | Contribution to model selection via Lasso penalization in Epidemiology | |
dc.type | HDR | en_US |
dc.subject.hal | Statistiques [stat]/Machine Learning [stat.ML] | en_US |
dc.subject.hal | Statistiques [stat]/Méthodologie [stat.ME] | en_US |
dc.subject.hal | Statistiques [stat]/Calcul [stat.CO] | en_US |
dc.subject.hal | Statistiques [stat]/Applications [stat.AP] | en_US |
dc.subject.hal | Informatique [cs]/Apprentissage [cs.LG] | en_US |
dc.subject.hal | Sciences du Vivant [q-bio]/Santé publique et épidémiologie | en_US |
bordeaux.hal.laboratories | Bordeaux Population Health Research Center (BPH) - UMR 1219 | en_US |
bordeaux.institution | Université de Bordeaux | en_US |
bordeaux.institution | INSERM | en_US |
bordeaux.type.institution | Université de Bordeaux | en_US |
bordeaux.import.source | hal | |
hal.identifier | tel-01964508 | |
hal.version | 1 | |
hal.export | false | |
workflow.import.source | hal | |
bordeaux.COinS | ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Contribution%20%C3%A0%20la%20s%C3%A9lection%20de%20mod%C3%A8le%20via%20p%C3%A9nalisation%20Lasso%20en%20%C3%89pid%C3%A9miologie&rft.atitle=Contribution%20%C3%A0%20la%20s%C3%A9lection%20de%20mod%C3%A8le%20via%20p%C3%A9nalisation%20Lasso%20en%20%C3%89pid%C3%A9miologie&rft.au=AVALOS%20FERNANDEZ,%20Marta&rft.genre=unknown |
Files in this item
Files | Size | Format | View |
---|---|---|---|
There are no files associated with this item. |