Afficher la notice abrégée

dc.rights.licenseopenen_US
dc.contributor.advisorJérôme Saracco (Jerome.Saracco@math.u-bordeaux1.fr, Président)
hal.structure.identifierStatistics In System biology and Translational Medicine [SISTM]
hal.structure.identifierBordeaux population health [BPH]
dc.contributor.authorAVALOS FERNANDEZ, Marta
dc.contributor.otherStéphane Canu (stephane.canu@insa-rouen.fr, Rapporteur)en_US
dc.contributor.otherPascale Tubert-Bitter (pascale.tubert@inserm.fr, Rapporteur)en_US
dc.contributor.otherMalu Calle-Rosingana (malu.calle@uvic.cat, Rapporteur)en_US
dc.contributor.otherCécile Delcourt (cecile.delcourt@u-bordeaux.fr, Examinateur)en_US
dc.contributor.otherRodolphe Thiébaut (rodolphe.thiebaut@u-bordeaux.fr, Garant)en_US
dc.contributor.otherEmmanuel Lagarde (emmanuel.lagarde@u-bordeaux.fr, Invité)en_US
dc.date2018-12-11
dc.date.accessioned2021-04-22T12:47:07Z
dc.date.available2021-04-22T12:47:07Z
dc.identifier.urihttps://oskar-bordeaux.fr/handle/20.500.12278/27041
dc.description.abstractMes travaux portent principalement sur le développement, l’adaptation, l’implémentation et l’application de méthodes statistiques de sélection de modèle. Ma principale contribution consiste à adapter des méthodes de l'apprentissage statistique supervisé qui sont devenues très populaires lors de la dernière décennie, les régressions pénalisées de type Lasso, à l'analyse de données issues d'études épidémiologiques. L'enjeu est de s'attaquer aux problèmes des données volumineuses (\textit{Big Data}) tout en respectant les objectifs et spécificités de la discipline. Le volume important se réfère ici au fait que le nombre d'observations et/ou le nombre de variables est bien plus important que celui qui était classique dans le domaine, sans exclure le cas où le nombre de variables est supérieur au nombre d'observations (données de grande dimension). Le contexte de la pratique épidémiologique est en plein changement avec les évolutions technologiques et la conséquente disponibilité croissante des Big Data. Le Système National des Données de Santé (SNDS), regroupant les principales bases de données de santé publique existantes en France, constitue un exemple de Big Data en santé. Le données ``omiques'' (génomiques, transcriptomiques, protéomiques, métabolomiques, microbiomiques, mycobiomiques, viromiques,$\ldots$) issues des avancées des techniques de séquençage à haut débit constituent un autre exemple de Big Data en santé. Enfin, les mesures de l'\textit{exposome} (par opposition aux facteurs génétiques), qui désigne en épidémiologie l’ensemble des expositions environnementales que subit un individu au long de sa vie peut également constituer une source de Big Data.Ce document s'articule autour de trois chapitres. Il résume mon activité de recherche depuis 2005, soit depuis mon recrutement à l’Université de Bordeaux après ma thèse. Le premier chapitre est une introduction générale dans laquelle je contextualise, motive et énonce la problématique abordée tout au long de mes recherches. Le deuxième chapitre est consacré à mes travaux en lien avec les études sur les traumatismes accidentels et expositions médicamenteuses à partir des données du SNDS. Le troisième chapitre est consacré à mes travaux en lien avec des études biomédicales: la prédiction de la charge virale censurée par un seuil de détection à partir des mutations du VIH, d'une part, et l'automatisation de la détection des seuils d'anomalie des hémogrammes en population générale, d'autre part.
dc.language.isoENen_US
dc.subjectSélection de modèle
dc.subjectsélection de variables
dc.subjectLasso
dc.subjectépidémiologie
dc.subject.enModel selection
dc.subject.envariable selection
dc.subject.enepidemiology
dc.titleContribution à la sélection de modèle via pénalisation Lasso en Épidémiologie
dc.title.enContribution to model selection via Lasso penalization in Epidemiology
dc.typeHDRen_US
dc.subject.halStatistiques [stat]/Machine Learning [stat.ML]en_US
dc.subject.halStatistiques [stat]/Méthodologie [stat.ME]en_US
dc.subject.halStatistiques [stat]/Calcul [stat.CO]en_US
dc.subject.halStatistiques [stat]/Applications [stat.AP]en_US
dc.subject.halInformatique [cs]/Apprentissage [cs.LG]en_US
dc.subject.halSciences du Vivant [q-bio]/Santé publique et épidémiologieen_US
bordeaux.hal.laboratoriesBordeaux Population Health Research Center (BPH) - UMR 1219en_US
bordeaux.institutionUniversité de Bordeauxen_US
bordeaux.institutionINSERMen_US
bordeaux.type.institutionUniversité de Bordeauxen_US
bordeaux.import.sourcehal
hal.identifiertel-01964508
hal.version1
hal.exportfalse
workflow.import.sourcehal
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Contribution%20%C3%A0%20la%20s%C3%A9lection%20de%20mod%C3%A8le%20via%20p%C3%A9nalisation%20Lasso%20en%20%C3%89pid%C3%A9miologie&rft.atitle=Contribution%20%C3%A0%20la%20s%C3%A9lection%20de%20mod%C3%A8le%20via%20p%C3%A9nalisation%20Lasso%20en%20%C3%89pid%C3%A9miologie&rft.au=AVALOS%20FERNANDEZ,%20Marta&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée