L'apprentissage statistique dans la prédiction des comportements suicidaires chez les adolescents et jeunes adultes
Langue
fr
Thèses de doctorat
Date de soutenance
2022-01-14Spécialité
Santé publique Option Biostatistiques
École doctorale
École doctorale Sociétés, politique, santé publique (Bordeaux)Résumé
Le suicide fait partie des premières causes de mortalité dans le monde, et les jeunes de 15 à 29 ans sont particulièrement touchés, puisque, au niveau mondial, il s’agit de la quatrième cause de décès dans cette tranche ...Lire la suite >
Le suicide fait partie des premières causes de mortalité dans le monde, et les jeunes de 15 à 29 ans sont particulièrement touchés, puisque, au niveau mondial, il s’agit de la quatrième cause de décès dans cette tranche d’âge. La problématique suicidaire a fait l’objet de nombreuses études épidémiologiques, ce qui a permis l’identification de facteurs de risques proximaux (victimisation, consommation d’alcool...) et distaux (âge gestationnel, dépression maternelle. . .). Pourtant, malgré l’apport de ces informations sur l’étiologie du suicide, les facteurs de risque identifiés jusqu’à présent n’ont pas permis une prédiction satisfaisante des comportements suicidaires (idéations et tentatives de suicide). Un changement de paradigme, avec des modèles statistiques adaptés à la prédiction et supportant un grand nombre de variables simultanément, pourrait permettre une meilleure identification des jeunes à risque. L’objectif de cette thèse était d’étudier la prédiction des comportements suicidaires chez les jeunes, en utilisant des méthodes d’apprentissage statistique. Ces travaux ont été réalisés avec 3 grandes cohortes de population générale, deux cohortes canadiennes, l’Étude Longitudinale du Développement des Enfants du Québec (ÉLDEQ) et l’Étude Longitudinale des Enfants de Maternelle du Québec (ÉLEMQ), et la cohorte étudiante française internet-based Students HeaAlth Research Enterprise (i-Share). Des modèles de prédiction ont été construits avec des méthodes d’ensemble : les forêts aléatoires. La première étude de ces travaux de thèse avait pour objectif de prédire les tentatives de suicide rapportées, entre 13 et 20 ans, par les adolescents de la cohorte ÉLDEQ, en utilisant des facteurs périnataux (intra-utérins, natals et jusqu’aux 5 premiers mois de vie). Ces facteurs, bien qu’importants dans l’étiologie du suicide, n’ont permis qu’une prédiction limitée des tentatives de suicide à l’adolescence. La deuxième étude s’est intéressée au pouvoir prédictif de 38 symptômes émotionnels et comportementaux, évalués par l’adolescent, la mère et l’enseignant à 12/13 ans, des jeunes de la cohorte ÉLEMQ. Dans l’ensemble, la qualité de prédiction des comportements suicidaires à l’âge de 15 ans, à partir de ces 38 symptômes, était faible à moyenne. Des différences ont été identifiées en fonctions de l’évaluateur des symptômes et de l’évènement considéré (idéations ou tentative de suicide), tant dans la qualité de la prédiction, que dans l’importance des symptômes dans la prédiction. Les évaluations de l’enseignant, avec 3 symptômes d’anxiété, permettaient la meilleure prédiction des idéations suicidaires, alors que les évaluations de la mère et de l’adolescent, avec des symptômes d’inattention et d’opposition, permettaient les meilleures prédictions des tentatives de suicide. La troisième étude cherchait à prédire les comportements suicidaires chez les étudiants français de la cohorte i-Share. À partir de différentes caractéristiques socioéconomiques, familiales, de santé (physique et mentale) et des habitudes de vie, recueillies à l’inclusion dans la cohorte, nous avons obtenu de bonnes performances de prédiction des comportements suicidaires un an plus tard. Les facteurs les plus importants pour la prédiction étaient : le niveau de dépression, d’anxiété et d’estime de soi. Dans l’ensemble, ces travaux montrent que la prédiction des comportements suicidaires est meilleure en utilisant des informations proximales plutôt que distales. De plus, les résultats indiquent que les facteurs contribuant à l’étiologie du suicide ne sont pas nécessairement des facteurs permettant l’identification des jeunes à risque. Ces travaux montrent l’intérêt des modèles d’apprentissage statistique dans le développement d’algorithmes permettant l’identification des jeunes à risque de comportements suicidaires. Ces algorithmes pourraient s’ajouter aux outils à disposition des professionnels de la santé impliqués dans la prévention du suicide.< Réduire
Résumé en anglais
Suicide is one of the leading causes of death worldwide. Youth aged 15 to 29 years are particularly vulnerable, and suicide represents the fourth cause of death in this population. Suicide has been investigated in many ...Lire la suite >
Suicide is one of the leading causes of death worldwide. Youth aged 15 to 29 years are particularly vulnerable, and suicide represents the fourth cause of death in this population. Suicide has been investigated in many epidemiological studies that identified numerous proximal (e.g. victimization, alcohol abuse, . . .) and distal (e.g. gestational age, maternal depression, . . .) risk factors. However, despite the importance of such information in the understanding of suicide etiology, the identified risk factors have not resulted in significant improvement in our ability to predict suicidal behaviors (suicidal ideations and attempt). To improve the identification of youth at risk of suicide, research will benefit from a paradigm shift involving the use of machine learning models that simultaneously considered many variables. The objective of the current thesis was to use machine learning models for the prediction of youth suicidal behaviors. We used data from 3 different population-based cohorts, two Canadian cohorts : the Québec Longitudinal study of Child Development (QLSCD) and the Québec Longitudinal Study of Kindergarten Children (QLSKC) ; and one French cohort : the internet-based Students HeaAlth Research Enterprise cohort (i–Share). We used random forest algorithm, a non-parametric ensemble method, to create the predictive models. The aim of the first study of this thesis was to predict suicide attempt reported by adolescents aged 13 to 20 years in the QLSCD cohort using early-life factors (in-utero, birth and related to the first 5 months of life) as predictors. The findings suggested that, although these factors may be important in the etiology of suicide, their role in the long-term prediction of suicide attempt is limited. The second study investigated the predictive ability of 38 emotional and behavioral symptoms, assessed by adolescents, mothers and teachers at age 12/13 years participating in the QLSKC cohort. Overall, using the 38 symptoms, the prediction of suicidal behaviors of adolescents at age 15 years was of low to moderate accuracy. We identified differences in both prediction performances and symptoms’ importance in the prediction depending on the informant and on the outcome considered (suicidal ideations or suicide attempt). Teachers’ assessment of 3 symptoms related to anxiety, allowed the best prediction of suicidal ideations, while adolescents’ and mothers’ assessments of symptoms related to inattention and opposition-disruptiveness, allowed the best predictions of suicide attempt. Finally, the aim of the third study was to predict suicidal behaviors in the i-Share cohort. Using several variable related to socio-economic, family, mental and physical health, and life habits, reported by students at the inclusion in the cohort, we predicted suicidal behaviors one year later with good accuracy. The most predictive factors were the levels of depression, anxiety and self-esteem. Overall, the results obtained within this thesis show a better prediction of suicidal behaviors using proximal, instead of distal, information. Also, the results indicate that factors contributing to the etiology of suicide may be insufficient to identify youth at risk. This work demonstrates the interest of machine learning in the development of algorithms allowing the identification of youth at risk of suicidal behaviors. These algorithms may be added to the tools used by health professionals to prevent suicide.< Réduire
Mots clés
Apprentissage statistique
Suicide
Jeune adulte
Prediction
Adolescent
Mots clés en anglais
Young adults
Machine learning
Prediction
Suicide
Adolescents
Origine
Importé de STARUnités de recherche