Afficher la notice abrégée

dc.contributor.advisorBenois Pineau, Jenny
dc.contributor.advisorBen Amar, Chokri
dc.contributor.authorCHAABOUNI, Souad
dc.contributor.otherChtourou, Mohamed
dc.date2017-12-08
dc.identifier.urihttp://www.theses.fr/2017BORD0768/abes
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-02408326
dc.identifier.nnt2017BORD0768
dc.description.abstractCette thèse est motivée par le diagnostic et l’évaluation des maladies neuro-dégénératives et dans le but de diagnostique sur la base de l’attention visuelle.Néanmoins, le dépistage à grande échelle de la population n’est possible que si des modèles de prédiction automatique suffisamment robustes peuvent être construits. Dans ce contexte nous nous intéressons `a la conception et le développement des modèles de prédiction automatique pour un contenu visuel spécifique à utiliser dans l’expérience psycho-visuelle impliquant des patients atteints des maladies neuro-dégénératives. La difficulté d’une telle prédiction réside dans une très faible quantité de données d’entraînement. Les modèles de saillance visuelle ne peuvent pas être fondés sur les caractérisitiques “bottom-up” uniquement, comme le suggère la théorie de l’intégration des caractéristiques. La composante “top-down” de l’attention visuelle humaine devient prépondérante au fur et à mesure d’observation de la scène visuelle. L’attention visuelle peut-être prédite en se basant sur les scènes déjà observées. Les réseaux de convolution profonds (CNN) se sont révèlés être un outil puissant pour prédire les zones saillantes dans les images statiques.Dans le but de construire un modèle de prédiction automatique pour les zones saillantes dans les vidéos naturels et intentionnellement dégradées, nous avons conçu une architecture spécifique de CNN profond. Pour surmonter le manque de données d’apprentissage,nous avons conçu un système d’apprentissage par transfert dérivé de la méthode de Bengio.Nous mesurons ses performances lors de la prédiction de régions saillantes. Les r´esultatsobtenus sont int´eressants concernant la r´eaction des sujets t´emoins normaux contre leszones d´egrad´ees dans les vid´eos. La comparaison de la carte de saillance pr´edite des vid´eosintentionnellement d´egrad´ees avec des cartes de densit´e de fixation du regard et d’autresmod`eles de r´ef´erence montre l’int´erˆet du mod`ele d´evelopp´e.
dc.description.abstractEnThis thesis is motivated by the diagnosis and the evaluation of the dementia diseasesand with the aim of predicting if a new recorded gaze presents a complaint of thesediseases. Nevertheless, large-scale population screening is only possible if robust predictionmodels can be constructed. In this context, we are interested in the design and thedevelopment of automatic prediction models for specific visual content to be used in thepsycho-visual experience involving patients with dementia (PwD). The difficulty of sucha prediction lies in a very small amount of training data.Visual saliency models cannot be founded only on bottom-up features, as suggested byfeature integration theory. The top-down component of human visual attention becomesprevalent as human observers explore the visual scene. Visual saliency can be predictedon the basis of seen data. Deep Convolutional Neural Networks (CNN) have proven tobe a powerful tool for prediction of salient areas in static images. In order to constructan automatic prediction model for the salient areas in natural and intentionally degradedvideos, we have designed a specific CNN architecture. To overcome the lack of learningdata we designed a transfer learning scheme derived from bengio’s method. We measureits performances when predicting salient regions. The obtained results are interestingregarding the reaction of normal control subjects against degraded areas in videos. Thepredicted saliency map of intentionally degraded videos gives an interesting results comparedto gaze fixation density maps and other reference models.
dc.language.isofr
dc.subjectR´eseaux de convolution profond
dc.subjectApprentissage par transfert
dc.subjectVi- sion par ordinateur
dc.subjectModèle de saillance
dc.subjectAttention visuelle
dc.subjectMaladies neuro- dégénératives
dc.subjectMouvement r´esiduel,
dc.subjectMouvement r´esiduel, vid´eos naturels
dc.subject.enDeep convolutional networks
dc.subject.enTransfer learning
dc.subject.enComputer vision
dc.subject.enSaliency models
dc.subject.enVisual attention
dc.subject.enNeuro-degenerative diseases
dc.subject.enResidual mo- tion
dc.subject.enNatural videos
dc.titleEtude et prédiction d'attention visuelle avec les outils d'apprentissage profond en vue d'évaluation des patients atteints des maladies neuro-dégénératives
dc.title.enStudy and prediction of visual attention with deep learning net- works in view of assessment of patients with neurodegenerative diseases
dc.typeThèses de doctorat
dc.contributor.jurypresidentLe Callet, Patrick
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.type.institutionBordeaux
bordeaux.type.institutionUniversité de Sfax (Tunisie)
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleLaboratoire de mathématiques et d'informatique (Bordeaux)
star.origin.linkhttps://www.theses.fr/2017BORD0768
dc.contributor.rapporteurPrecioso, Frédéric
dc.contributor.rapporteurEssoukri Ben Amara, Najoua
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Etude%20et%20pr%C3%A9diction%20d'attention%20visuelle%20avec%20les%20outils%20d'apprentissage%20profond%20en%20vue%20d'%C3%A9valuation%20des%20patients%20atteints%20des%2&rft.atitle=Etude%20et%20pr%C3%A9diction%20d'attention%20visuelle%20avec%20les%20outils%20d'apprentissage%20profond%20en%20vue%20d'%C3%A9valuation%20des%20patients%20atteints%20des%&rft.au=CHAABOUNI,%20Souad&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée