Mostrar el registro sencillo del ítem

dc.contributor.advisorMelançon, Guy
dc.contributor.advisorGiot, Romain
dc.contributor.authorDELASSUS, Rémi
dc.contributor.otherUrruty, Thierry
dc.date2018-11-23
dc.identifier.urihttp://www.theses.fr/2018BORD0230/abes
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-02100741
dc.identifier.nnt2018BORD0230
dc.description.abstractDans cette thèse nous étudions le problème de détection d’anomalies dans les données ouvertes utilisées par l’entreprise Qucit ; aussi bien les données métiers de ses clients, que celles permettant de les contextualiser. Dans un premier temps, nous nous sommes intéressés à la détection de vélos défectueux au sein des données de trajets du système de vélo en libre service de New York. Nous cherchons des données reflétant une anomalie dans la réalité. Des caractéristiques décrivant le comportement de chaque vélo observé sont partitionnés. Les comportements anormaux sont extraits depuis ce partitionnement et comparés aux rapports mensuels indiquant le nombre de vélos réparés ; c’est un problème d’apprentissage à sortie agrégée. Les résultats de ce premier travail se sont avérés insatisfaisant en raison de la pauvreté des données. Ce premier volet des travaux a ensuite laissé place à une problématique tournée vers la détection de bâtiments au sein d’images satellites. Nous cherchons des anomalies dans les données géographiques qui ne reflètent pas la réalité. Nous proposons une méthode de fusion de modèles de segmentation améliorant la métrique d’erreur jusqu’à +7% par rapport à la méthode standard. Nous évaluons la robustesse de notre modèle face à la suppression de bâtiments dans les étiquettes, afin de déterminer à quel point les omissions sont susceptibles d’en altérer les résultats. Ce type de bruit est communément rencontré au sein des données OpenStreetMap, régulièrement utilisées par Qucit, et la robustesse observée indique qu’il pourrait être corrigé.
dc.description.abstractEnIn this thesis we study the problem of anomaly detection in the open data used by the Qucit company, both the business data of its customers, as well as those allowing to contextualize them.We are looking for data that reflects an anomaly in reality. Initially, we were interested in detecting defective bicycles in the trip data of New York’s bike share system. Characteristics describing the behaviour of each observed bicycle are clustered. Abnormal behaviors are extracted from this clustering and compared to monthly reports indicating the number of bikes repaired; this is an aggregate learning problem. The results of this first work were unsatisfactory due to the paucity of data. This first part of the work then gave way to a problem focused on the detection of buildings within satellite images. We are looking for anomalies in the geographical data that do not reflect reality. We propose a method of merging segmentation models that improves the error metric by up to +7% over the standard method. We assess the robustness of our model to the removal of buildings from labels to determine the extent to which omissions are likely to alter the results. This type of noise is commonly encountered within the OpenStreetMap data, regularly used by Qucit, and the robustness observed indicates that it could be corrected.
dc.language.isofr
dc.subjectApprentissage Profond
dc.subjectSegmentation d'Images
dc.subjectImages Satellites
dc.subjectApprentissage Automatique
dc.subjectDétection d'Objets
dc.subjectDonnées Ouvertes
dc.subject.enDeep Learning
dc.subject.enImage Segmentation
dc.subject.enSatellite Images
dc.subject.enMachine Learning
dc.subject.enObject Detection
dc.subject.enOpen Data
dc.titleApprentissage automatique pour la détection d'anomalies dans les données ouvertes : application à la cartographie
dc.title.enSatellite images analysis for anomaly detection in open geographical data.
dc.typeThèses de doctorat
dc.contributor.jurypresidentLepetit, Vincent
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....)
bordeaux.teamModèles et Algorithmes pour la Bioformatique et la Visualisation d'Informations
star.origin.linkhttps://www.theses.fr/2018BORD0230
dc.contributor.rapporteurCardot, Hubert
dc.contributor.rapporteurIenco, Dino
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Apprentissage%20automatique%20pour%20la%20d%C3%A9tection%20d'anomalies%20dans%20les%20donn%C3%A9es%20ouvertes%20:%20application%20%C3%A0%20la%20cartographie&rft.atitle=Apprentissage%20automatique%20pour%20la%20d%C3%A9tection%20d'anomalies%20dans%20les%20donn%C3%A9es%20ouvertes%20:%20application%20%C3%A0%20la%20cartographie&rft.au=DELASSUS,%20Re%CC%81mi&rft.genre=unknown


Archivos en el ítem

ArchivosTamañoFormatoVer

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem