La visualisation d’information pour les données massives : une approche par l’abstraction de données
Langue
fr
Thèses de doctorat
Date de soutenance
2017-07-04Spécialité
Informatique
École doctorale
École doctorale de mathématiques et informatique (Talence, Gironde)Résumé
L’évolution et la démocratisation des technologies ont engendré une véritable explosion de l’information et notre capacité à générer des données et le besoin de les analyser n’a jamais été aussi important. Pourtant, les ...Lire la suite >
L’évolution et la démocratisation des technologies ont engendré une véritable explosion de l’information et notre capacité à générer des données et le besoin de les analyser n’a jamais été aussi important. Pourtant, les problématiques soulevées par l’accumulation de données (stockage, temps de traitement, hétérogénéité, vitesse de captation/génération, etc. ) sont d’autant plus fortes que les données sont massives, complexes et variées. La représentation de l’information, de part sa capacité à synthétiser et à condenser des données, se constitue naturellement comme une approche pour les analyser mais ne résout pas pour autant ces problèmes. En effet, les techniques classiques de visualisation sont rarement adaptées pour gérer et traiter cette masse d’informations. De plus,les problèmes que soulèvent le stockage et le temps de traitement se répercutent sur le système d’analyse avec par exemple, la distanciation de plus en plus forte entre la donnée et l’utilisateur : le lieu où elle sera stockée et traitée et l’interface utilisateur servant à l’analyse. Dans cette thèse nous nous intéressons à ces problématiques et plus particulièrement à l’adaptation des techniques de visualisation d’informations pour les données massives. Pour cela, nous nous intéressons tout d’abord à l’information de relation entre éléments, comment est-elle véhiculée et comment améliorer cette transmission dans le contexte de données hiérarchisées. Ensuite, nous nous intéressons à des données multivariées,dont la complexité à un impact sur les calculs possibles. Enfin, nous présentons les approches mises en oeuvre pour rendre nos méthodes compatibles avec les données massives.< Réduire
Résumé en anglais
The evolution and spread of technologies have led to a real explosion of information and our capacity to generate data and our need to analyze them have never been this strong. Still, the problems raised by such accumulation ...Lire la suite >
The evolution and spread of technologies have led to a real explosion of information and our capacity to generate data and our need to analyze them have never been this strong. Still, the problems raised by such accumulation (storage, computation delays, diversity, speed of gathering/generation, etc. ) is as strong as the data are big, complex and varied. Information visualization,by its ability to summarize and abridge data was naturally established as appropriate approach. However, it does not solve the problem raised by Big Data. Actually, classical visualization techniques are rarely designed to handle such mass of information. Moreover, the problems raised by data storage and computation time have repercussions on the analysis system. For example,the increasing distance between the data and the analyst : the place where the data is stored and the place where the user will perform the analyses arerarely close. In this thesis, we focused on these issues and more particularly on adapting the information visualization techniques for Big Data. First of all focus on relational data : how does the existence of a relation between entity istransmitted and how to improve this transmission for hierarchical data. Then,we focus on multi-variate data and how to handle their complexity for the required computations. Finally, we present the methods we designed to make our techniques compatible with Big Data.< Réduire
Mots clés
Visualisation d’information
Exploration
Données massives
Données relationnelles
Données multivariées
Données hiérarchiques
Graphes orientés pondérés
Mots clés en anglais
Information visualization
Data exploration
Big data
Relational data
Multivariate data
Hierarchical data
Directed weighted graphs
Origine
Importé de STAR
Publications correspondantes
Affichage des publications liées par titre, auteur, créateur et discipline
-
Le cadre de l’expérience des données en éducation : gouvernance, représentations et intelligibilité des données dans l’éducation nationale
LEHMANS, Anne; CAPELLE, CamilleDocument de travail - Pré-publicationLibre accès -
L'autre côté du miroir : une thèse d’histoire du droit des affaires à l’époque moderne, du document à la donnée et de la donnée au document
LE BRETON-BLON, Victor(Le document, parent pauvre de la donnée, Le document, parent pauvre de la donnée, fr, Pessac, 2019-06-21)Autre communication scientifique (congrès sans actes - poster - séminaire...) -
Bases de données et fouille de données chez les levures hémiascomycètes
SHERMAN, David JamesCommunication dans un congrès