Dépendances fonctionnelles : extraction et exploitation
Langue
fr
Thèses de doctorat
Date de soutenance
2013-11-19Spécialité
Informatique
École doctorale
École doctorale de mathématiques et informatique (Talence, Gironde)Résumé
Les dépendances fonctionnelles fournissent une information sémantique sur les données d’une table en mettant en lumière les liens de corrélation qui les unient. Dans cette thèse, nous traitons du problème de l’extraction ...Lire la suite >
Les dépendances fonctionnelles fournissent une information sémantique sur les données d’une table en mettant en lumière les liens de corrélation qui les unient. Dans cette thèse, nous traitons du problème de l’extraction de ces dépendances en proposant un contexte unifié permettant la découverte de n’importe quel type de dépendances fonctionnelles (dépendances de clé, dépendances fonctionnelles conditionnelles, que la validité soit complète ou approximative). Notre algorithme, ParaCoDe, s’exécute en parallèle sur les candidats, réduisant ainsi le temps global de calcul. De ce fait, il est très compétitif vis-à-vis des approches séquentielles connues à ce jour. Les dépendances satisfaites sur une table nous servent à résoudre le problème de la matérialisation partielle du cube de données. Nous présentons une caractérisation de la solution optimale dans laquelle le coût de chaque requête est borné par un seuil de performance fixé préalablement et dont la taille est minimale. Cette spécification de la solution donne un cadre unique pour décrire et donc comparer formellement les techniques de résumé de cubes de données.< Réduire
Résumé en anglais
Functional dependancies provide a semantic information over data from a table to exhibit correlation links. In this thesis, we deal with the dependancy discovery problem by proposing a unified context to extract any type ...Lire la suite >
Functional dependancies provide a semantic information over data from a table to exhibit correlation links. In this thesis, we deal with the dependancy discovery problem by proposing a unified context to extract any type of functional dependencies (key dependencies, conditional functional dependencies, with an exact or an approximate validity). Our algorithm, ParaCoDe, runs in parallel on candidates there by reducing the global time of computations. Hence, it is very competitive comparated to sequential appoaches known today. Satisfied dependencies on a table are used to solve the problem of partial materiali-zation of data cube. We present a characterization of the optimal solution in which the cost of each query is bounded by a before hand fixed performance threshold and its size is minimal. This specification of the solution gives a unique framework to describe and formally compare summarization techniques of data cubes.< Réduire
Mots clés
Dépendances fonctionnelles
Extraction de dépendances
Calculs parallèles
Cubes de donnéees
Matérialisation partielle
Mots clés en anglais
Functionnal dependencies
Dependency discovery
Parallel computations
Data cubes
Partial materialization
Origine
Importé de STAR