Calcul parallèle de dépendances
HANUSSE, Nicolas
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
MAABOUT, Sofian
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
Leer más >
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
HANUSSE, Nicolas
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
MAABOUT, Sofian
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
< Leer menos
Laboratoire Bordelais de Recherche en Informatique [LaBRI]
Algorithmics for computationally intensive applications over wide scale distributed platforms [CEPAGE]
Idioma
fr
Communication dans un congrès
Este ítem está publicado en
Actes de la conférence BDA (Bases de Données Avancées), Actes de la conférence BDA (Bases de Données Avancées), Bases de Données Avancées, 2013-10-22, Nantes. 2013-10-08p. 1-20
Resumen
L'extraction de dépendances fonctionnelles (DFs) est un probléme classique qui continue de susciter de nouveaux travaux du fait des multiples exploitations possibles que cette information peut avoir. Dans cet article, nous ...Leer más >
L'extraction de dépendances fonctionnelles (DFs) est un probléme classique qui continue de susciter de nouveaux travaux du fait des multiples exploitations possibles que cette information peut avoir. Dans cet article, nous présentons un algorithme paralléle paramétrable qui calcule les DFs exactes, DFs approchées, DFs conditionnelles (DFCs) ainsi que les clés minimales. Pour les cas des DFs exactes et des clés minimales, les tests de validité sont basés sur un calcul de nombre de valeurs distinctes. Nous étudions l'introduction des techniques d'approximation proposées á cet effet (nombre de valeurs distinctes), précisément la méthode Hyperloglog, permettant ainsi d'économiser l'espace mémoire et ouvrant la voie á une approche paralléle orientée données. Ceci est d'autant plus important quand les données sont massives. Bien que les résultats retournés dans ce dernier cas soient approximatifs, nous donnons des bornes théoriques sur les erreurs qu'on peut avoir. Une série d'expériences montrent l'efficacité de notre approche.< Leer menos
Orígen
Importado de HalCentros de investigación