Afficher la notice abrégée

dc.contributor.advisorRouillon-Couture, Nadine
dc.contributor.authorPERE-LAPERNE, Jacques
dc.contributor.otherRouillon-Couture, Nadine
dc.contributor.otherTabbone, Antoine
dc.contributor.otherIngold, Rolf
dc.contributor.otherSchneider, Nicolas
dc.contributor.otherMelançon, Guy
dc.date2019-11-18
dc.identifier.urihttp://www.theses.fr/2019BORD0226/abes
dc.identifier.uri
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-02453457
dc.identifier.nnt2019BORD0226
dc.description.abstractCette thèse traite de la restructuration des documents déstructurés de type PDF contenant des éléments graphiques tels que les schémas, les plans et les dessins, dans l’objectif de les restructurer. En nous appuyant sur la méthode KDD (Knowledge Discovery in Database) pour la restructuration des données, nous introduisons la méthode (A)KDD (Antropocentric Knowledge Discovery in Database) que nous avons développé et qui est dérivée de la méthode KDD en ajoutant l’aspect incrémental et l’aspect centré sur l’utilisateur. Nous présentons, en particulier, une technique fondée sur le principe du tri par paquet pour extraire efficacement les symboles graphiques contenus dans un document PDF. Elle est comparée aux résultats de Puglissi sur les chaînes de caractères. Puis, nous formulons l’hypothèse selon laquelle la prise en compte de l’ordre chronologique présent dans les fichiers PDF dans le processus incrémental améliore la restructuration des documents. Nous montrons la validité de cette hypothèse sur un certain nombre d’exemples. Enfin, nous montrons l’efficacité du processus pour identifier les symboles en même temps que les équipotentielles. Le mémoire se conclut en montrant les avancées et les limites de la solution de la méthode (A)KDD et nous proposons des perspectives.
dc.description.abstractEnThis thesis deals with the restructuring of unstructured PDF documents containing graphical elements such as schematics, plans and drawings, with the aim of restructuring them. Using the KDD (Knowledge Discovery in Database) method for data restructuring, we introduce the (A) KDD (Antropocentric Knowledge Discovery in Database) method that we developed which is derived from the KDD method by adding an incremental aspect and an user-centered approach. We present, in particular, a technique based on on the bucket sort algorithm pattern in order to extract with efficiency graphic symbols contained in a PDF file. It is compared to the results obtained by Puglissi on strings. Then, we formulate the hypothesis:”taking into account the chronological order present in the PDF files in the incremental process improves the restructuring of the documents”. We illustrate the validity of this hypothesis on several examples. Finally, we show the efficiency of the process in the identification of the symbols at the same time as the equipotentials. The thesis concludes by showing the advances and the limits of the solution of the (A) KDD method and we propose some perspectives.
dc.language.isofr
dc.subjectAnalyse de contenu
dc.subjectReconnaissances de symboles
dc.subjectPDF
dc.subjectDAO/CAO
dc.subjectRecherche de motifs
dc.subject.enContent analysis
dc.subject.enSymbol recognition
dc.subject.enPDF
dc.subject.enCAD/CAM
dc.subject.enPatter search
dc.titleLa restructuration des documents graphiques destructurés
dc.title.enRestructure unstructured graphic data
dc.typeThèses de doctorat
dc.contributor.jurypresidentVigneras, Valérie
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....)
star.origin.linkhttps://www.theses.fr/2019BORD0226
dc.contributor.rapporteurTabbone, Antoine
dc.contributor.rapporteurIngold, Rolf
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=La%20restructuration%20des%20documents%20graphiques%20destructur%C3%A9s&rft.atitle=La%20restructuration%20des%20documents%20graphiques%20destructur%C3%A9s&rft.au=PERE-LAPERNE,%20Jacques&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée