Efficient object identification in image sequences for content indexing
Thèses de doctorat
Date de soutenance
2005-11-30Résumé
Les avancées en matière d'acquisition et de stockage des données ont conduit à la disponibilité de grandes bases de données vidéo numériques pour l'utilisateur grand-public. Néanmoins l'interaction avec les données multimédia ...Lire la suite >
Les avancées en matière d'acquisition et de stockage des données ont conduit à la disponibilité de grandes bases de données vidéo numériques pour l'utilisateur grand-public. Néanmoins l'interaction avec les données multimédia et vidéo en particulier nécessite des outils de description, organisation et gestion de ces données vidéo. La majorité des documents multimédia sont produits sous forme compressée. De plus comme les utilisateurs demandent des réponses à leur requêtes les plus rapides possible, l'extraction d'information en temps réel même si celle-ci n'est pas très précise est devenue un objectif important. Basée sur des hypothèses formulées ci-dessus, une nouvelle tendance en matière d'analyse pour l'indexation multimédia est parue, elle peut être qualifiée comme paradigme de << rough indexing >> ou << indexation grossière >>. Nous pouvons inclure notre travail dans cette mouvance d'indexation rapide et approximative dans laquelle uniquement les données imprécises telles que les vecteurs du mouvement et les images DC sont exploitées pour produire une indexation fine des objets en avant-plan. Dans ce paradigme nous proposons de combiner a la fois les informations du mouvement et la segmentation basée-couleur pour extraire les objets pertinents des flux vidéo compresses. Il peut arriver que le mouvement d'un objet soit très similaire au mouvement de la camera ou que l'objet soit statique, aucun objet ne sera alors détecté. Néanmoins, comme un objet ne peut raisonnablement pas apparaitre et disparaitre durant une courte séquence d'images, nous proposons de filtrer les séquences d'objets le long de l'axe temporel. Pour ce faire nous proposons une modélisation de la séquence des objets par une super-quadrique. La méthode proposée donne des résultats prometteurs : les ratés de la détection ou les sur-détections peuvent être corrigés par la méthode de filtrage spatio-temporel proposée.< Réduire
Résumé en anglais
The advances in data capturing and storage have made large amounts of video data available for consumer applications. However, interacting with multimedia data, and video in par- ticular, requires tools to describe, organize ...Lire la suite >
The advances in data capturing and storage have made large amounts of video data available for consumer applications. However, interacting with multimedia data, and video in par- ticular, requires tools to describe, organize and manage video data. The majority of multimedia documents is provided in compressed form. Besides, as the users require their retrieval in the fastest way, extracting in formation in real time, even if it is not precise, has become an important objec- tive. Based on the assumptions above, a new trend in analysis methods for indexing multimedia content has appeared which can be qualified as a rough indexing paradigm. In this context we can include our work where only rough data - that is motion vectors and DC images - have been used for fine indexing for foreground objects. In this paradigm we propose to combine motion information and color - based segmentation to extract meaningful foreground objects from compressed video streams. It may happen that the object motion is very much similar to that one of the camera, than no objects get detected. To overcome this, we propose to filter the sequences of objects along the time axis. To do this we propose to model the sequence of objects by a super-quadric. The proposed method gives promising results : isolated miss-detection or over-detection episodes can be corrected.< Réduire
Mots clés
Informatique
estimation du mouvement sur des flux compressés
segmentation spatio-temporelle
modélisation par des surfaces quadriques
Unités de recherche