Détail d'une fiche   Version PDF

TEXMEX (SR0128GR)

Techniques d'exploitation des données multimédia

TEXMEX →  LINKMEDIA (SR0653WR)


Statut: Terminée

Responsable : Patrick Gros

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" : Aucun mot-clé.

Mots-clés de "B - Autres sciences et domaines d'application - 2023" : Aucun mot-clé.

Domaine : Perception, Cognition, Interaction
Thème : Vision, perception et interprétation multimedia

Période : 01/11/2002 -> 31/12/2014
Dates d'évaluation : 20/10/2010 , 16/10/2014

Etablissement(s) de rattachement : CNRS, INSA RENNES, U. RENNES 1
Laboratoire(s) partenaire(s) : IRISA (UMR6074)

CRI : Centre Inria de l'Université de Rennes
Localisation : Centre Inria de l'Université de Rennes
Code structure Inria : 031030-0

Numéro RNSR : 200218363F
N° de structure Inria: SR0128GR

Présentation

L'explosion de la quantité de documents multimédias numériques a engendré un très fort dynamisme de la recherche dans le domaine de l'indexation multimédia. Cependant, la portée des travaux menés par les spécialistes des médias est limitée par leur aspect monomédia et par la quantité de documents que ces personnes manipulent, quelques milliers d'images par exemple, alors que les applications professionnelles demanderaient d'en manipuler bien plus (quelques millions). De telles quantités de documents posent des problèmes de structuration et de stockage sur disque, problèmes qui sont hors de l'expertise des spécialistes de médias. A l'inverse, les spécialistes des bases de données, coutumiers de ce problèmes, ne considèrent que des techniques très rudimentaires de description des documents, faute de savoir-faire dans le domaine.

Pour remédier à cela, nous proposons la création d'une équipe réunissant en son sein à la fois des spécialistes des médias et des spécialistes des techniques d'utilisation de ces documents telles les bases de données, la recherche d'information ou les statistiques. L'objectif de l'équipe est donc de se situer à l'intersection des deux axes de travail suivants :

  • définition de nouveaux descripteurs de documents pour les images fixes, la vidéo et le texte, définition de descripteurs faisant intervenir plusieurs médias et de méta-données associées aux documents, évaluation de ces descripteurs sur de grandes bases de documents ;
  • statistiques pour l'exploration des grands volumes de données, gestion et stratégies de calcul des méta-données et descripteurs associées aux documents, analyse de la qualité des données, étude de stratégies économes d'exploitation (navigation, indexation, recherche), définition de supports systèmes et matériels pour un accès rapide à ces données.
L'originalité de notre approche vient de la prise en compte simultanée des contraintes liées aux médias et aux documents et des contraintes liées à l'exploitation de ces données, qui sont deux aspects d'un même problème. Cette approche pluridisciplinaire doit permettre de dépasser les limites des systèmes actuels et d'arriver à gérer finement et efficacement des quantités de documents très importantes.

Axes de recherche

Notre travail s'organise en deux axes de travail que nous appliquons à l'étude de trois problèmes. Les axes de travail sont :
  • la description des documents multimédias : il s'agit de pouvoir calculer automatiquement des descripteurs du contenu d'un document ou d' autres méta-données, de vérifier la pertinence et le pouvoir discriminant de ces descripteurs lors de recherche dans de grandes bases de documents.
  • l'utilisation de ces descripteurs pour l'organisation et al gestion des bases de documents, l'exploration et la navigation, ou la recherche de documents : stratégies de calcul, de gestion et de maintien de la cohérence des descripteurs et méta-données, analyse exploratoire des données, indexation multidimensionnelle, supports systèmes et matériels pour les systèmes de recherche.
Nous appliquons ces outils à trois problèmes : 1.la recherche d'images dans de grandes bases d'images ; 2.la description conjointe texte - image de documents comportant ces deux médias ; 3.l'ajout de capacités sémantiques aux moteurs de recherche textuels.

Domaines d'application

Nous appliquons nos travaux tout d'abord dans le domaine des médias :
  • archives de vidéos, de télévision
  • agences de presse et de photographie
  • internet et intranets d'entreprise
Le domaine biomédical est un gros fournisseur de données difficiles à exploiter :
  • bases bibliographiques médicales
  • données d'imagerie : imagerie anatomique et fonctionnelle cérébrale par exemple
  • données génomiques et protéomiques
D'autres applications :
  • la gestion de la mémoire visuelle des robots pour la plannification des déplacements
  • l'analyse des textes (pertinence, argumentaire...) pour l'intelligence économique

Relations industrielles et internationales

  • Projet européen : nous participons au projet IST BUSMAN, avec des partenaires espagnols, allemands et anglais. Nous apportons dans ce projet notre expertise en bases de données et indexation de descripteurs d'images
  • Projets nationaux : nous participons à de nombreux projets nationaux avec des partenaires académiques et industriels :
    • Projet PRIAM Médiaworks sur l'aide à l'indexation des archives télévisuelles ;
    • Action spécifique STIC "Indexation, transmodalité et gestion des connaissances" ;
    • Projet RNRT Diphonet sur les techniques d'indexation et de tatouage pour le protection des droits des agences de photo ;
    • ACI Santé Neurobase sur la création de bases réparties de données d'imagerie cérébrale ;
    • ACIGrid GenoGRID et action bio-info inter EPST APREDG sur la gestion des bases de données génomiques
    • Action bio-info Caderige2 sur l'extraction de connaissance à partir de bases bibliographiques en biologie.
  • Contrats industriels : nous avons de contacts privilégiés avec la société Thomson Multimédia sur les outils pour l'indexation de la vidéo, et avec la société Thales.