Détail d'une fiche   Version PDF

LEAR (SR0011YR)

Apprentissage et reconnaissance en vision par ordinateur

MOVI (SR0259UR) →  LEAR →  THOTH (SR0699OR)


Statut: Terminée

Responsable : Cordelia Schmid

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" : Aucun mot-clé.

Mots-clés de "B - Autres sciences et domaines d'application - 2023" : Aucun mot-clé.

Domaine : Perception, Cognition, Interaction
Thème : Vision, perception et interprétation multimedia

Période : 01/07/2003 -> 31/12/2015
Dates d'évaluation : 20/10/2010 , 16/10/2014

Etablissement(s) de rattachement : GRENOBLE INP, CNRS, UJF (GRENOBLE)
Laboratoire(s) partenaire(s) : LJK (UMR5224)

CRI : Centre Inria de l'Université Grenoble Alpes
Localisation : Centre de recherche Inria de l'Université Grenoble Alpes
Code structure Inria : 071016-0

Numéro RNSR : 200318260P
N° de structure Inria: SR0011YR

Présentation

L'équipe-projet LEAR est située dans les locaux du centre de recherche INRIA Grenoble - Rhône-Alpes à Montbonnot/Grenoble. Elle a été créée en juillet 2003.
Cette équipe-projet aborde le problème de la reconnaissance d'objets et de l'interprétation de scènes pour des images statiques et des séquences d'images vidéo. C'est un problème ouvert de la vision par ordinateur: il est aujourd'hui impossible de déterminer de façon automatique le contenu d'une image ou d'une séquence vidéo. La piste que nous suivons repose sur l'ajout de l'apprentissage aux techniques de vision par ordinateur que sont la description d'images et la géométrie. Une solution, même partielle, au problème de la reconnaissance d'objets et de l'interprétation de scènes a de nombreuses applications. Dans le cadre de cette équipe-projet nous nous intéressons en particulier aux applications en recherche d'images et en indexation vidéo.

Axes de recherche

Nous travaillons selon trois axes de recherche:

  • Amélioration des techniques de description d'images.
    De telles techniques sont maintenant bien étudiées et nous avons à notre disposition des ``briques de base'', comme par exemple les points d'intérêt affines. Il s'agit de les étendre pour pouvoir décrire des textures, pour définir des mesures de similarité ainsi que des descripteurs de forme 2D et 3D.
  • Maîtrise et adaptation des techniques d'apprentissage.
    Jusqu'à présent notre domaine de recherche a été la vision par ordinateur, il s'agira tout d'abord de maîtriser les techniques d'apprentissage pour pouvoir sélectionner celles en meilleure adéquation avec nos problèmes. Ensuite, il faudra adapter des théories et des algorithmes d'apprentissage afin qu'ils tiennent compte des contraintes spécifiques de la vision. Il faut notamment développer des approches capables de gérer de grandes quantités de données de haute dimensionnalité et de décrire des espaces complexes.
  • Construction de modèles pour la reconnaissance.
    Il s'agit de combiner les techniques d'apprentissage et les techniques de description pour construire des modèles pour la reconnaissance. Il faut pour cela sélectionner les techniques adéquates et pour l'apprentissage et pour la description d'images. Initialement, cette sélection sera effectuée manuellement pour chaque classe d'objets. À long terme on compte rendre ce choix automatique, au moins partiellement par exemple en utilisant des techniques de sélection automatique de descripteurs. On obtiendra donc de façon automatique une représentation adaptée pour un ensemble de données d'apprentissage qui permettra en outre une reconnaissance efficace.

Relations industrielles et internationales