Détail d'une fiche   Version PDF

WILLOW (SR0066IR)

Vision par ordinateur incarnée

WILLOW


Statut: Décision signée

Responsable : Justin Carpentier

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" : A3.1.1. Modélisation, représentation , A3.4. Apprentissage et statistiques , A5.3. Analyse et traitement d'images , A5.4. Vision par ordinateur , A5.10. Robotique , A9. Intelligence artificielle , A9.1. Connaissances , A9.2. Apprentissage , A9.3. Analyse de signaux (vision, parole, etc.) , A9.5. Robotique

Mots-clés de "B - Autres sciences et domaines d'application - 2023" : B9.5.1. Informatique , B9.5.6. Science des données

Domaine : Perception, Cognition, Interaction
Thème : Vision, perception et interprétation multimedia

Période : 01/06/2007 -> 30/06/2028
Dates d'évaluation : 20/10/2010 , 16/10/2014 , 03/10/2018 ,

Etablissement(s) de rattachement : ENS PSL, CNRS
Laboratoire(s) partenaire(s) : DI-ENS (UMR8548)

CRI : Centre Inria de Paris
Localisation : Centre de recherche Inria de Paris
Code structure Inria : 021076-1

Numéro RNSR : 200718311C
N° de structure Inria: SR0066IR

Présentation

Nos recherches portent sur les problèmes de représentation dans le domaine de la reconnaissance visuelle. Leur but est de développer des modèles géométriques, physiques, et statistiques appropriés de toutes les composantes du processus d'interprétation des images, y compris l'illumination, les matériaux, les objets, les scènes, et les activités humaines. Cela nous permettra de faire face à des défis scientifiques tels que la modélisation, l'analyse, et la recherche d'objets tridimensionnels ; la description et la classification des activités humaines ; et la reconnaissance de catégories d'objets et l'interprétation de scènes complexes. Nos modèles seront également utilisés dans des applications telles que l'analyse quantitative de données visuelles dans des domaines tels que l'archéologie, l'anthropologie, et la conservation du patrimoine culturel ; la "post-production" de films et les effets spéciaux ; et l'annotation, l'interprétation, et la recherche de segments vidéo dans des bases de données audiovisuelles.


Axes de recherche

Nous travaillons sur trois axes de recherches:

  • Modélisation, analyse, et reconnaissance d'objets et de scènes tridimensionnels :
    Notre objectif est d'acquérir automatiquement des modèles géométriques précis de formes tridimensionnelles complexes à partir d'images multiples, et d'utiliser ces modèles dans des tâches de reconnaissance et de recalage rigide et non rigide.
  • Capture et classification des activités humaines :
    Notre objectif est d'utiliser la détection et le suivi d'objets pour relier entre elles les apparitions successives de visages et de corps humains dans une séquence vidéo, et de construire et reconnaître ainsi des modèles spatio-temporels des activités et interactions humaines.
  • Reconnaissance de catégories d'objets et de scènes :
    Le but de cette partie de nos recherches est de développer des modèles géometriques et statistiques d'objets, de scènes, et des éléments qui les composent permettant l'apprentissage semi supervisé, la gestion de la variabilité de l'apparence des objets à l'intérieur d'une catégorie et d'une image à l'autre, et une inférence efficace.

Relations industrielles et internationales

WILLOW fait partie de l'équipe associée THETYS, en collaboration avec l'équipe-projet LEAR du centre de recherche INRIA Grenoble - Rhône-Alpes, l'Université de Carnegie Mellon, et l'Université d'Illinois à Urbana-Champaign.
Les membres de WILLOW collaborent également avec des chercheurs à Caltech, FT R&D, ILM, Microsoft, MIT, NYU, et Toyota.