Détail d'une fiche   Version PDF

FLOWERS (SR0459GR)

Interactions, exploration et apprentissage en robotique développementale et sociale

FLOWERS (SR0402RR) →  FLOWERS


Statut: En cours de fermeture

Responsable : Pierre-yves Oudeyer

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2024" : Aucun mot-clé.

Mots-clés de "B - Autres sciences et domaines d'application - 2024" : Aucun mot-clé.

Domaine : Perception, Cognition, Interaction
Thème : Robotique et environnements intelligents

Période : 01/01/2011 -> 31/12/2024
Dates d'évaluation : 28/03/2013 , 16/03/2017 , 12/01/2022

Etablissement(s) de rattachement : ENSTA PARIS
Laboratoire(s) partenaire(s) : <sans UMR>

CRI : Centre Inria de l'université de Bordeaux
Localisation : Centre Inria de l'université de Bordeaux
Code structure Inria : 091035-1

Numéro RNSR : 200820949R
N° de structure Inria: SR0459GR

Présentation

L'équipe-projet FLOWERS (Inria/Univ. Bordeaux/Ensta ParisTech) étudie des modèles de développement et d'apprentissage ouverts. Ces modèles sont utilisés comme outils pour aider à mieux comprendre comment les enfants apprennent ainsi que pour construire des machines capable d'un apprentissage autonome similaire à celui des enfants. Les domaines d’application sont dans les domaines des interactions homme-machine, des jeux vidéos, de la robotique, de la découvert automatisée et des technologies éducatives.

L’un des défis scientifiques majeurs de l'intelligence artificielle et des sciences cognitives est de comprendre comment les humains et les machines peuvent acquérir efficacement les modèles du monde ainsi que des répertoires de compétences ouverts et cumulatifs sur une longue période. Les processus de développement sensorimoteur, cognitif et social, sont organisés selon des phases ordonnées de complexité croissante et résultent de l'interaction complexe entre le cerveau/corps et son environnement physique et social. 

Pour faire progresser la compréhension fondamentale des mécanismes du développement, l'équipe FLOWERS a mis au point des modèles computationnels qui exploitent des techniques avancées d'apprentissage machine telles que l'apprentissage par renforcement profond intrinsèquement motivé, en étroite collaboration avec la psychologie du développement et les neurosciences. L’équipe s’est particulièrement concentrée sur des modèles d'apprentissage et d'exploration intrinsèquement motivés (également appelés apprentissage par la curiosité) avec des mécanismes permettant aux agents d'apprendre à représenter et à générer leurs propres buts, en organisant eux-mêmes un curriculum d'apprentissage pour un apprentissage efficace des modèles du monde et du répertoire de compétences avec des ressources limitées de temps, d'énergie et de calcul. L'équipe étudie également comment les mécanismes d'apprentissage autonome peuvent permettre aux humains et aux machines d'acquérir des compétences linguistiques ancrées dans le monde physique et social, en utilisant des architectures neuro-symboliques pour l'apprentissage de représentations structurées et les capacités de compositionalité et de généralisation systématique. De manière reliée, nous étudions aussi comment des populations d'agents en interaction peuvent acquérir collectivement des stratégies coopératives ou compétitives dans des environnements complexes simulés. 

Au-delà de l'élaboration de nouvelles théories et de nouveaux paradigmes expérimentaux pour comprendre le développement humain dans les sciences cognitives, ainsi que de nouvelles approches fondamentales de l'apprentissage machine, l'équipe a également étudié comment de tels modèles peuvent trouver des applications dans la robotique, l'interaction homme-machine, la découverté automatisée et les technologies éducatives. En robotique, l'équipe a montré comment la curiosité artificielle combinée à l'apprentissage par imitation peut permettre aux robots d'acquérir des tâches multiples par une interaction naturelle avec des utilisateurs humains naïfs, par exemple dans le contexte de la robotique assistée. L'équipe a également montré que les modèles d'apprentissage par la curiosité peuvent être transposés dans des algorithmes pour des systèmes tutorés intelligents, permettant aux logiciels éducatifs de s'adapter progressivement et dynamiquement aux particularités de chaque apprenant humain, et proposant des séquences personnalisées d'activités d'enseignement. En ce qui concerne l'interaction homme-machine, l'équipe a montré comment des algorithmes d'apprentissage incrémental peuvent être utilisés pour supprimer la phase d'étalonnage dans certaines interfaces cerveau-machine.

 


Axes de recherche

Le travail de FLOWERS s'organise autour des six axes suivants :

  • Apprentissage par renforcement profond intrinsèquement motivé, exploration autonome et ouverte, exploration créative, recherche active d'informations, apprentissage actif, curiosité artificielle, apprentissage machine développemental ;
  • Modèles d'apprentissage et d'exploration intrinsèquement motivée chez l'humain, sciences cognitives ;
  • Apprentissage social, par exemple l'apprentissage par imitation ou démonstration, qui implique à la fois des questions liées à l'apprentissage machine et à l'interaction homme-robot ;
  • Acquisition du language ancrée dans l’interaction avec l'environnement, apprentissage par renforcement ancré dans le langage, évolution du langage, compositionalité, généralisation ;
  • Apprentissage par renforcement multi-agents, par exemple l'apprentissage conjoint de stratégies coopératives ou compétitives dans des populations d'agents soumis à des contraintes environnementales ;
  • Applications :
    • Technologies éducatives, personnalisation, technologies de formation/réhabilitation pour la cognition
    • Interaction homme-machine adaptative
    • Robotique
    • Découverte assistée dans les sciences

Relations industrielles et internationales

L'équipe collabore en particulier avec Columbia Univ. (NY), Univ. Waterloo (Canada), Univ. Barcelona (Espagne), Univ. Pompeu Fabra (Espagne) ainsi qu'avec plusieurs entreprises et startups, incluant Ubisoft (France), Microsoft Research (UK et Canada), OnePoint (France), Poietis (France), evidenceB (France); Gloo (France), Hugging Face (France).