Détail d'une fiche   Version PDF

SEQUEL (SR0032ER)

Sequential Learning

SEQUEL →  SCOOL (SR0896HR)


Statut: Terminée

Responsable : Philippe Preux

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" : Aucun mot-clé.

Mots-clés de "B - Autres sciences et domaines d'application - 2023" : Aucun mot-clé.

Domaine : Mathématiques appliquées, calcul et simulation
Thème : Optimisation, apprentissage et méthodes statistiques

Période : 01/07/2007 -> 31/10/2020
Dates d'évaluation : 17/03/2010 , 19/03/2014 , 14/03/2018

Etablissement(s) de rattachement : UNIVERSITE DE LILLE
Laboratoire(s) partenaire(s) : CRISTAL (9189)

CRI : Centre Inria de l'Université de Lille
Localisation : Centre Inria de l'Université de Lille
Code structure Inria : 101021-0

Numéro RNSR : 200718281V
N° de structure Inria: SR0032ER

Présentation

De nombreux systèmes artificiels traitent des données qu'ils obtiennent petit à petit, au cours du temps. Par exemple, ces données peuvent être des pages web qui sont créées, modifiées ou disparaissent du web ; ce peut être des mesures de capteurs au fil du temps, mesurées par un système passif, ou par un système actif agissant en retour sur son environnement (agent logiciel ou robot matériel). À partir de ces données, ces systèmes extraient des informations, ces informations pouvant être utilisées pour détecter des objets (problème de classification), pour estimer les paramètres d'un processus (problème d'estimation), pour interagir avec son environnement (problème de décision séquentielle). Parfois aussi, le volume de données est tellement important que l'on ne peut que se résoudre à le traiter en le découpant en morceaux que l'on traite en séquence. Dans tous les cas, on souhaite qu'à chaque instant, le système artificiel soit capable de fournir une réponse adéquate. Typiquement, l'environnement dans lequel le système est situé est stochastique et il peut être non stationnaire.

L'objectif de l'équipe-projet est le développement de concepts et d'algorithmes permettant de traiter efficacement cette problématique et de manière fiable en évaluant la qualité de la réponse fournie par le système.

Les applications visées sont potentiellement nombreuses ; actuellement, nous travaillons en particulier sur les systèmes de recommendation. Nous avons également une forte contribution sur le jeu de Go avec le programme Crazy Stone qui a remporté de nombreux prix.


Axes de recherche

  • apprentissage séquentiel
  • prise de décision dans l'incertain
  • problèmes de bandits ; dilemme exploration/exploitation
  • apprentissage par renforcement

Relations industrielles et internationales

  • industrielle : Google, Deepmind, Facebook AI Research, Critéo, Renault, Le Livre Scolaire, ...
  • scientifique : U. Mc Gill (Canada), U. Leoben (Autriche), LIP 6, MILA (montréal), ...