Détail d'une fiche

SEQUEL (SR0032ER)

Sequential Learning

Statut: Terminée

Responsable : Philippe Preux

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" : Aucun mot-clé.

Mots-clés de "B - Autres sciences et domaines d'application - 2023" : Aucun mot-clé.

Domaine : Mathématiques appliquées, calcul et simulation
Thème : Optimisation, apprentissage et méthodes statistiques

Période : 01/07/2007 -> 31/10/2020
Dates d'évaluation : 17/03/2010 , 19/03/2014 , 14/03/2018

Etablissement(s) de rattachement : UNIVERSITE DE LILLE
Laboratoire(s) partenaire(s) : CRISTAL (9189)

CRI : Centre Inria de l'Université de Lille
Localisation : Centre Inria de l'Université de Lille
Code structure Inria : 101021-0

Numéro RNSR : 200718281V
N° de structure Inria: SR0032ER

Présentation

De nombreux systèmes artificiels traitent des données qu'ils obtiennent petit à petit, au cours du temps. Par exemple, ces données peuvent être des pages web qui sont créées, modifiées ou disparaissent du web ; ce peut être des mesures de capteurs au fil du temps, mesurées par un système passif, ou par un système actif agissant en retour sur son environnement (agent logiciel ou robot matériel). À partir de ces données, ces systèmes extraient des informations, ces informations pouvant être utilisées pour détecter des objets (problème de classification), pour estimer les paramètres d'un processus (problème d'estimation), pour interagir avec son environnement (problème de décision séquentielle). Parfois aussi, le volume de données est tellement important que l'on ne peut que se résoudre à le traiter en le découpant en morceaux que l'on traite en séquence. Dans tous les cas, on souhaite qu'à chaque instant, le système artificiel soit capable de fournir une réponse adéquate. Typiquement, l'environnement dans lequel le système est situé est stochastique et il peut être non stationnaire.

L'objectif de l'équipe-projet est le développement de concepts et d'algorithmes permettant de traiter efficacement cette problématique et de manière fiable en évaluant la qualité de la réponse fournie par le système.

Les applications visées sont potentiellement nombreuses ; actuellement, nous travaillons en particulier sur les systèmes de recommendation. Nous avons également une forte contribution sur le jeu de Go avec le programme Crazy Stone qui a remporté de nombreux prix.

Axes de recherche

apprentissage séquentiel
prise de décision dans l'incertain
problèmes de bandits ; dilemme exploration/exploitation
apprentissage par renforcement

Relations industrielles et internationales

industrielle : Google, Deepmind, Facebook AI Research, Critéo, Renault, Le Livre Scolaire, ...
scientifique : U. Mc Gill (Canada), U. Leoben (Autriche), LIP 6, MILA (montréal), ...

Contact

Responsable : Philippe Preux
Tél : 03.59.57.79.08
Secrétariat Tél : 03.59.57.78.37

En savoir plus

Site de l'équipe
Site sur inria.fr
Derniers Rapports d'Activité : 2015 , 2016 , 2017 , 2018 , 2019

Documents sur la structure

Décisions

5807 (25/09/2007) : création
6251 (30/09/2008) : changement de rattachement
8031 (12/07/2011) : prolongation
10552 (26/01/2015) : prolongation
13244 (10/12/2018) : prolongation
14043 (19/12/2019) : prolongation
14230 (24/03/2020) : prolongation
14358 (23/11/2020) : fermeture
14543 (26/11/2020) : prolongation

Localisation

La position est calculée automatiquement avec les informations dont nous disposons. Si la position n'est pas juste, merci de fournir les coordonnées GPS à web-dgds@inria.fr

BASTRI - Fiches Equipes