Détail d'une fiche   Version PDF

METISS (SR0108ER)

Modélisation et expérimentation pour le traitement des informations et des signaux sonores

METISS →  PANAMA (SR0561SR)


Statut: Terminée

Responsable : Frédéric Bimbot

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" : Aucun mot-clé.

Mots-clés de "B - Autres sciences et domaines d'application - 2023" : Aucun mot-clé.

Domaine : Perception, cognition, interaction
Thème : Langue, parole et audio

Période : 01/11/2001 -> 31/12/2012
Dates d'évaluation : 13/10/2011

Etablissement(s) de rattachement : U. RENNES 1, CNRS
Laboratoire(s) partenaire(s) : IRISA (UMR6074)

CRI : Centre Inria de l'Université de Rennes
Localisation : Centre Inria de l'Université de Rennes
Code structure Inria : 031018-0

Numéro RNSR : 200118344P
N° de structure Inria: SR0108ER

Présentation

Les domaines d'application de METISS sont centrés sur le signal sonore et comportent trois volets : la caractérisation du locuteur (notamment pour la vérification vocale d'identité), le suivi de locuteur et de classes de sons pour l'indexation d'enregistrements sonores et le traitement " avancé " de signaux sonores (par exemple, la séparation de sources dans le cas sous-déterminé). Les fondements scientifiques de nos activités s'inscrivent dans le cadre des mathématiques appliquées, du traitement du signal, de la modélisation probabiliste, de l'estimation statistique et de la théorie de la décision. Nous nous appuyons sur les outils de traitement de signal au niveau de la représentation du signal (représentations adaptatives), de sa paramétrisation (analyse spectrale) et de sa décomposition (séparation de sources). Les approches probabilistes interviennent au niveau de la modélisation acoustique (modèles de distribution) et de la classification (tests d'hypothèses et reconnaissance). Nos travaux font également appe à des algorithmes de décodage et de poursuite tels que l'algorithme de Viterbi et le Matching Pursuit. Les principaux secteurs industriels concernés sont le secteur des télécommunications, celui de l'Internet et du multimédia, et sont susceptibles de s'étendre aux domaines de la production musicale et audiovisuelle et à celui des logiciels éducatifs et des jeux.

Axes de recherche

  • Caractérisation, identification et vérification du locuteur
  • Modélisation, détection d'informations et indexation d'enregistrements audio.
  • Séparation de sources et traitement avancé du son.

Relations industrielles et internationales

  • Laboratoire d'informatique d'Avignon (LIA), ENST, Lyon II - DDL, EPFL,... : consortium ELISA (Participation annuelle aux évaluations NIST en reconnaissance et suivi du locuteur [1997-...]
  • l'INA, les sociétés CS-Systèmes d'Information, Arts Vidéo Interactive et Mémodata, et des équipes de l'IRIT, du CLIP-IMAG, de l'INT, et du LIP6 : projet RNRT AGIR (développement d'un système d'indexation audio-visuelle et de recherche par le contenu) [1998-2001]
  • Ibermatica, BBVA, Oberthur, Thalès Communication, et les laboratoires de l'EPFL, l'IDIAP,Université Carlos III, Université du Surrey : projet BANCA (vérification du locuteur dans les transactions bancaires) [1999-2002]
  • CP8 (ex-Bull) : Vérification du locuteur sur carte à puce, rapide et distribuée [1999-2001]
  • Thomson MultiMédia, IRCCyn, INA, SFRS : projet RNRT Domus Videum (Génération de résumés audio-visuels pour les plates-formes multimédia domestiques [2001-2004].