Base des structures de recherche Inria
Rich Data Exploration at Cloud Scale
OAK (SR0576UR) → CEDAR → CEDAR (SR0837TR)
Statut:
Terminée
Responsable :
Ioana Manolescu
Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2024" :
Aucun mot-clé.
Mots-clés de "B - Autres sciences et domaines d'application - 2024" :
Aucun mot-clé.
Domaine :
Perception, Cognition, Interaction
Thème :
Représentation et traitement des données et des connaissances
Période :
01/01/2016 ->
31/03/2018
Dates d'évaluation :
Etablissement(s) de rattachement :
<sans>
Laboratoire(s) partenaire(s) :
LIX (UMR7161)
CRI :
Centre Inria de Saclay
Localisation :
Centre de recherche Inria de Saclay
Code structure Inria :
111074-0
Numéro RNSR :
201622056J
N° de structure Inria:
SR0734UR
Les applications à usage intensif de données de présentent un très grand degré d'hétérogénéité, dû au fait que différentes applications sont mieux servies par différents types de données. Ainsi, les applications de commerce online sont déployées au dessus de bases de données relationnelles, des plateformes de gestion de contenus Web gèrent des documents semi-structurés, les capteurs fournissent des flots de données numériques, les applications scientifiques manipulent des vecteurs, les logs (journaux) des systèmes tels que des serveurs Web ou moniteurs transactionnels produisent du texte structuré etc.; souvent, des données très hétérogènes sont exploitées sous la forme de graphes RDF etc.
Le rhythme de production et de consommation des données Big Data de nos jours rend l'unification de telles sources de données hétérogènes dans une architecture unique (par les processus de Extract-Transform-Load ou ETL typiques des entrepôts de données relationnels) infaisable. L'équipe CEDAR s'attèle aux défis posés par cette variété de données produites et consommées à très grande échelle, en s'orientant sur des modèles expressifs et des outils efficaces pour le traitement de telles données. Nos outils sont conçu pour être déployés dans le cloud, afin de passer à l'échelle des très grands volumes de données.
Nos travaux de recherche s'organisent dans deux grandes catégories, comme suit:
A l'intérieur du cloud, dans des plateformes massivement distribuées de traitement de données, nous nous intéressons à:
1. Plate-formes de stockage de données hétérogènes à très grande échelle
2. Algorithmes efficace pour répondre aux requêtes sur des données sémantiques
A l'interface entre le cloud et les utilisateurs, nous visons à définir des nouveaux modes d'intéraction et exploration des données par les utilisateurs, en particulier en équipant les serveurs de bases de données de nouvelles fonctionnalités pour simplifier l'expérience des utilisateurs. On s'intéresse en particulier à:
4. L'interrogation exploratoire des grands graphes sémantiques
5. Réponses représentatives aux requêtes sémantiques
A l'étranger, nous collaborons avec: UCSD (Alin Deutsch), AT&T (D. Srivastava), U. Madison Wisconsin (D. DeWitt) and U. Berkeley (M. Franklin), TU Dresden (S. Rudolph), U. Bolzano (D. Calvanese).
Nos partenaires industriels actuels sont Business & Décision (EOLAS), la PME SemSoft, ou encore le journal Le Monde.
La position est calculée automatiquement avec les informations dont nous disposons. Si la position n'est pas juste, merci de fournir les coordonnées GPS à web-dgds@inria.fr