Base des structures de recherche Inria
Gestion de données distribuées à très grande échelle pour les grilles et les clouds
KERDATA → KERDATA (SR0523GR)
Statut:
Terminée
Responsable :
Gabriel Antoniu
Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" :
Aucun mot-clé.
Mots-clés de "B - Autres sciences et domaines d'application - 2023" :
Aucun mot-clé.
Domaine :
Réseaux, systèmes et services, calcul distribué
Thème :
Calcul distribué et applications à très haute performance
Période :
01/07/2009 ->
30/06/2012
Dates d'évaluation :
Etablissement(s) de rattachement :
CNRS, ENS RENNES
Laboratoire(s) partenaire(s) :
IRISA (UMR6074)
CRI :
Centre Inria de l'Université de Rennes
Localisation :
Centre Inria de l'Université de Rennes
Code structure Inria :
031087-0
Numéro RNSR :
200920935W
N° de structure Inria:
SR0346XR
Nous travaillons à la conception, à la mise en oeuvre et à la validation expérimentale d'une plate-forme de partage de données non structurées de grande taille (BLOBs) appelée BlobSeer. Cette plate-forme est destinée à nous permettre d'aborder les défis mentionnés ci-dessus : des données massives, des accès à grain fin hautement concurrents, tout en fournissant un support pour le multiversioning et pour la gestion décentralisée des méta-données.
Sur des infrastructures de type Infrastructure-as-a-Service (IaaS), les ressources du cloud sont exploitées sur la base d'un modèle "à la demande": au lieu d'acheter et de devoir assurer la maintenance du matériel, les utilisateurs louent des machines virtuelles et de l'espace de stockage. Il faut alors gérer le stockage et le traitement des données sur des ressources de stockage externes, virtualisées. Un des défis à relever dans ce contexte est de concilier performance, passage à l'échelle, sécurité et qualité de service. Il est important, par ailleurs, d'étudier l'impact du partage des ressources physiques sur ces différents plans. L'objectif est d'évaluer les bénéfices du stockage à base de BLOBs apportés par l'approche BlobSeer (gestion décentralisée des méta-données, multiversioning, efficacité dans de conditions de haute concurrence) à la conception de systèmes de fichiers répartis au service des applications de fouille de données massives, notamment via le paradigme MapReduce.
En parallèle avec l'émergence des infrastructures de type cloud, des efforts considérables portent aujourd'hui sur la construction de machines post-pétaflopiques, telles que Blue Waters. Ces systèmes visent à soutenir des performances de l'ordre du pétaflop pour un large spectre d'applications scientifiques. Sur de telles infrastructures, la gestion des données a un impact fort sur la performance des applications. Ces infrastructures ont des caractéristiques architecturales particulières (i.e. hiérarchie mémoire multi-niveaux supportant des centaines de milliers de coeurs) destinées à permettre un degré de parallélisme sans précédent. Le système de stockage des données doit alors être conçu de manière à ne pas limiter le passage à l'échelle. Nos recherches se focalisent sur les besoins des applications numériques qui doivent s'exécuter sur ces architectures: l'objectif est d'évaluer les bénéfices que l'approche BlobSeer peut apporter à différents niveaux (gestion des données, des métadonnées) pour assurer des entrées/sorties performantes dans des conditions de très haute concurrence des accès aux données.
La position est calculée automatiquement avec les informations dont nous disposons. Si la position n'est pas juste, merci de fournir les coordonnées GPS à web-dgds@inria.fr