Détail d'une fiche   Version PDF

KERDATA (SR0523GR)

Scalable Storage for Clouds and Beyond

KERDATA (SR0346XR) →  KERDATA


Statut: En cours de fermeture

Responsable : Gabriel Antoniu

Mots-clés de "A - Thèmes de recherche en Sciences du numérique - 2023" : A1.1.1. Multi-cœurs, pluri-coeurs , A1.1.4. HPC , A1.1.5. Exascale , A1.1.9. Tolérance aux fautes , A1.3. Systèmes distribués , A1.3.5. Cloud , A1.3.6. Fog, Edge , A2.6.2. Intergiciels , A3.1.2. Gestion, interrogation et stockage , A3.1.3. Données distribuées , A3.1.8. Données massives (production, stockage, acheminement) , A6.2.7. HPC , A6.3. Interaction entre calcul et données , A7.1.1. Algorithmique distribuée , A9.2. Apprentissage , A9.7. Algorithmique de l'intelligence artificielle

Mots-clés de "B - Autres sciences et domaines d'application - 2023" : B3.2. Climat, météorologie , B3.3.1. Terre, sous-sol , B8.2. Ville connectée , B9.5.6. Science des données , B9.8. Recherche reproductible , B9.11.1. Risques environnementaux

Domaine : Réseaux, systèmes et services, calcul distribué
Thème : Calcul distribué et à haute performance

Période : 01/07/2012 -> 31/12/2024
Dates d'évaluation : 11/10/2012 , 12/10/2016 , 07/10/2021

Etablissement(s) de rattachement : INSA RENNES
Laboratoire(s) partenaire(s) : IRISA (UMR6074)

CRI : Centre Inria de l'Université de Rennes
Localisation : Centre Inria de l'Université de Rennes
Code structure Inria : 031087-1

Numéro RNSR : 200920935W
N° de structure Inria: SR0523GR

Présentation

Stockage et traitement de données pour infrastructures distribuées à très grande échelle 

Les recherches de l'équipe KerData abordent le domaine de la gestion de données réparties à de très grandes échelles, en particulier sur les clouds et les infrastructures postpétaflopiques, pour des applications traitant des données massives. Nous avons initialement ciblé deux types d'infrastructures: les clouds et les supercalculateurs hautes performances pré-Exascale. Avec la convergence récemment engagée des domaines du HPC et du Big Data, nous avons commencé à étudier les opportunités créées par l'utilisation conjointe d'infrastructures hybrides HPC / cloud / edge (alias le continuum informatique).  Des exemples d'applications cibles sont :

  • Des applications d'analyse de données massives (par exemple, en utilisant le paradigme MapReduce et ses extensions) sur des infrastructures cloud/edge ;
  • Des services avancés de stockage et de gestion de données sur des infrastructures cloud/edge ;
  • Des applications de simulation à grande échelle pour les supercalculateurs Exascale ;
  • Des workflows hybrides combinant simulation, analyse de données et apprentissage, exécutés sur des infrastructures hybrides HPC / cloud / edge.

Axes de recherche

Convergence des infrastructures HPC et Big Data

  • Approvisionnement dynamique des ressources de stockage hybrides
  • Orchestration des E/S sur les infrastructures hybrides
  • Abstractions de stockage communes HPC/cloud
  • Stockage efficace pour des applications à traitement intensif des données
  • Gestion des données pour workflows hybrides combinant calcul, d'analyse et d'apprentissage exécutées sur le continuum numérique

Gestion avancée de données sur le continuum edge-cloud

  • Déploiement automatisé et reproductible dans le continuum numérique
  • Apprentissage et inférence efficaces en parallèle sur le continuum numérique
  • Traitement efficace des flux de données sur des clouds
  • Gestion des données et des méta-données pour des workflows géo-distribués multi-sites 

Gestion des entrées/sortie, visualisation et analyse in situ sur des systèmes HPC à très grande échelle

  • Support à base de coeurs dédiés pour une gestion efficace des entrées/sorties et la visualisation in situ sur des systèmes HPC post-exascale
  • Des approches pour l'imiter l'inteférence des I/Os dans un contexte multi-applicatif sur des systèmes HPC
  • Des architectures optimisées pour la visualisation et l'analyse de données in situ
  • Techniques unifiées de traitement des données pour les workflows de simulation/analyse hybrides exécutés sur des infrastructures CPU/GPU potentiellement hybrides.

Relations industrielles et internationales

  • ACROSS: un projet EuroHPC sur les architectures émergentes pour l'exécution de workflows complexes HPC/Big Data/IA
  • EUPEX: Advanced Pilots towards the European Exascale Supercomputers (EuroHPC project)
  • ENGAGE: NExt GeNeration ComputinG Environments for Artificial intelliGEnce, an Inria-DFKI project 
  • Data@Exascale and UNIFY: équipes associées avec Argonne National Laboratory, USA dans le cadre du laboratoire international JLESC
    • Thèmes: Convergence HPC / Big Data / AI, stockage, E/S et traitements in situ à très grande échelle sur le continuum edge-cloud-HPC