Actualités à la Une

Certification des données

La 2ème réunion annuelle du noeud national RDA France s'est tenue à Paris le 13 septembre 2019: retours sur les thèmes évoqués et accès aux présentations. L'IR Data Terra, représentée par un membre du pôle océan ODATIS, y a présenté les "Problématiques de certification des réseaux de centres de données et de services".

Cette présentation "Problématiques de certification des réseaux de centres de données et de services" (lien pdf sur le site RDA) de Gilbert Maudire, Anne Chambodut et Joël Sudre, au nom de Data Terra, rappelle tout d'abord le contexte national, européen et international de la gestion des données. L'IR Data Terra a émergé il y a à peu près 6-7 ans avec pour objectif de structurer et fédérer la gestion des données d'observation de la Terre du point de vue national tout en étant présent au niveau européen.

Les enjeux identifiés par Data Terra sont d'appréhender la gestion des données et la globalité de l'observation du système Terre avec une approche intégrée (multisources, multicapteurs) dans une évolution temporelle et dans un contexte d'évolution exponentielle du volume des données in situ et satellites.

Les recommandations de la RDA et la certification Core Trust Seal  représentent pour les pôles un outil de structuration de la gestion des données d'observation de la Terre. Les critères Core Trust Seal représentent un outil de structuration, en particulier au sein de l'activité des CDS

Deux niveaux de certification sont à distinguer : l'un plutôt orienté vers les CDS, l'autre concernant les réseaux élémentaires, qui représentent des groupes de CDS. Actuellement, en se basant sur les critères Core Trust Seal, l'accent est mis sur la certification des CDS.

Pour mettre en place ces recommandations et critères de structuration de la gestion des données, les pôles ont soumis au récent appel d'offres de l'ANR plusieurs projets : FairTOIS pour le pôle surfaces continentales THEIA, le projet CEDRE pour le pôle terre solide FORM@TER et le projet COPiLOte pour le pôle océan ODATIS. Les projets CEDRE et COPiLOte ont été présentés lors de cette présentation.

COPiLOte

Le projet COPiLOte, porté par le pôle océan ODATIS est orienté vers les données du milieu marin. Les océans sont un milieu restant difficile et coûteux à observer. Une collaboration étroite entre les missions satellites «marines» et les observations in situ fournissent des données qui sont intégrées selon deux modes d'entrée différents : les satellites et les infrastructures de recherche fournissent des données en continu alors que de nombreuses observations moins structurées fournissent des données ponctuelles (dans l'espace et le temps) via des dépôts de données.

Le pôle océan ODATIS repose sur 9 Centres de données et Services, opérés par six partenaires (CNRS, CNES, IFREMER, IRD, SHOM et la fédération des Universités Marines), et peut-être un nouveau partenaire qui est en rapprochement actuellement : l'AFB.

Cette organisation interne du pôle océan implique une grande hétérogénéité à la fois structurelle et culturelle. Cette hétérogénéité se décline dans :

  • les sources de données variées (du microscope au satellite),
  • les champs disciplinaires multiples,
  • les infrastructures organisationnelles et techniques très différentes (du méga-octets au péta-octets),
  • plusieurs degrés de maturité dans les pratiques de gestion des données, …
  • des méthodes hétérogènes (exemples DOI, …).

Le projet COPiLOte s'articule selon trois lots d'activités:

  1. « Auto-évaluation » initiale puis soumission d’un dossier à Core Trust Seal,
  2. Production de guides de « bonnes pratiques »,
  3. Implémentation progressive.

Un cahier des charges réunit les critères du Core Trust Seal et les principes FAIR en tentant d'articuler toutes ces exigences.

CEDRE

Le contexte et les acteurs du projet CEDRE du pôle Terre solide, Form@ter, sont d'abord énoncés dans cette présentation. A l'instar d'ODATIS, une grande hétérogénéité est également observée : multiples disciplines, nombreux partenaires, nombreux moyens d'observation, ...

Le projet CEDRE visant la certification a à peu près la même philosophie que ceux d'ODATIS, en obtenant, à terme du projet, que les 2/3 des CDS finalisent leur dossier de certification ainsi que l'ensemble des CDS soient impliqués pour améliorer de façon significative leurs pratiques de gestion des données.

Implication des parties prenantes et lien avec RDA

Les réunions de démarrage des ces projets ANR sont planifiées fin 2019 - début 2020. Leur réalisation constituera une première étape en mettant l'accent sur la certification de chaque CDS en consolidant un système réparti, vers un plus haut degré d’harmonisation des CDSs, et en impliquant l'ensemble des parties prenantes :

  • au sein des pôles : coordinateurs des CDS, Data Scientists, Data Managers, IT, …
  • au niveau de la Direction de l’IR et de chacun des 4 Pôles
  • au niveau des organismes de tutelle : Mandats, Politiques de Données, Licences, ...
  • Le cas échéant, implication de ressources externes : experts, infrastructures informatique

Pour coordonner l'ensemble de ces actions au sein de l'IR Data Terra pour la gestion des données d'observation de la Terre, la création d'un groupe RDA France est envisagée. 

Plus d'information

Research Data Alliance RDA, réunion annuelle ODATIS et Data Terra