Généralités

Le pôle de données et de services pour l’océan ODATIS a pour objectif général de promouvoir et faciliter l’utilisation des données d'observations réalisées dans l’océan, à partir de mesures in situ et de télédétection pour répondre à l'enjeu scientifique et sociétal de décrire, quantifier et comprendre l’océan dans sa globalité ou à son interface avec les autres milieux.

Cela nécessite des infrastructures interopérables permettant d'assurer la diffusion, le partage, la sauvegarde et l’usage intelligent et transversal des données. Le développement de la science ouverte, la mise en oeuvre des principes FAIR et la certification des entrepôts de données offrent un cadre et une ligne directrice pour la mise en oeuvre d'une telle politique de gestion des données.

Science ouverte

A l'automne 2020, le CNRS met en place son "Plan Données de la recherche » pour inciter les scientifiques à rendre leurs données accessibles et réutilisables. Ce plan fait suite à sa Feuille de route pour la science ouverte publiée en 2019.
Passeport pour la Science Ouverte (2020) à l'usage des doctorants, rassemble bonnes pratiques et outils pour partager et diffuser ses contenus scientifique. En 2023, ce passeport est actualisé avec de nouveaux contenus pédagogique (lien); notamment une vidéo de 5 minutes sur la gestion des données et le cycle de vie des données de la recherche.

Guide de bonnes pratiques sur la gestion des données de la recherche

Le Comité pour la science ouverte du Ministère de l’Enseignement supérieur et de la Recherche publie le Passeport pour la Science Ouverte (2020) à l'usage des doctorants qui rassemble bonnes pratiques et outils pour partager et diffuser ses contenus scientifique. En 2023, ce passeport est actualisé avec de nouveaux contenus pédagogique (lien); notamment une vidéo de 5 minutes (ci-contre) sur la gestion des données et le cycle de vie des données de la recherche.

L'Atelier Données du groupe de travail inter-réseaux de la  Mission pour les initiatives transverses et interdisciplinaires (MITI) – CNRS, guidé par le « Plan National pour la Science Ouverte », publie un "Guide de bonnes pratiques sur la gestion des données de la recherche" avec des ressources pragmatiques à chaque étape de gestion des données, calée ici sur le cycle de la donnée : imaginer et préparer, Concevoir et planifier, collecter, traiter, analyser, préserver et archiver, publier et diffuser.

La gestion des données et le cycle de vie des données de la recherche. Crédits Egon Heuson. ouvrirlascience. [Vidéo]. Canal-U.

Principes FAIR

Les principes FAIR "Findable, Accessible, Interoperable, Reusable" (Facile à trouver, Accessible, Interopérable, Réutilisable), de gestion des données fonctionnent comme une ligne directrice pour garantir une utilisation optimale des données de recherche et des métadonnées associées, à la fois par les hommes et par les machines.

Ces principes s'appliquent aux jeux de données des Centres de Données et Services (en étant définis dans leur cahier des charges) référencés au catalogue ODATIS, à tous les projets financés par le programme H2020 (listes et liens vers ceux-ci), recommandations pour les données de la recherche CNRS (plus d'information sur la feuille de route du CNRS).
Dans le cadre du projet ANR COPiLOtE, le pôle ODATIS met à disposition des CDS un guide pour évaluer leur maturité sur l'ensemble des principes et harmoniser l’implémentation de ces principes : Guide ANR COPiLOtE Guide principes FAIR - Principes FAIR dans le contexte du pôle ODATIS.

Plusieurs autres actions du pôle ODATIS présentent les principes FAIR à appliquer aux données et métadonnées des données marines en général ou pour des disciplines plus spécifiques:

Schéma interactif des principes FAIR; cliquez sur chaque item pour plus d'information. Crédits détaillés dans le lien "Références".

Certification Core Trust Seal

La certification Core Trust Seal évalue des critères relatifs aux entrepôts de données selon plusieurs niveaux de conformité. Cette étape de certification est importante pour garantir: la fiabilité et la durabilité des dépôt de données ainsi que l’archivage et le partage à long terme des données. La Research Data Alliance (RDA) fournit un cadre commun pour la mise en œuvre et la maintenance des dépôts numériques selon 16 critères organisés en 3 thèmes (Infrastructure organisationnelle, Gestion des objets numériques des données et des metadonnées et Technologie:

L'outil  en ligne CRUSÖE, développé par le SEDOO, permet d'évaluer les critères R0 à R16 de la certification Core Trust Seal. 

  • R0. Contexte général : type d’entrepôt, description de l’entrepôt, description de la communauté concernée, niveau de curation, contenu en accès tel que déposé, curation de base et avancée, curation au niveau des données, partenaires,... 

Infrastructure organisationnelle

  • R1. Mission/Périmètre : L’entrepôt de données a pour mission explicite de donner accès  à des données dans son domaine et de les préserver.
  • R2. Licences : L’entrepôt  maintient  toutes  les  licences  applicables  à  l'accès  et à l'utilisation des données et en surveille la conformité.
  • R3. Continuité de l'accès: L’entrepôt dispose d'un plan de continuité pour assurer un accès continu à ses collections et leur préservation. 
  • R4.  Confidentialité/éthique: L’entrepôt  garantit,  dans  la  mesure  du  possible,  que  les  données  sont créées, conservées, qu’on y accède et qu’elles sont utilisées dans le respect des normes disciplinaires et éthiques. 
  • R5.  Infrastructure organisationnelle: L’entrepôt  dispose  d'un  financement  adéquat  et  d'un  nombre  suffisant d'employés qualifiés gérés par un système de gouvernance clair pour mener à bien sa mission.
  • R6. Conseils d’experts: L’entrepôt adopte un ou plusieurs mécanismes pour s’entourer de  façon continue d’avis et commentaires d’experts (en interne ou en externe, incluant une  expertise scientifique si le besoin en est pertinent).

Gestion des objets numériques

  • R7. Intégrité et authenticité des données: L’entrepôt garantit l'intégrité et l'authenticité des données.
  • R8. Appréciation et sélection des données:  L’entrepôt accepte des données et des métadonnées sur la base de critères définis garantissant  pertinence et intelligibilité pour les utilisateurs
  • R9.  Procédures d’archivage documentées: L’entrepôt  applique  des  processus  et  des  procédures  documentés  pour l'archivage des données.
  • R10. Plan de préservation: L’entrepôt de données assume la responsabilité de la préservation à long terme et gère cette fonction de façon planifiée et documentée. 
  • R11. Qualité des données: L’entrepôt dispose de l’expertise appropriée pour traiter la question de la qualité  technique  des  données  et  métadonnées  et  pour  assurer  qu’une information  suffisante  est  accessible  aux  utilisateurs  pour  leur  permettre d’évaluer la qualité des données. 
  • R12. Processus de traitement (Workflows):  L'archivage  s'effectue  selon  des  processus  de  traitement  (workflows) précisément définis, de l’ingestion des données à leur diffusion.
  • R13. Découverte et identification des données: L’entrepôt permet aux utilisateurs de découvrir les données et d’y faire référence de façon pérenne par un mécanisme de citation approprié.
  • R14.  Réutilisation des données : L’entrepôt permet de réutiliser les données sur la durée, en veillant à ce que  des  métadonnées  appropriées  soient  disponibles  pour  permettre    la compréhension et l’utilisation des données. 

Technologie

  • R15. Infrastructure technique L’entrepôt  fonctionne  avec  des  systèmes  d'exploitation  et  d'autres systèmes  de  base  bien  maintenus  et  utilise  des  technologies  matérielles  et logicielles adaptées aux services qu'il fournit à sa communauté cible. 
  • R16. Sécurité:  L'infrastructure  technique  de  l’entrepôt  assure  la  protection  de l'installation  et  de  ses  données,  de  ses  produits,  de  ses  services  et  de  ses utilisateurs.

Le projet COPiLOtE du pôle océan ODATIS, s'intéresse à la Certification des Centres de Données et de Services avec plusieurs objectifs: harmoniser l’implémentation des principes FAIR à l’ensemble des Centres de Données ODATIS, améliorer la qualité des données et services proposés par les Centres de Données, pour atteindre les exigences édictées par la RDA en vue d’une certification «Core Trust Seal». Le pôle Océan ODATIS, dans le cadre de ce projet COPiLOtE, organise un support continu pour accompagner les CDS dans leur démarche de certification : sessions régulières et individuelles, ateliers techniques (présentations sur les principes FAIR, les identifiants permanents (DOI, PID, ...), les métadonnées et interopérabilité sémantique, ...Retrouvez les présentations faites lors des ateliers techniques, à partir de cette page.