"

PGD Express

Source : photo de Brian Suman, licence Unsplash

Questions relatives à la documentation dans un PGD

Voici quelques exemples de questions qui vous seront posées à ce sujet dans un plan de gestion des données (PGD)[1]. Vous pouvez croiser une section qui portera le nom de « Documentation », « Métadonnées », « Schéma de métadonnées » ou une combinaison de ces termes.

  • Quelle documentation sera nécessaire pour que les données soient lues et interprétées correctement à l’avenir?
  • Comment allez-vous documenter les données en vue d’une réutilisation ou d’une validation future? Comment allez-vous consigner vos données pour qu’elles soient faciles à lire et à interpréter correctement tout au long du processus de recherche?
  • Quels sont vos principes, vos systèmes et vos principales normes en matière de gestion et de création de données ? Quelles métadonnées et quelle documentation conserverez-vous ?
  • Précisez les normes de données ou de métadonnées utilisées pour soutenir votre projet de recherche.
  • Comment veillerez-vous à ce que la documentation soit créée ou saisie de manière uniformisée et systématique tout au long de votre projet? Qui sera responsable de cette tâche?
  • Quelles métadonnées et quelle documentation (par exemple méthodologie de collecte et mode d’organisation des données) accompagneront les données ?
  • Les métadonnées seront-elles proposées de manière à pouvoir être moissonnées et indexées?

PGD Express

Documentation

Indiquez, selon le type de données que vous allez utiliser, quelle méthode de documentation vous allez employer. Votre documentation devra entre autres permettre de répondre aux questions suivantes à propos des données :

  • De quoi s’agit-il?
  • Qui les a créées?
  • Quand ont-elles été créées?
  • Comment ont-elles été créées?
  • Où ont-elles été récoltées/produites?

Exemple 1 : j’effectue une recherche où je vais recueillir des échantillons dans la toundra et les analyser ensuite en laboratoire

Avant de partir pour l’expédition, l’ensemble de l’équipe sera informé de quelle façon collecter et documenter les échantillons et les membres auront cette information avec eux sous format papier et électronique. La documentation lors de l’échantillonnage sera effectuée par le biais d’un formulaire papier uniforme qui indiquera quelle personne a effectué le prélèvement, à quel endroit, à quel moment et les conditions environnementales lors de la collecte. Le schéma de métadonnées ISO 19115 sera utilisé pour les coordonnées géographiques. Chaque soir, les formulaires seront pris en photo et identifiés de façon à relier l’échantillon, le papier et le numérique par leur nom.

De retour en laboratoire, les manuels d’utilisation des instruments et des logiciels seront disponibles à l’ensemble de l’équipe. La documentation terrain sera saisie sur ordinateur, dans un formulaire uniformisé. Les tests et les analyses seront documentés avec un cahier de laboratoire électronique (à déterminer).

Exemple 2 : jeffectue une recherche où je vais effectuer des entrevues qualitatives et des sondages auprès d’une population ciblée

Un guide d’entretien sera utilisé pour indiquer le contexte des entrevues et les questions à poser. Nous aurons recours à une piste de vérification (audit trail) pour les suivis et les modifications. Elle sera combinée au guide d’entretien.

Les résultats de sondages seront accompagnés d’un dictionnaire de données pour expliquer les variables, les codes employés et lister les questions.

Le codage utilisé pour faire l’analyse des réponses sera déposé dans GitHub.

Exemple 3 : j’effectue une recherche où je vais analyser un livre du Moyen-Âge en rapport avec une toile de la même époque :

Une méthodologie détaillée accompagnera la recherche et servira de base au fichier LISEZ-MOI qui sera déposé avec les données à la fin du projet.

Chaque photo du livre et de la toile sera documentée (date, lieu, contexte, description de l’élément photographié, qui a pris la photo et pourquoi) dans un fichier texte.

Les sources de documentation consultées (articles, livres, archives) seront listées dans un outil de gestion bibliographique (à déterminer).

Exemple 4 : je supervise un projet de recherche avec de nombreuses personnes impliquées, de différents établissements, et un grand nombre de types de données

Un comité formé de représentants des divers établissements sera responsable de définir les standards et les normes à respecter en matière de documentation et de les inscrire dans un guide.

Le guide expliquant de quelle façon documenter la recherche sera disponible à la racine de l’espace numérique utilisé par les équipes. Celui-ci sera mis à jour régulièrement et l’équipe sera informée lors des réunions et par courriel lorsqu’il y a des changements.

Une personne responsable dans chacune des équipes effectuera le contrôle de qualité (tel que décrit dans le guide) sur les données de son équipe.

Chaque membre de l’équipe devra documenter ses données et les traitements effectués sur celles-ci en suivant les recommandations du guide.

Exemple 5 : je réutilise des données déjà existantes

Les données préexistantes seront accompagnées d’une certaine documentation dans laquelle il sera possible de trouver des informations à propos de :

  • « leur provenance (corpus, archives…)
  • sur quels critères elles ont été sélectionnées
  • les conditions de réutilisations préexistantes de ces données » (Inist-CNRS, 2023)

Les données ne seront pas repartagées, mais les informations ci-dessus accompagneront le jeu de données du nouveau projet.

Normes et métadonnées

Les plans de gestion de données abordent souvent dans cette section des questions qui sont très liées, mais pas exclusivement, aux dépôts de données.

Des standards disciplinaires ou non seront peut-être utilisés pendant le projet de recherche, c’est l’occasion de les lister!

Exemples

L’utilisation d’un dépôt de données rendra les informations descriptives inscrites dans les champs de métadonnées compréhensibles par les machines et elles pourront être indexées. En contrepartie, le contenu d’un fichier qui accompagne vos données et qui contient vos métadonnées sera lisible par l’homme, mais ne sera pas nécessairement indexé par les machines et sera donc invisible pour les moteurs de recherche et les autres dépôts de données.

Exemples

Voici quelques exemples de réponses possible en lien avec l’utilisation des dépôts de données (traduction de Brenel, et al. 2023) :

  • « Les données seront déposées dans des dépôts (indiquez les noms dans la mesure du possible) qui permettront de moissonner et d’indexer les métadonnées en vue d’une utilisation à long terme.
  • Les données ne seront pas stockées dans des dépôts. Les métadonnées seront simplement décrites par un fichier CSV. Elles seront donc lisibles par l’homme, mais ni moissonnées ni indexées.
  • Afin de faciliter la combinaison avec d’autres données, un format ouvert et non propriétaire ainsi qu’un vocabulaire commun à la communauté scientifique seront utilisés. Les métadonnées seront lisibles par machine et normalisées (Dublin Core, DataCite, DDI, etc.).
  • Le standard de métadonnées sera défini par le dépôt choisi (il sera décidé au courant de l’avancement du projet). »

Liste de validation

Voici ce que le groupe d’experts sur la planification de la gestion des données de l’Alliance de recherche numérique recommande d’avoir dans cette section : un plan clair pour les documents et les métadonnées selon les méthodes utilisées et selon le type de données. Le cas échéant, décrire les normes des métadonnées mises en place et expliquer assez clairement les documents et processus de métadonnées pour l’ensemble du cycle de vie des données. S’il y a lieu, décrire les hiérarchies, les livres de codes, les dictionnaires de données, les fichiers LISEZ-MOI, les notes de laboratoire ou prises sur le terrain, les codes, la syntaxe ou les conventions de nommage de fichiers[2].

Dans votre plan de gestion des données, vous avez mentionné les éléments suivants :

  • De quelle façon vous vous assurerez que vos données soient compréhensibles.
  • La forme prendra votre documentation.
  • Si vous avez une équipe, comment vous allez vous assurerez que l’ensemble des membres uniformisera ses données et sa documentation.
  • Les normes (standards, schémas de métadonnées, vocabulaires contrôlés, etc.) que vous allez utiliser, le cas échéant.

Bibliographie

Brenel, M., Diallo, M., Mainali, S., Mercier, C., Shi, Z., & Suhan, S. (2023). Guidelines for Data Management Plan within the framework of Horizon Europe: RIA, IA, CSA, EIC Pathfinder, Cofund. (Version 1). https://doi.org/10.5281/zenodo.10123889

Groupe d’experts sur la planification de la gestion des données. (2025). Grille du modèle de l’Alliance simplifié (demande de financement). Zenodo. https://doi.org/10.5281/zenodo.15650075 

Inist-CNRS. (2023). Parcours interactif sur la gestion des données de la recherche. DORANum. https://doi.org/10.13143/3XNZ-AS06


  1. Source des questions : modèles de l’Alliance numérique de recherche, de la Plateforme transatlantique et de l’Agence nationale de la recherche.
  2. Tiré de la Grille du modèle de l'Alliance simplifié (demande de financement). https://doi.org/10.5281/zenodo.15650075