FOIRE AUX QUESTIONS

Dernière mise à jour : 20/05/2025

Vous avez une question sur les activités proposées par DoRANum ou sur les données de la recherche ? Vous trouverez probablement une réponse ici ! Dans le cas contraire, vous pouvez contribuer au développement de cette FAQ en nous envoyant votre question.

Pour naviguer dans la FAQ, vous pouvez cliquer sur les icônes des thématiques dans le menu ci-dessous. Bonne visite !

DoRANum
Enjeux et bénéfices
Aspects juridiques, éthiques, intégrité scientifique
Plan de gestion de données
Métadonnées
Identifiants pérennes
Dépôt et entrepôts
Stockage et archivage
Data papers et data journals
Accès et visualisation

DORANUM

  • Les ressources pédagogiques DoRANum sont librement réutilisables selon les conditions fixées par les licences utilisées. Lorsque cela est possible, les ressources sont sous la Licence ouverte Etalab. Dans le cas où une ressource utilise des éléments (images, textes,…) porteurs d’une licence plus restrictive, cette licence sera appliquée à la ressource dans son ensemble. Elles peuvent aussi être intégrées sur votre site internet ou votre plateforme web.

  • Nous proposons des formations en présentiel à la demande. Nous organisons régulièrement des webinaires dont le calendrier est annoncé sur le site de l’Inist-CNRS.

  • Dans la mesure où votre projet correspond au cahier des charges de la plateforme DoRANum, il est possible de collaborer avec l’équipe en vue d’une publication sur la plateforme. Précisez-nous votre demande via notre formulaire de contact.

  • Il est possible de s’abonner aux actualités en vous rendant en bas de la page d’accueil de DoRANum, et en vous abonnant aux réseaux sociaux de l’Inist.

  • Oui, les fiches synthétiques des 9 thématiques de DoRANum sont traduites en anglais, et les vidéos “minutes” proposent des sous-titres anglais. Il est prévu que d’autres ressources soient également traduites.

ENJEUX & BÉNÉFICES

  • Si vous en avez la possibilité, il ne faut pas hésiter à demander de l’aide aux personnes compétentes dans votre organisme pour chaque thématique (service juridique, informaticiens, documentalistes, data librarian etc…).
    Vous pouvez aussi consulter le catalogue CatOPIDoR qui recense les services dédiés aux données de la recherche en France. Vous pourrez filtrer votre recherche par localisation et voir quels organismes peuvent vous aider dans votre démarche.

ASPECTS JURIDIQUES, ÉTHIQUES, INTEGRITE SCIENTIFIQUE

  • Oui, le PGD concerne toutes les données produites ou réutilisées au cours d’un projet, quel que soit leur type ou leur nature. Par contre, si vos données sont soumises à restrictions (brevet par exemple), vous devez indiquer pourquoi vous ne pouvez pas les rendre publiques.

  • Non ce n’est pas le rôle du PGD, c’est plutôt celui du cahier de laboratoire.

  • Non, le PGD n’a aucune valeur juridique. C’est un livrable dans le cadre de projets financés, et non un contrat. Il ne permet donc pas de garantir légalement l’exécution du processus de diffusion des données défini dans le PGD.

  • Il est très important d’aborder dans le PGD les aspects de la gestion des données qui auront trait à une éventuelle confidentialité. Cela permet justement d’anticiper tous les problèmes susceptibles d’en découler.
    Il est tout à fait possible que le PGD lui-même soit tenu confidentiel, y compris à l’issue du projet.

  • Vous devez vous rapprocher du service juridique de votre institution de rattachement. Vous pouvez aussi consulter cette liste.

  • « Une production scientifique en accès ouvert est plus facile à obtenir mais elle n’est pas moins protégée qu’un document en accès restreint. La libre disponibilité des contenus sur le Web facilite la bonne attribution des travaux scientifiques et le bon fonctionnement des logiciels anti-plagiat. Par ailleurs, le dépôt d’un jeu de données dans un entrepôt de confiance permet de lui attribuer un identifiant afin qu’il soit correctement cité et que votre contribution soit reconnue. Fermer votre travail derrière des barrières techniques ou physiques, c’est perdre en visibilité, sans pour autant écarter le risque de plagiat. » https://www.ouvrirlascience.fr/wp-content/uploads/2023/10/Enrezdebat-WEB.pdf

PLAN DE GESTION DE DONNÉES (PGD) : Projets

  • Non le PGD n’est exigé que si vous êtes financé et ne peut donc pas être un critère pour être lauréat d’un appel à projet. Par contre réfléchir à la gestion des données de recherche et anticiper les besoins dans le domaine peut sûrement aider à structurer ou bien préparer son dossier.

  • Au contraire, commencer à rédiger un PGD en amont peut permettre de mieux argumenter une demande de subvention. En effet, le PGD est un réel outil de gestion de projet. C’est un guide qui permet d’anticiper la gestion des données aussi bien avec votre équipe qu’avec d’éventuels partenaires. Plus vous le commencez tôt, mieux c’est !

  • La rédaction d’un PGD est recommandée pour tout projet, qu’il soit financé ou non. Dans le cadre de votre travail quotidien (avec votre équipe, votre laboratoire, votre structure par exemple), le PGD permet d’anticiper l’organisation et la gestion des données, et ainsi de gagner en temps et en efficacité !

  • Non, ce n’est pas possible. Il faut rédiger un PGD par projet. C’est d’autant plus vrai si les projets sont financés par des organismes de financement différents.

PLAN DE GESTION DE DONNÉES (PGD) : Hors projets

  • Il est tout à fait possible de rédiger un PGD hors projet, pour gérer plus efficacement les données au niveau d’un laboratoire. Les modèles de PGD pour les entités sont bien adaptés dans ce cas. Plusieurs de ces modèles sont disponibles sur DMP OPIDoR.

  • Un PGD est plus exhaustif qu’un projet de thèse. Il aborde davantage de notions. En outre, un PGD a vocation à être complété / corrigé tout au long du doctorat (ou de tout projet de recherche), alors qu’un projet de thèse est un livrable ponctuel.
    En revanche, un projet de thèse est une bonne base pour élaborer un PGD. En effet, ces deux documents abordent des thématiques communes (objectifs du projet de recherche, type de données qui serviront à l’appuyer, etc.).

PLAN DE GESTION DE DONNÉES (PGD) : Modèles et outils

  • Il est possible d’utiliser DMP OPIDoR dans le cadre de collaborations internationales. En effet, l’outil est disponible aussi en anglais et les collaborateurs étrangers peuvent se créer un compte gratuitement.
    Par ailleurs, il existe d’autres outils anglophones parmi lesquels :

  • Il n’existe pas à proprement parler de recommandations concernant le choix d’un outil.
    Il est tout à fait possible de rédiger votre PGD à partir d’un outil bureautique; cependant, il existe des outils dédiés à la rédaction de PGD.
    En France, DMP OPIDoR vous accompagne à travers l’élaboration et la mise en pratique de plans de gestion de données et de logiciels. Il suffit de créer un compte pour rédiger son (ses) plan(s) de gestion des données. Vous pouvez créer, exporter et partager votre DMP. C’est un outil collaboratif qui facilite les échanges entre les partenaires d’un même projet et les services d’accompagnement.
    DMP OPIDoR est également personnalisable par tout organisme de recherche pour la mise en place de sa politique de données. Il est possible d’ajouter des modèles et des recommandations de PGD, des exemples ou des réponses par défaut.

  • Le plus simple est de vous référer à la sélection de sources d’accès à des PGD du site CoopIST du CIRAD, dans laquelle vous trouverez différentes plateformes de création de PGD qui proposent des PGD publics. Il y en a également dans des bases de données bibliographiques, des archives ouvertes de publications, des entrepôts de données de recherche, des moteurs de recherche académiques et des revues scientifiques.

  • Déposer son PGD dans une archive ouverte comme HAL est tout à fait possible. Cela permet de partager vos pratiques en matière de gestion de données auprès de vos pairs. N’oubliez pas de lier le PGD et les jeux de données qu’il décrit en renseignant leurs identifiants pérennes respectifs.

  • Oui, tout à fait. La majorité des modèles de PGD sont proposés dans un format ouvert, librement utilisable par tout un chacun.

  • La plupart du temps, les financeurs recommandent des modèles sans pour autant les imposer. Dans ce cas, vous pouvez choisir celui qui vous convient le mieux, par exemple celui de votre établissement s’il en propose un.

  • Oui, car vous allez à nouveau agir sur ces données. Comment les sélectionnerez-vous pour les réutiliser ? Où les stockerez-vous ? Quels traitements allez-vous leur appliquer ? Allez-vous les conserver après votre projet ? Etc.
    S’il vous manque des informations sur le contexte de production de ces données, le PGD est justement l’occasion d’expliquer ces lacunes en détails, afin que vous ne puissiez pas être pénalisé ensuite si un problème est mis au jour.

  • Idéalement, il faut fournir le plus de détails possible. Demandez-vous de quelles informations vous auriez besoin si vous étiez extérieur à votre projet de recherche, et que vous deviez reproduire votre expérience / refaire votre cheminement intellectuel vingt ans plus tard.
    Les informations à fournir concernent aussi bien des aspects scientifiques (quel protocole de collecte ? quelles questions de recherche ? quelles adaptations au terrain ? etc.) que des aspects techniques (quel matériel ? quels réactifs ? quels paramètres ? quelle périodicité ? etc.) ou informatiques (quelle version du logiciel ? quel éditeur ? quel script ? etc.).
    Pour avoir une idée des détails à fournir dans vos disciplines, n’hésitez pas à lire des PGD rédigés.

PLAN DE GESTION DE DONNÉES (PGD) : Rédaction et contenu

  • Le PGD doit contenir les informations sur toutes les données produites mais également sur les données existantes réutilisées au cours du projet.

  • Le PGD peut être modifié à tout moment au cours d’un projet de recherche. Idéalement, dès qu’un élément de réponse change, il faut consigner cette modification dans le PGD.

    Exemples :

    • Nouveau jeu de données
    • Modification du volume estimé
    • Changement du logiciel utilisé pour le traitement des données
    • Changements de personnels
    • Avancée des réflexions sur le choix d’un standard de métadonnées
    • Avancée des réflexions sur le choix d’un entrepôt ou d’une plateforme d’archivage pérenne
    • Recommandations d’un juriste ou d’un comité d’éthique
    • Informations sur les coûts
    • etc.
  • Dès lors qu’il y a des partenaires ou financeurs non francophones impliqués dans le projet, il est plus judicieux de rédiger votre PGD en anglais directement. Cela facilite la collaboration pour sa rédaction ou la relecture pour les financeurs. L’interface DMP OPIDoR est disponible en anglais et en français. De nombreux modèles sont également disponibles dans les deux langues.

  • N’importe quel participant au projet peut être responsable de la rédaction d’un PGD. Il peut aussi s’agir d’une responsabilité collégiale.

  • Il est important de répondre à toutes les questions : soit vous avez la réponse et vous la renseignez, soit vous n’avez pas encore la réponse et vous le mentionnez, soit vous n’êtes pas concerné et vous l’indiquez.
    Aucune réponse n’est définitive, le PGD est un document évolutif, vous pourrez compléter les réponses aux questions au fur et à mesure de l’avancée du projet.

  • Cela dépend de votre approche, de votre projet de recherche. Le logiciel peut jouer un triple rôle dans la recherche :

    • Il sert d’outil dans de nombreux domaines, en traitant efficacement divers types de données pour construire et tester des modèles visant à étayer ou invalider des hypothèses.
    • Il peut constituer en lui-même un résultat de recherche, en tant que preuve d’existence d’une solution algorithmique efficace pour un problème donné.
    • Il peut être lui-même objet de recherche. En particulier, la communauté scientifique s’intéresse aux modes de développement des logiciels et à la preuve de leurs propriétés, en lien notamment avec la transparence et la confiance dans les traitements informatisés.

    Dans tous les cas, il est recommandé de les inclure dans le PGD et de déposer les codes sources dans un entrepôt (indiquer l’entrepôt choisi dans le PGD).
    A noter qu’il existe des modèles de PGD spécialement dédiés aux logiciels comme le modèle PRESOFT.

PLAN DE GESTION DE DONNÉES (PGD) : aspects juridiques

  • Il faut indiquer les difficultés et contraintes liées au partage des données, pourquoi vous ne pouvez pas les partager (données sensibles, confidentielles, etc.).

MÉTADONNÉES

  • Des métadonnées techniques sont créées automatiquement et embarquées avec le fichier de données (type d’élément, taille, date de création …).
    Des métadonnées externes sont ajoutées au moment du dépôt dans un entrepôt de données. Lors du dépôt des données, les entrepôts proposent des formulaires à travers une interface (champs de métadonnées à renseigner) et souvent des API pour charger les métadonnées, qui peuvent être renseignées préalablement dans des tableurs. Certains entrepôts mettent à disposition des outils pour créer les métadonnées.
    Les champs de métadonnées proposées par les entrepôts s’appuient en général sur des standards génériques (comme Dublin Core ou Datacite) ou plus spécifiques (comme EML en écologie, DDI en sciences sociales…). La richesse des métadonnées est un critère de choix de l’entrepôt.
    A noter également que lors de l’attribution de l’identifiant pérenne DOI à un jeu de données, un fichier comportant des métadonnées suivant le schéma de Datacite doit être fourni. Ces métadonnées permettront de rechercher le jeu de données grâce au moteur de recherche DataCite Search.

  • Pour permettre leur validation, leur reproductibilité ou leur réutilisation, les données ne doivent pas être partagées seules mais doivent être accompagnées de métadonnées les plus riches possible. Par exemple, le dépôt peut être accompagné d’un document (un fichier “Read me”) expliquant le contexte, la méthodologie, les outils / logiciels utilisés et toutes les informations indispensables à la réutilisation de vos données. Un dictionnaire de données permettant d’expliciter les variables mesurées peut également être fourni séparément. Par exemple, pour un fichier tabulé, il peut être nécessaire d’expliquer les entêtes des colonnes, les unités utilisées, les acronymes, etc.

  • Vous pouvez trouver des vocabulaires contrôlés ici :
    ISTEX Loterre
    Plus d’autres liens vers d’autres catalogues

IDENTIFIANTS PÉRENNES

  • Il est recommandé de n’attribuer un PID à une donnée (ou un jeu de données) que lorsque celle-ci est définitivement validée et prête à être publiée. La granularité doit être assez fine afin de permettre une citation précise. Par exemple, si dans une publication un jeu de données est cité, son DOI doit pointer vers le jeu de données lui-même et non pas vers la totalité de la base de données qui le contient ou vers la collection à laquelle il appartient. On peut attribuer un DOI au jeu de données, un autre à la collection et un troisième à la base de données. Ces DOI seront reliés entre eux grâce aux métadonnées.

  • Les métadonnées (informations sur les données) fournies lors de la création d’un DOI sont en accès libre. Elles sont stockées par DataCite et exposées, via des protocoles appropriés, au moissonnage par des moteurs de recherche dédiés. DataCite ne stocke pas les données mais uniquement les métadonnées.

  • Lorsque vous déposez un jeu de données doté d’un DOI dans un entrepôt :

    • soit l’entrepôt n’attribue pas lui-même de DOI, vous gardez donc votre DOI ;
    • soit l’entrepôt attribue des DOI. Vérifiez alors auprès de ce nouvel entrepôt la possibilité de garder votre DOI. Certains le permettent (par exemple Zenodo).
  • Dans la mesure du possible, il faut éviter d’attribuer plusieurs identifiants pérennes à un même jeu de données car un identifiant pérenne à vocation à être unique.

  • Oui, cela est possible en le déposant par exemple dans l’archive ouverte HAL.

  • Il est possible d’attribuer un DOI à une plateforme en renseignant la propriété obligatoire ResourceTypeGeneral par « Service » et préciser quel type de service en texte libre.

DEPÔT & ENTREPÔTS

  • Le CNRS dispose d’un espace institutionnel nommé “CNRS research data” dans l’entrepôt national pluridisciplinaire Recherche Data Gouv.

  • La plupart du temps, les données déposées dans un entrepôt ne sont pas validées par les pairs. Ce sont les chercheurs (ou l’équipe scientifique) qui sélectionnent les données à déposer selon leur intérêt scientifique pour le projet, ou pour permettre une éventuelle réutilisation par d’autres équipes de recherche.

  • Si vous choisissez un entrepôt certifié et sécurisé, vous n’avez pas besoin de déposer dans plusieurs entrepôts. Cette pratique est même fortement déconseillée. Un dépôt dans un entrepôt permet d’obtenir un identifiant pérenne. Déposer son jeu de données dans plusieurs entrepôts signifie que vous aurez plusieurs identifiants pérennes à gérer. Cela pose également un problème de lisibilité de la citation de votre jeu de données, avec un risque d’éparpillement.

    Source : Foire aux questions du groupe de travail “Atelier Données”. https://gt-atelier-donnees.miti.cnrs.fr/faq.html#endroits

  • Oui, il est tout à fait possible de faire évoluer un jeu de données déposé dans un entrepôt. Certains entrepôts de données proposent un suivi de versions des jeux de données. C’est par exemple le cas des entrepôts de données réalisés avec la technologie Dataverse.

    Chaque jeu de données (fichiers de données + métadonnées) publié est associé à un DOI et une ” empreinte numérique ” permettant d’attester de la fiabilité (authenticité et intégrité) des données.

    • En cas de changements mineurs (ajout ou modification de métadonnées qui ne changent pas la citation), une version mineure du jeu de données est créée
    • En cas de changement majeur (ajout ou modification de métadonnées qui changent la citation, ajout ou suppression de fichiers de données), une version majeure du jeu de donnée est créée et est associée à une nouvelle ” empreinte numérique “
    • Dans tous les cas, le DOI ne change pas et renvoie vers la page descriptive de la version la plus récente du jeu de données ; l’entrepôt offrant la possibilité d’accéder aux versions antérieures du jeu de données à partir de cette page
    • Exemple sur le portail Dataverse de Harvard
  • Les entrepôts proposent en général un format de citation. Pour les autres types de dépôt, veillez à indiquer les éléments indispensables (par exemple auteur, titre, date, ….). DataCite propose également un choix de modèles de citation lors de l’attribution d’un DOI.
    Voici deux exemples de citations proposées par des entrepôts :
    – Duchêne, Eric, 2019, “Vitis vinifera cv. Riesling developmental stages”, https://doi.org/10.15454/GYSGNR, Recherche Data Gouv, V3, UNF:6:Qe/3b5e0IdlZsQ5EBqpHwA== [fileUNF]
    – Ferré, Chiara; Comolli, Roberto (2019): Soil properties and humus forms in 50-year old and 80-year Red Oak stands and native mixed forests of Lombardy plain. PANGAEA, https://doi.org/10.1594/PANGAEA.905854,
    Supplement to: Ferré, C; Comolli, R (accepted): Effects of Quercus rubra on soil properties and humus forms in 50-year old and 80-year old forest stands of Lombardy plain. Annals of Forest Science, 77(1), https://doi.org/10.1007/s13595-019-0893-0.
    Pour plus de détails, vous pouvez consulter : https://dataverse.org/best-practices/data-citation.
    Quand vous citez un jeu de données provenant d’un entrepôt spécifique, pensez à lui notifier l’article dès que celui-ci est publié pour que l’entrepôt puisse établir un lien depuis le jeu de données cité vers votre article.

    Source : Foire aux questions du groupe de travail “Atelier Données”. https://gt-atelier-donnees.miti.cnrs.fr/faq.html#citer

  • Selon les entrepôts, différentes fonctions peuvent être proposées pour contrôler l’accès aux données et offrir des statistiques d’usage. Le choix par le déposant d’utiliser ou non une des ces fonctions pour contrôler l’accès aux données devrait faire l’objet d’une réflexion en amont, dans la phase de préparation – gestion des données : quelles données peut-on envisager de partager ? quelles données seraient éligibles au partage ?

  • Comme pour les publications, vous pouvez mettre un embargo sur les données que vous envisagez de partager et préciser des dates d’embargo au niveau du dépôt dans un entrepôt de données. A savoir que certains entrepôts (comme l’entrepôt Recherche Data Gouv) offrent la possibilité de générer une URL privée permettant de donner un accès reservé aux données pour les relecteurs d’un article.

  • Cela dépend de vos pratiques, il n’y a pas de règle générale. Le plus souvent les chercheurs déposent leurs données à la fin du projet.
    Dans le cas de projets sur du très long terme, il peut être décidé en effet de déposer dans un entrepôt de données les jeux au fur et à mesure. Dans ce cas, tout aura été déterminé au préalable et explicité dans le plan de gestion de données (dans quel entrepôt, à quelle fréquence, par quel partenaire, avec quel standard de métadonnées, avec quelle licence etc.)
    “Vous n’avez pas besoin d’attendre que vos données soient parfaites pour les partager. Elles peuvent toujours être très utiles à d’autres. En outre, le fait de partager vos données à un stade précoce peut aider à mettre en évidence les erreurs ou les incohérences qu’il convient de corriger avant de publier vos résultats.” https://callisto-formation.fr/pluginfile.php/13538/mod_scorm/content/9/scormcontent/index.html#/lessons/7Br3omxbZjKibNhRzV0JJ6K9MEDpD4w9

STOCKAGE & ARCHIVAGE

DATA PAPERS

Oups ! Il n’y a pas encore de questions par ici. Si vous en avez, n’hésitez pas à nous contacter via le formulaire ci-dessous et nous vous répondrons le plus rapidement possible.

ACCÈS ET VISUALISATION

Oups ! Il n’y a pas encore de questions par ici. Si vous en avez, n’hésitez pas à nous contacter via le formulaire ci-dessous et nous vous répondrons le plus rapidement possible.

Votre question n’apparaît pas dans cette FAQ ?

Laissez-nous un message, nous vous répondrons au plus vite !

    OSZAR »