Gestion des fichiers

La création d’une stratégie concernant la façon dont vous allez gérer vos fichiers tout au long du processus de recherche est un élément fondamental de votre plan global de gestion des données. Un projet de recherche peut comporter de multiples fichiers dans une variété de formats, de multiples versions de fichiers, des feuilles de calcul, des images, des notes de laboratoire, des bandes d’entretien, etc., qui sont essentiels au projet. Il est beaucoup plus facile d’établir de bonnes pratiques de gestion des fichiers dès le départ que d’essayer d’organiser le travail à mi-chemin du projet.

La gestion des fichiers de votre projet vous apportera des avantages par la suite en :

  • Augmentant votre efficacité
  • Réduisant les risques de perte ou de redondance des fichiers
  • Augmentant la portée de votre recherche en facilitant le partage des fichiers
  • Assurant le respect des exigences légales et éthiques ou des politiques
  • Fournissant un registre clair du processus de recherche
  • Facilitant la conservation à la fin du projet

Les éléments essentiels de la gestion des fichiers d’un projet sont les suivants :

  • L’adoption et le suivi de conventions de dénomination des dossiers et des fichiers
  • La création d’une hiérarchie claire des dossiers
  • La sauvegarde du contenu des fichiers
  • Le suivi des versions des fichiers
  • La connaissance des formats de fichiers utilisés pour la conservation à long terme

Structure des répertoires

Lorsque vous organisez vos fichiers, pensez à inclure des éléments tels que le titre du projet, un identifiant unique et la date (année) dans le nom du répertoire du dossier. La sous-structure doit inclure une convention de dénomination claire et consignée; par exemple, chaque composant ou exécution d’une expérience, chaque version d’un ensemble de données ou chaque personne du groupe. La structure doit suivre un modèle cohérent, clairement reconnaissable par l’ensemble du groupe de recherche.

Les éléments des conventions de noms de fichiers (ci-dessous) s’appliquent également aux noms des dossiers du répertoire.

Conventions de dénomination des fichiers

Les fichiers du projet doivent être nommés et organisés de manière cohérente et descriptive, d’une façon logique et prévisible pour vous-même et pour les autres. Des distinctions claires entre les fichiers faciliteront une navigation et une récupération efficaces et efficientes des fichiers.

Il y a trois choses à garder à l’esprit lors de l’étiquetage des données :

  • L’organisation : importante pour l’accès et la récupération futurs
  • Le contexte : il peut s’agir d’informations descriptives ou propres au contenu, indépendamment de l’endroit où les données sont stockées
  • La cohérence : choisissez une convention de dénomination et veillez à ce que les règles soient suivies systématiquement en incluant toujours les mêmes informations (telles que la date et l’heure) dans le même ordre et selon le même format (par exemple AAAAMMJJ)

Envisagez d’utiliser plusieurs des éléments suivants dans les noms de fichiers :

  • Nom, numéro ou acronyme du projet
  • Nom de famille et initiales du créateur
  • Nom de l’équipe ou du département de recherche associé aux données
  • Numéro de version du fichier
  • Date de création
  • Date du début de l’expérience
  • Description du contenu
  • Date de publication

Autres considérations :

  • Gardez les noms de fichiers d’une longueur gérable, de préférence 25 caractères ou moins
  • Ne donnez pas aux fichiers le même nom que le dossier dans lequel ils se trouvent
  • Évitez d’utiliser des symboles inhabituels tels que : ! – @ # $ % ^ & * ( ) [] {}+ ? > <
  • Évitez d’utiliser des espaces. À la place des espaces entre les mots, utilisez l’une des méthodes suivantes :
  • Utilisez une majuscule pour la première lettre de chaque mot :
  • ProjetAcronymeSujetDuDocumentDate.pdf
  • ProjetAcronymeNomDeFamillePrénom.txt
  • ProjectAcronymLastNameFirstNameTopic.txt
  • Utilisez un trait de soulignement entre chaque mot :
  • Acronymeduprojet_sujet_du_document_date.pdf
  • Acronymeduprojet_NomDeFamille_Prénom.txt
  • ProjectAcronym_last_name_first_name_topic.txt

Envisagez d’utiliser des systèmes de contrôle de version pour renommer en masse les fichiers au besoin.

Si, à mi-parcours d’un projet, il est nécessaire de renommer un grand nombre de fichiers pour les rendre conformes à une convention de dénomination systématique que vous avez adoptée, il existe un certain nombre d’outils pour faciliter ce processus.

Exemples d’outils de renommage de fichiers (outils en anglais) :

Versionnage

Le versionnage ou contrôle de version fait référence à la gestion des révisions de fichiers. Le versionnage aide les chercheurs à gérer les données au cours d’un projet où des expérimentations, des révisions et des réexamens sont effectués. Les fichiers texte ainsi que les fichiers de données peuvent subir de nombreuses modifications avant que la version finale ne soit établie.

Les mécanismes de versionnage tels que la structure des répertoires et les conventions de dénomination des fichiers aident les utilisateurs à différencier les différentes versions d’un ensemble de données et des fichiers qui l’accompagnent.

Les chercheurs devraient également envisager de se débarrasser des versions obsolètes des fichiers. Il convient de prendre des décisions prudentes quant à l’utilisation future des fichiers avant de les éliminer. Dans certains cas, il peut être conseillé de conserver des copies de sauvegarde des versions.

Un certain nombre d’outils sont disponibles pour le versionnage des fichiers, notamment (outils en anglais) :

Apache Subversion
Git

Sauvegarde des fichiers

La sauvegarde des fichiers consiste à créer des copies de fichiers. Ces copies doivent résider dans un emplacement physique distinct des fichiers de travail ou stockés. La mise en place d’un programme de sauvegarde régulier limite les risques de perte de données et les copies de sauvegarde peuvent être utilisées pour restaurer des fichiers originaux endommagés ou perdus.

Remerciements

Nous tenons à remercier le UK Data Service pour l’utilisation de leur matériel de formation dans la création de ces modules.

Nous tenons également à remercier EDINA et la Data Library de l’Université d’Édimbourg pour l’utilisation du matériel du cours en ligne Research Data MANTRA dans la création de ces modules.