La création d’une stratégie concernant la façon dont vous allez gérer vos fichiers tout au long du processus de recherche est un élément fondamental de votre plan global de gestion des données. Un projet de recherche peut comporter de multiples fichiers dans une variété de formats, de multiples versions de fichiers, des feuilles de calcul, des images, des notes de laboratoire, des bandes d’entretien, etc., qui sont essentiels au projet. Il est beaucoup plus facile d’établir de bonnes pratiques de gestion des fichiers dès le départ que d’essayer d’organiser le travail à mi-chemin du projet.
La gestion des fichiers de votre projet vous apportera des avantages par la suite en :
Les éléments essentiels de la gestion des fichiers d’un projet sont les suivants :
Lorsque vous organisez vos fichiers, pensez à inclure des éléments tels que le titre du projet, un identifiant unique et la date (année) dans le nom du répertoire du dossier. La sous-structure doit inclure une convention de dénomination claire et consignée; par exemple, chaque composant ou exécution d’une expérience, chaque version d’un ensemble de données ou chaque personne du groupe. La structure doit suivre un modèle cohérent, clairement reconnaissable par l’ensemble du groupe de recherche.
Les éléments des conventions de noms de fichiers (ci-dessous) s’appliquent également aux noms des dossiers du répertoire.
Les fichiers du projet doivent être nommés et organisés de manière cohérente et descriptive, d’une façon logique et prévisible pour vous-même et pour les autres. Des distinctions claires entre les fichiers faciliteront une navigation et une récupération efficaces et efficientes des fichiers.
Il y a trois choses à garder à l’esprit lors de l’étiquetage des données :
Envisagez d’utiliser plusieurs des éléments suivants dans les noms de fichiers :
Autres considérations :
Envisagez d’utiliser des systèmes de contrôle de version pour renommer en masse les fichiers au besoin.
Si, à mi-parcours d’un projet, il est nécessaire de renommer un grand nombre de fichiers pour les rendre conformes à une convention de dénomination systématique que vous avez adoptée, il existe un certain nombre d’outils pour faciliter ce processus.
Exemples d’outils de renommage de fichiers (outils en anglais) :
Le versionnage ou contrôle de version fait référence à la gestion des révisions de fichiers. Le versionnage aide les chercheurs à gérer les données au cours d’un projet où des expérimentations, des révisions et des réexamens sont effectués. Les fichiers texte ainsi que les fichiers de données peuvent subir de nombreuses modifications avant que la version finale ne soit établie.
Les mécanismes de versionnage tels que la structure des répertoires et les conventions de dénomination des fichiers aident les utilisateurs à différencier les différentes versions d’un ensemble de données et des fichiers qui l’accompagnent.
Les chercheurs devraient également envisager de se débarrasser des versions obsolètes des fichiers. Il convient de prendre des décisions prudentes quant à l’utilisation future des fichiers avant de les éliminer. Dans certains cas, il peut être conseillé de conserver des copies de sauvegarde des versions.
Un certain nombre d’outils sont disponibles pour le versionnage des fichiers, notamment (outils en anglais) :
Apache Subversion Git
La sauvegarde des fichiers consiste à créer des copies de fichiers. Ces copies doivent résider dans un emplacement physique distinct des fichiers de travail ou stockés. La mise en place d’un programme de sauvegarde régulier limite les risques de perte de données et les copies de sauvegarde peuvent être utilisées pour restaurer des fichiers originaux endommagés ou perdus.
Nous tenons à remercier le UK Data Service pour l’utilisation de leur matériel de formation dans la création de ces modules.
Nous tenons également à remercier EDINA et la Data Library de l’Université d’Édimbourg pour l’utilisation du matériel du cours en ligne Research Data MANTRA dans la création de ces modules.