• #métadonnées #obsolescence #format_ouvert #standardisation #catalogage #archives #budget #astronomie #SHS #Gaia

      C’est dans ce contexte qu’est né en 2012 le projet interdisciplinaire #Predon, sous l’impulsion de Cristinel Diaconu, directeur de recherche au CNRS1 : « L’explosion du volume de #données issues des expériences menées au Cern nous a conduits à mener une réflexion autour de leur préservation. Nous avons dans un premier temps structuré notre communauté autour d’une organisation internationale nommée Data Preservation and Long Term Analysis in High Energy Physics. Par la suite, nous nous sommes aperçus que nombre de disciplines étaient confrontées à la même préoccupation. C’est de ce constat que nous est venue l’idée de former une communauté interdisciplinaire autour de la question de la préservation des données scientifiques. »

      [...] Mais, pour Cristinel Diaconu, la perte de données semble être le lot commun : « Quand on veut accéder aux données, ou on ne les trouve plus, ou on les trouve, mais on ne sait pas quoi faire parce qu’on ne comprend pas ce que c’est. Pire, certaines données ont parfois été détruites par les chercheurs qui les jugeaient inutiles à l’issue d’un projet. Sur le coup, on ne s’en rend pas compte mais, dix après, le projet en cours peut avoir une résonance avec le projet précédent et le potentiel de découverte est perdu car il n’y a plus de financement pour refaire ces manipulations. »

      Pourtant, ces données archivées représentent une vraie manne. Cristinel Diaconu s’est livré à un calcul de rentabilité de ces données pour son domaine : « Nous nous sommes rendu compte avec mon équipe que le coût supplémentaire dédié à la préservation des données est de l’ordre de 1/1 000 du budget total. Or la publication de nouveaux articles issue de l’exploitation des archives dans les cinq années suivantes représente un bénéfice de 10 %. C’est de la recherche qui ne coûte presque rien ! Si on n’a pas de stratégie de préservation des données, on passe à côté de découvertes potentielles et de recherche à bas coût. Une fois qu’elles sont bien préservées, les données ne coûtent presque plus rien. »

      http://www.huma-num.fr
      Formats autorisés au CINES : https://facile.cines.fr