Si je comprends bien l’état des choses actuellement, la question prioritaire est :
Comment stocker l’information issue du dépouillement du corpus ?
De ce point de vue, et en fonction de ce que tu dis des données, il n’y a pas trente-six solutions. Il y a plusieurs types d’unités statistiques ou entités, pour parler comme la modélisation de données (manuscrit, figure, date de la fête etc. cf. infra) qui ont entre elles des relations complexes (une figure est présente de 0 à n fois sur un manuscrit, éventuellement à plusieurs dates du calendrier).
De ce fait, la façon de stocker (coder) l’information consiste à enregistrer une ligne par association c-à-d, telle figure est présente dans tel manuscrit, fêtée tel jour. Donc, une ligne, trois colonnes.
Par ailleurs, il y a différentes tables
• manuscrit et toutes les informations le concernant (date, lieu, lien avec un rite) et aussi, type (ménologique ou non) et s’il y a lieu, période du calendrier couverte (début, fin) et période du calendrier effectivement couverte (pour les manuscrits incomplets) Y a-t-il besoin d’une autre entité, le texte, qu’on voit apparaître dans ta description (un manuscrit comprend différents textes, susceptibles de se retrouver dans d’autres manuscrits (?))
• figure, idem, les caractéristiques éventuelles. Note qu’il est peut-être souhaitable d’imaginer deux niveaux pour ces données : la personne et l’ événement la concernant qui est commémoré. Ex. Marie avec différents événements, commémorés à différentes dates, conception, nativité, présentation, assomption…
Ceci devrait régler la question de la granularité des données et permettre de disposer d’une souplesse quant à la granularité des traitements. En effet, des manipulations plus ou moins élémentaires (selon l’environnement de travail) permettent de relier les différentes entités pour fabriquer un tableau à étudier. Par exemple un tableau qui croise les manuscrits et les figures (soit, présence/absence, soit nombre d’occurrences) avec plein de trous partout), tableau que l’on pourra analyser.
A priori, pour la saisie, ne pas se restreindre et conserver toutes les figures (on peut toujours sélectionner après) et donc toutes les associations.
Voilà une première réaction, issue de méditations pendant mes courses dans le quartier…