VIDEO. Grand débat national : un an après, le contenu introuvable des cahiers de doléances
►https://www.francetvinfo.fr/politique/gouvernement-d-edouard-philippe/grand-debat-national-le-contenu-introuvable-des-cahiers-de-doleances_37
#lol
VIDEO. Grand débat national : un an après, le contenu introuvable des cahiers de doléances
►https://www.francetvinfo.fr/politique/gouvernement-d-edouard-philippe/grand-debat-national-le-contenu-introuvable-des-cahiers-de-doleances_37
#lol
#océrisation à la #BNF du verbe océriser comme de bien entendu « qui aurait couté plusieurs millions d’euros » si elle avait été faite …
#Excuse_bidon, je vois pas comment 16 000 cahiers de doléance à scanner et à récupérer en #OCR (système image to texte assez rapide) peut couter plusieurs millions.
On va être riches bientôt, voila la ligne à un million à lancer dans un terminal …
<code>tesseract image.jpg texte.txt</code>
▻https://doc.ubuntu-fr.org/tesseract-ocr
[EDIT] Ah mais non, tout ça a déjà été fait, c’est juste le stockage des fichiers numériques qui pèserait trop lourd.
Bon allez, on va estimer chaque cahier à 1Go (à 5ko la page ça fait vraiment beaucoup de pages)
= 16000Go, équivalent au stockage que Niels propose sur les mails free à … 1600 personnes. Alors Xavier, Manu, un problème de compréhension du web ?
Une cagnotte pour vous offrir un serveur ?