• #Internet_Archive : la bibliothèque qui a survécu, mais à quel prix

    L’Internet Archive vient de franchir une étape symbolique : sa #Wayback_Machine, l’immense outil d’#archivage du Web, a enregistré sa milliardième page. San Francisco a même déclaré le 22 octobre « Internet Archive Day » pour célébrer trois décennies consacrées à la #sauvegarde du #patrimoine_numérique mondial. Pourtant, derrière cette reconnaissance se cache une réalité plus amère. Après plusieurs années de batailles juridiques épuisantes, l’organisation fondée par #Brewster_Kahle a certes survécu, mais elle a perdu une partie essentielle de son âme.

    « Nous avons survécu, mais cela a anéanti la bibliothèque », confie Kahle, fondateur du projet, à Ars Technica. L’Archive n’a plus de poursuites en cours, mais elle sort exsangue d’un #conflit qui lui a fait retirer plus d’un demi-million de #livres de sa plateforme #Open_Library. Ces pertes marquent la fin d’un chapitre fondateur de la #numérisation libre des savoirs.

    Fondé en 1996, l’Internet Archive voulait être une Bibliothèque d’Alexandrie du numérique – mais « avec un meilleur plan contre les incendies », plaisante l’avocat et bibliothécaire Kyle Courtney. Dès 2001, la Wayback Machine avait pour ambition d’offrir un accès libre et permanent à l’histoire du Web. Son créateur, #Lawrence_Lessig, y voyait un outil de #transparence_démocratique : la preuve concrète que la #mémoire d’Internet méritait d’être protégée au même titre que les livres.

    Tout a basculé durant la pandémie de 2020. Pour pallier la fermeture des bibliothèques, l’Internet Archive a levé temporairement les restrictions d’emprunt de son Open Library, permettant à tous d’accéder aux #livres_numériques pendant le confinement. Ce geste solidaire a été perçu par les éditeurs comme une violation massive du #droit_d’auteur. Après quatre ans de procédures, la #justice américaine a tranché : le modèle de prêt contrôlé utilisé par l’Archive n’était pas conforme. Les dommages réclamés auraient pu atteindre 400 millions $ US, mais un accord confidentiel a permis d’éviter la faillite.

    La tempête ne s’est pas arrêtée là. En 2025, un autre procès a visé le « #Great_78_Project », un programme de numérisation de vieux #disques 78 tours, menacé par des amendes allant jusqu’à 700 millions $. Là encore, un règlement à l’amiable a sauvé l’organisation, mais au prix d’un recul majeur pour les projets de conservation sonore.

    Pour Kahle, ces batailles ont affaibli la mission même des bibliothèques. « Les grands conglomérats médiatiques ne se contentent plus du droit d’auteur : ils veulent le #contrôle total de l’accès à l’information », déplore-t-il. L’un des objectifs de l’Open Library était d’offrir à #Wikipédia la possibilité de lier directement ses articles à des livres numérisés, rendant ainsi la recherche en ligne plus rigoureuse. Les procès ont mis fin à cette ambition.

    Les juristes s’accordent à dire que ces décisions ne remettent pas en cause le principe du « #fair_use », mais elles marquent la limite de ce que la loi permet. Brandon Butler, directeur de Re:Create, estime que l’Archive a « testé les frontières du #droit_d’usage_équitable » et que les tribunaux ont répondu : « On ne va pas plus loin. » Pour les bibliothèques, la conséquence est claire : chaque projet de #numérisation comportera désormais un #risque_juridique dissuasif.

    Les inquiétudes vont bien au-delà du droit. Kahle s’inquiète d’une société où les bibliothèques rétrécissent, où l’éducation recule, et où le contrôle de la connaissance passe entre les mains des grandes plateformes technologiques. « Quand une société grandit, elle construit des bibliothèques. Quand elle décline, elle les détruit », résume-t-il. Pour lui, la concentration du pouvoir entre les gouvernements et les entreprises menace directement la #mémoire_collective.

    Malgré tout, Kahle refuse de baisser les bras. L’Internet Archive mise désormais sur « #Democracy’s_Library », une base de données ouverte réunissant les publications et recherches gouvernementales du monde entier, liées à Wikipédia pour renforcer la transparence scientifique. Le fondateur veut aussi faire de l’organisation un #refuge pour les collections menacées et continuer à numériser tout ce qui peut encore l’être.

    « Nous voulons que tout le monde soit lecteur, » affirme Kahle. « Cela suppose des éditeurs, des libraires, des bibliothèques. Mais allons-nous dans cette direction ? Non. » Pour lui, il est urgent de repenser le droit d’auteur pour que « le jeu ait plusieurs gagnants » – auteurs, éditeurs, bibliothécaires et citoyens. Alors, dit-il, il sera encore temps de réfléchir à la place de l’intelligence artificielle dans ce fragile équilibre entre mémoire, accès et créativité humaine.

    https://moncarnet.com/2025/11/10/internet-archive-la-bibliotheque-qui-a-survecu-mais-a-quel-prix

    –-

    L’article original en anglais:
    Internet Archive’s legal fights are over, but its founder mourns what was lost
    https://arstechnica.com/tech-policy/2025/11/the-internet-archive-survived-major-copyright-losses-whats-next

    #bibliothèque #archive #web #internet

  • Un #Commun_numérique fête ses 25 ans : #Internet_Archive
    https://framablog.org/2021/10/24/un-commun-numerique-fete-ses-25-ans-internet-archive

    Par curiosité ou nécessité, vous avez sûrement essayé de savoir à quoi ressemblait une ancienne page web, et vous avez utilisé la #Wayback_machine pour remonter le temps. Eh bien ce génial service, qui permet d’accéder à des clichés instantanés … Lire la suite­­

    #Internet_et_société #Libres_Cultures #Libres_Services #Anniversaire #Brewster_Kahle #Traduction

  • Le site #Internet_Archive mis en danger par des poids lourds de l’édition

    Sous la pression d’une #plainte déposée devant un tribunal new-yorkais par quatre poids lourds de l’édition aux États-Unis, le site Internet Archive a décidé d’avancer de 15 jours la fermeture de sa #bibliothèque_d’urgence, créée en réponse à l’#épidémie de #coronavirus.

    Une infraction « massive et délibérée » au #droit_de_reproduction. C’est ce que quatre éditeurs, dont la filiale américaine du groupe #Hachette, reprochent au site Internet Archive, connu notamment pour son archivage du web mondial, la #Wayback_Machine, dans laquelle on peut retrouver des pages web disparues.

    Mais l’Internet Archive, c’est aussi une immense #médiathèque, riche de millions de #livres, #films, #images, jeux vidéo et documents sonores. Côté bibliothèque, son « but ultime » est de « mettre tous les travaux publiés de l’humanité à la disposition de tous dans le monde ». Chacun·e, à condition d’être inscrit·e, peut emprunter jusqu’à dix livres à la fois, pour une durée de quinze jours. Les livres sont prêtés sous la forme de fichiers pdf. Selon Internet Archive, 17 500 livres sont empruntés chaque jour.

    Comme dans une bibliothèque classique, un livre doit être disponible pour pouvoir être emprunté – une règle que le site a « concoctée de toutes pièces », lui reprochent les plaignants. Ce concept du « #prêt_numérique_contrôlé » autorise un prêt à la fois pour un livre numérisé donné. Soutenu par le Conseil des directeurs des bibliothèques d’État des États-Unis, il n’avait encore jamais été mis en cause devant les tribunaux.

    Ce qui a décidé les #maisons_d’édition à risquer un #procès pas gagné d’avance, c’est la #Bibliothèque_nationale_d’urgence mise en place à la fin du mois de mars par Internet Archive, pour répondre à la fermeture des écoles, bibliothèques et universités en raison du coronavirus, et donc à l’impossibilité d’aller y chercher des livres. Installé aux États-Unis, le site avait simplement décidé de « suspendre les listes d’attente […] pendant toute la durée de l’urgence nationale américaine » : c’est-à-dire qu’il n’y avait plus besoin qu’un livre (numérique) revienne pour être emprunté à nouveau. Plusieurs lecteurs pouvaient ainsi en bénéficier en même temps.

    Mercredi 10 juin, son fondateur, #Brewster_Kahle, a publié sur son blog un billet (https://blog.archive.org/2020/06/10/temporary-national-emergency-library-to-close-2-weeks-early-returning-) pour annoncer la fin prochaine du dispositif, avancée au 16 juin, espérant trouver avec les détenteurs de droits « un système qui marche ».

    Son initiative a été soutenue publiquement par des dizaines de bibliothèques et d’universités, ces institutions se revendiquant du principe du « #fair_use », qui autorise des dérogations aux droits de reproduction, particulièrement quand il s’agit d’enseignement, et selon les circonstances. C’est le cas, estime Brewster Kahle, de l’épidémie due au coronavirus.

    Au contraire, cette ouverture des portes numériques est intervenue, selon les éditeurs, au pire moment, celui-là « même où de nombreux auteurs, éditeurs et librairies indépendantes, sans parler des bibliothèques, luttent pour survivre ». Le risque pour Internet Archive est vital, la loi sur le #droit_d’auteur (#Copyright_Act) autorisant des #dommages_et_intérêts pouvant atteindre 150 000 dollars par œuvre en cas de violation délibérée. Si le site propose au prêt 1,3 million de livres, certains sont toutefois dans le #domaine_public.

    « La #gratuité est un concurrent indépassable », estiment les éditeurs dans leur plainte, rappelant l’argument le plus éculé de l’industrie musicale. Internet Archive « ne fait qu’exploiter les investissements que les éditeurs ont faits dans leurs livres », accusent-ils, et « au moyen d’un modèle économique conçu pour profiter librement du travail des autres ». La plainte s’acharne à démontrer que l’Internet Archive serait une entreprise commerciale vivant de la #numérisation des livres, un travail qu’elle effectue contre rémunération pour les bibliothèques. Urgence ou pas, elle demande la destruction de toutes les copies illégales.

    Avec les livres prêtés par l’Internet Archive, on est pourtant loin du mp3 recopié ou downloadé en clic. Brewster Kahle rappelle dans une lettre adressée le 10 avril à Thom Tillis, un sénateur républicain président de la Commission sur la #propriété_intellectuelle, réservé sur la légalité du procédé, que son organisation, sans but lucratif, est régulièrement reconnue comme bibliothèque par la Californie. Cela fait bientôt dix ans, dit-il, que les livres sont prêtés selon la règle « #un_lecteur_à_la_fois ». De plus, se défend le fondateur de la bibliothèque, « nos livres numériques sont protégés par les mêmes protections techniques que celles utilisées par les éditeurs pour garantir que les lecteurs n’ont accès à un livre que pendant les deux semaines de son prêt, et que des copies supplémentaires ne peuvent être faites ».

    Toujours à destination de l’élu républicain, il explique : « Vos électeurs ont payé pour des millions de livres auxquels ils n’ont pas accès actuellement » – 15 millions de livres bloqués derrière les portes fermées de 323 bibliothèques, rien qu’en Caroline du Nord, l’État du sénateur, a compté Brewster Kahle.

    Aux éditeurs, il fait remarquer que la bibliothèque d’urgence ne comporte aucun livre publié il y a moins de cinq ans ; 90 % des livres empruntés ont plus de dix ans, et deux tiers datent du XXe siècle. Quant aux auteurs qui ne voudraient pas que leurs livres soient ainsi prêtés, il leur suffit de le demander par mail, poursuit Kahle. Certains ont au contraire, affirme-t-il, demandé à figurer dans la bibliothèque numérique.

    Dès le 31 mars, la Guilde des auteurs avait mobilisé ses membres contre la bibliothèque d’urgence, parlant de « piratage pur et simple », et proposé un modèle de réclamation. Ce groupement d’auteurs avait déjà fait connaître son désaccord avec le prêt de livres numérisés selon le principe « un livre papier, une copie numérique » en janvier 2019. Le #Syndicat_national_des_auteurs (#National_Writers_Unions) a de son côté préféré entamer des discussions amiables avec Internet Archive et les défenseurs du prêt numérique contrôlé.

    L’Internet Archive est en effet, aux États-Unis, loin d’être la seule bibliothèque à pratiquer de la sorte. La pratique du prêt numérisé contrôlé est théorisée, défendue et pratiquée par de nombreux juristes et des bibliothèques universitaires ou locales, comme celles des villes de Los Angeles, San Francisco et Boston. Un livre imprimé peut être prêté : c’est le principe des bibliothèques. Il doit en être de même pour sa déclinaison à l’identique au format numérique, un exemplaire numérique prêté à une personne à la fois.

    En attendant la décision du tribunal new-yorkais, des internautes se posent à travers le monde la question d’archiver l’Internet Archive et ses téraoctets de documents.

    https://www.mediapart.fr/journal/culture-idees/110620/le-site-internet-archive-mis-en-danger-par-des-poids-lourds-de-l-edition
    #open_access #confinement #édition_scientifique #recherche #justice