• Bibliothèque d’urgence ou urgence économique : Internet Archive, “inutile procès”
    https://www.actualitte.com/article/lecture-numerique/bibliotheque-d-urgence-ou-urgence-economique-internet-archive-inutile-proces/101912?origin=newsletter

    À l’occasion d’une conférence de presse via Zoom, d’une trentaine de minutes, le fondateur de Internet Archive a appelé les grands groupes américains à renoncer à leur plainte. « Un procès inutile », expliquait-il ce 22 juillet, considérant que l’interprofession devrait plutôt œuvrer de concert pour « aider les enseignants, les parents et particulièrement les élèves ».

    Dérapage incontrôlé

    À sa suite, plusieurs autres intervenants plaidaient en faveur du Prêt Numérique Contrôlé — solution hybride par laquelle l’IA a scanné et mis à disposition 1,4 million de titres encore sous droit. Rappelant la vocation de toute bibliothèque — acheter, conserver et prêter — Kahle assimile donc cette approche à celui de tout autre établissement.

    Ce modèle repose sur le concept 1 livre = 1 utilisateur, celui-là même qui est en vigueur pour les ouvrages papier. « Le prêt numérique contrôlé est une pratique largement répandue et qui date, pour les bibliothèques. » Et de glisser que depuis neuf années qu’existe Internet Archive, cette solution a avant tout fait des heureux.

    Sauf que les éditeurs ne l’ont pas vu de cet œil, décidant de porter plainte, et contraignant la plateforme à fermer sa bibliothèque d’urgence. Les plaignants jurent leurs grands dieux qu’Internet Archive est « impliquée dans une vaste violation délibérée du droit d’auteur ». Rien que cela.

    « La plainte s’en prend au concept même d’une bibliothèque qui posséderait et prêterait des livres numériques, remettant en cause l’idée même de ce qu’est une bibliothèque dans un monde numérique », rétorquait pourtant la plateforme. Mais en vain : en période de crise sanitaire, les intérêts financiers priment. Quant à la perspective de dommages-intérêts juteux, elle ne laisse pas l’ombre d’un doute.

    Mais pour les éditeurs à l’origine de l’action, la messe est dite, et Internet Archive représente une bête à dépecer, maintenant qu’il faut renflouer les caisses. « Avec ce procès, les éditeurs affirment que dans le monde numérique, les bibliothèques ne peuvent plus acheter de livres. Nous ne pouvons que les proposer sous licences et selon leurs conditions. Nous ne pouvons les conserver qu’en vertu des modalités qu’ils nous accordent, avec une autorisation explicite, et durant la période de temps pour laquelle nous avons l’autorisation », reprend le fondateur d’IA.

    De quoi se remémorer que depuis l’apparition du livre numérique, un conflit ouvert entre bibliothécaires et éditeurs se poursuit. Les premiers demandant qu’on ne leur impose pas des conditions trop drastiques — surtout financièrement. Quand les seconds tentent, parfois en facturant 3 à 5 fois le prix public d’un ebook, de se nourrir sur le truand. Le tout en prétextant sans honte ni vergogne que le prêt numérique cannibalise les ventes, et qu’il faut bien se récupérer quelque part.

    “En aucun cas une menace”

    Internet Archive devra présenter ses arguments devant le juge le 28 juillet. Évidemment, aucune indication sur la stratégie qui sera adoptée n’a été communiquée. Dans ce combat, un allié de poids s’est récemment manifesté : Electronic Frontier Foundation, organisation de défense des droits des internautes.

    Elle avait annoncé fin juin qu’elle soutiendrait le site dans le procès qui s’annonce. « L’EFF est fière d’être aux côtés d’Internet Archive et de protéger cet important service public. Le prêt numérique contrôlé aide des professeurs, élèves et plus généralement le public à accéder aux livres, à un moment où cela est difficile et plus nécessaire que jamais. Il ne constitue en aucun cas une menace », indiquait Corynne McSherry, directrice juridique.

    #Bibliothèques #Confinement #Internet_archive #Prêt_numérique

  • Le site #Internet_Archive mis en danger par des poids lourds de l’édition

    Sous la pression d’une #plainte déposée devant un tribunal new-yorkais par quatre poids lourds de l’édition aux États-Unis, le site Internet Archive a décidé d’avancer de 15 jours la fermeture de sa #bibliothèque_d’urgence, créée en réponse à l’#épidémie de #coronavirus.

    Une infraction « massive et délibérée » au #droit_de_reproduction. C’est ce que quatre éditeurs, dont la filiale américaine du groupe #Hachette, reprochent au site Internet Archive, connu notamment pour son archivage du web mondial, la #Wayback_Machine, dans laquelle on peut retrouver des pages web disparues.

    Mais l’Internet Archive, c’est aussi une immense #médiathèque, riche de millions de #livres, #films, #images, jeux vidéo et documents sonores. Côté bibliothèque, son « but ultime » est de « mettre tous les travaux publiés de l’humanité à la disposition de tous dans le monde ». Chacun·e, à condition d’être inscrit·e, peut emprunter jusqu’à dix livres à la fois, pour une durée de quinze jours. Les livres sont prêtés sous la forme de fichiers pdf. Selon Internet Archive, 17 500 livres sont empruntés chaque jour.

    Comme dans une bibliothèque classique, un livre doit être disponible pour pouvoir être emprunté – une règle que le site a « concoctée de toutes pièces », lui reprochent les plaignants. Ce concept du « #prêt_numérique_contrôlé » autorise un prêt à la fois pour un livre numérisé donné. Soutenu par le Conseil des directeurs des bibliothèques d’État des États-Unis, il n’avait encore jamais été mis en cause devant les tribunaux.

    Ce qui a décidé les #maisons_d’édition à risquer un #procès pas gagné d’avance, c’est la #Bibliothèque_nationale_d’urgence mise en place à la fin du mois de mars par Internet Archive, pour répondre à la fermeture des écoles, bibliothèques et universités en raison du coronavirus, et donc à l’impossibilité d’aller y chercher des livres. Installé aux États-Unis, le site avait simplement décidé de « suspendre les listes d’attente […] pendant toute la durée de l’urgence nationale américaine » : c’est-à-dire qu’il n’y avait plus besoin qu’un livre (numérique) revienne pour être emprunté à nouveau. Plusieurs lecteurs pouvaient ainsi en bénéficier en même temps.

    Mercredi 10 juin, son fondateur, #Brewster_Kahle, a publié sur son blog un billet (https://blog.archive.org/2020/06/10/temporary-national-emergency-library-to-close-2-weeks-early-returning-) pour annoncer la fin prochaine du dispositif, avancée au 16 juin, espérant trouver avec les détenteurs de droits « un système qui marche ».

    Son initiative a été soutenue publiquement par des dizaines de bibliothèques et d’universités, ces institutions se revendiquant du principe du « #fair_use », qui autorise des dérogations aux droits de reproduction, particulièrement quand il s’agit d’enseignement, et selon les circonstances. C’est le cas, estime Brewster Kahle, de l’épidémie due au coronavirus.

    Au contraire, cette ouverture des portes numériques est intervenue, selon les éditeurs, au pire moment, celui-là « même où de nombreux auteurs, éditeurs et librairies indépendantes, sans parler des bibliothèques, luttent pour survivre ». Le risque pour Internet Archive est vital, la loi sur le #droit_d’auteur (#Copyright_Act) autorisant des #dommages_et_intérêts pouvant atteindre 150 000 dollars par œuvre en cas de violation délibérée. Si le site propose au prêt 1,3 million de livres, certains sont toutefois dans le #domaine_public.

    « La #gratuité est un concurrent indépassable », estiment les éditeurs dans leur plainte, rappelant l’argument le plus éculé de l’industrie musicale. Internet Archive « ne fait qu’exploiter les investissements que les éditeurs ont faits dans leurs livres », accusent-ils, et « au moyen d’un modèle économique conçu pour profiter librement du travail des autres ». La plainte s’acharne à démontrer que l’Internet Archive serait une entreprise commerciale vivant de la #numérisation des livres, un travail qu’elle effectue contre rémunération pour les bibliothèques. Urgence ou pas, elle demande la destruction de toutes les copies illégales.

    Avec les livres prêtés par l’Internet Archive, on est pourtant loin du mp3 recopié ou downloadé en clic. Brewster Kahle rappelle dans une lettre adressée le 10 avril à Thom Tillis, un sénateur républicain président de la Commission sur la #propriété_intellectuelle, réservé sur la légalité du procédé, que son organisation, sans but lucratif, est régulièrement reconnue comme bibliothèque par la Californie. Cela fait bientôt dix ans, dit-il, que les livres sont prêtés selon la règle « #un_lecteur_à_la_fois ». De plus, se défend le fondateur de la bibliothèque, « nos livres numériques sont protégés par les mêmes protections techniques que celles utilisées par les éditeurs pour garantir que les lecteurs n’ont accès à un livre que pendant les deux semaines de son prêt, et que des copies supplémentaires ne peuvent être faites ».

    Toujours à destination de l’élu républicain, il explique : « Vos électeurs ont payé pour des millions de livres auxquels ils n’ont pas accès actuellement » – 15 millions de livres bloqués derrière les portes fermées de 323 bibliothèques, rien qu’en Caroline du Nord, l’État du sénateur, a compté Brewster Kahle.

    Aux éditeurs, il fait remarquer que la bibliothèque d’urgence ne comporte aucun livre publié il y a moins de cinq ans ; 90 % des livres empruntés ont plus de dix ans, et deux tiers datent du XXe siècle. Quant aux auteurs qui ne voudraient pas que leurs livres soient ainsi prêtés, il leur suffit de le demander par mail, poursuit Kahle. Certains ont au contraire, affirme-t-il, demandé à figurer dans la bibliothèque numérique.

    Dès le 31 mars, la Guilde des auteurs avait mobilisé ses membres contre la bibliothèque d’urgence, parlant de « piratage pur et simple », et proposé un modèle de réclamation. Ce groupement d’auteurs avait déjà fait connaître son désaccord avec le prêt de livres numérisés selon le principe « un livre papier, une copie numérique » en janvier 2019. Le #Syndicat_national_des_auteurs (#National_Writers_Unions) a de son côté préféré entamer des discussions amiables avec Internet Archive et les défenseurs du prêt numérique contrôlé.

    L’Internet Archive est en effet, aux États-Unis, loin d’être la seule bibliothèque à pratiquer de la sorte. La pratique du prêt numérisé contrôlé est théorisée, défendue et pratiquée par de nombreux juristes et des bibliothèques universitaires ou locales, comme celles des villes de Los Angeles, San Francisco et Boston. Un livre imprimé peut être prêté : c’est le principe des bibliothèques. Il doit en être de même pour sa déclinaison à l’identique au format numérique, un exemplaire numérique prêté à une personne à la fois.

    En attendant la décision du tribunal new-yorkais, des internautes se posent à travers le monde la question d’archiver l’Internet Archive et ses téraoctets de documents.

    https://www.mediapart.fr/journal/culture-idees/110620/le-site-internet-archive-mis-en-danger-par-des-poids-lourds-de-l-edition
    #open_access #confinement #édition_scientifique #recherche #justice

  • Covid hoaxes are using a loophole to stay alive—even after being deleted | MIT Technology Review
    https://www.technologyreview.com/2020/04/30/1000881/covid-hoaxes-zombie-content-wayback-machine-disinformation

    Pandemic conspiracy theorists are using the Wayback Machine to promote ’zombie content’ that avoids content moderators and fact-checkers.

    by Joan Donovan archive page
    April 30, 2020

    PHOTO BY CHRIS HALL ON UNSPLASH
    Since the onset of the pandemic, the Technology and Social Change Research Project at Harvard Kennedy’s Shorenstein Center, where I am the director, has been investigating how misinformation, scams, and conspiracies about covid-19 circulate online. If fraudsters are now using the virus to dupe unsuspecting individuals, we thought, then our research on misinformation should focus on understanding the new tactics of these media manipulators. What we found was a disconcerting explosion in “zombie content.”

    While the original page failed to spread fake news, the version of the page saved on the Internet Archive’s Wayback Machine absolutely flourished on Facebook. With 649,000 interactions and 118,000 shares, the engagement on the Wayback Machine’s link was much larger than legitimate press outlets. Facebook has since placed a fact-check label over the link to the Wayback Machine link too, but it had already been seen a huge number of times.

    There are several explanations for this hidden virality. Some people use the Internet Archive to evade blocking of banned domains in their home country, but it is not simply about censorship. Others are seeking to get around fact-checking and algorithmic demotion of content.

    When looking for more evidence of hidden virality, we searched for “web.archive.org” across platforms. Unsurprisingly, Medium posts that were taken down for spreading health misinformation have found new life through Wayback Machine links. One deleted Medium story, “Covid-19 had us all fooled, but now we might have finally found its secret,” violated Medium’s policies on misleading health information. Before Medium’s takedown, the original post amassed 6,000 interactions and 1,200 shares on Facebook, but the archived version is vastly more popular—1.6 million interactions, 310,000 shares, and still climbing. This zombie content has better performance than most mainstream media news stories and, yet it only exists as an archived record.

    Perhaps the most alarming element to a researcher like me is that these harmful conspiracies permeate private pages and groups on Facebook. This means researchers have access to less than 2 % of the interaction data, and that health misinformation circulates in spaces where journalists, independent researchers and public health advocates can not assess or counterbalance these false claims with facts. Crucially, if it weren’t for the Internet Archive’s records we would not be able to do this research on deleted content in the first place, but these use cases suggest that the Internet Archive will soon have to address how their service can be adapted to deal with disinformation.

    Hidden virality is growing in places where Whatsapp is popular because it’s easy to forward misinformation through encrypted channels and evade content moderation. But when hidden virality happens on Facebook with health misinformation, it is particularly disconcerting. More than 50% of Americans rely on Facebook for their news, and still, after many years of concern and complaint, researchers have a very limited window into the data. This means it’s nearly impossible to ethically investigate how dangerous health misinformation is shared on private pages and groups.

    All of this is a threat for public health in a different way than political or news misinformation, because people do quickly change their behaviors based on medical recommendations.

    #Fake_news #Viralité #Internet_archive #zombie_content #Joan_Donovan

  • Si vous n’aviez pas encore assez de choses à lire, l’Internet Archive supprime les listes d’attente et met directement à disposition 1,4 millions de livres. Bon là le nombre de ressources deviennent tellement énormes que juste le temps de choisir quoi télécharger, on arrivera à la fin du confinement.

    Announcing a National Emergency Library to Provide Digitized Books to Students and the Public | Internet Archive Blogs
    https://blog.archive.org/2020/03/24/announcing-a-national-emergency-library-to-provide-digitized-books-to-

    To address our unprecedented global and immediate need for access to reading and research materials, as of today, March 24, 2020, the Internet Archive will suspend waitlists for the 1.4 million (and growing) books in our lending library by creating a National Emergency Library to serve the nation’s displaced learners. This suspension will run through June 30, 2020, or the end of the US national emergency, whichever is later.

    #Internet_Archive

  • BBC - Future - Why there’s so little left of the early internet
    http://www.bbc.com/future/story/20190401-why-theres-so-little-left-of-the-early-internet

    Tew, who now runs the meditation and mindfulness app Calm, indeed became a millionaire. But the homepage he created has also become something else: a living museum to an earlier internet era. Fifteen years may not seem a long time, but in terms of the internet it is like a geological age. Some 40% of the links on the Million Pixel Homepage now link to dead sites. Many of the others now point to entirely new domains, their original URL sold to new owners.

    The Million Dollar Homepage shows that the decay of this early period of the internet is almost invisible. In the offline world, the closing of, say, a local newspaper is often widely reported. But online sites die, often without fanfare, and the first inkling you may have that they are no longer there is when you click on a link to be met with a blank page.

    You could, quite reasonably, assume that if I ever needed to show proof of my time there it would only be a Google search away. But you’d be wrong. In April 2013, AOL abruptly closed down all its music sites – and the collective work of dozens of editors and hundreds of contributors over many years. Little of it remains, aside from a handful of articles saved by the Internet Archive, a San Francisco-based non-profit foundation set up in the late 1990s by computer engineer Brewster Kahle.

    It is the most prominent of a clutch of organisations around the world trying to rescue some of the last vestiges of the first decade of humanity’s internet presence before it disappears completely.

    Dame Wendy Hall, the executive director of the Web Science Institute at the University of Southampton, is unequivocal about the archive’s work: “If it wasn’t for them we wouldn’t have any” of the early material, she says. “If Brewster Kahle hadn’t set up the Internet Archive and started saving things – without waiting for anyone’s permission – we’d have lost everything.”

    One major problem with trying to archive the internet is that it never sits still. Every minute – every second – more photos, blog posts, videos, news stories and comments are added to the pile. While digital storage has fallen drastically in price, archiving all this material still costs money. “Who’s going to pay for it?” asks Dame Wendy. “We produce so much more material than we used to.”

    “The Internet Archive first started archives pages in 1996. That’s five years after the first webpages were set up. There’s nothing from that era that was ever copied from the live web.” Even the first web page set up in 1991 no longer exists; the page you can view on the World Wide Web Consortium is a copy made a year later.

    “I think there’s been very low level of awareness that anything is missing,” Webber says. “The digital world is very ephemeral, we look at our phones, the stuff on it changes and we don’t really think about it. But now people are becoming more aware of how much we might be losing.”

    We consider the material we post onto social networks as something that will always be there, just a click of a keyboard away. But the recent loss of some 12 years of music and photos on the pioneering social site MySpace – once the most popular website in the US – shows that even material stored on the biggest of sites may not be safe.

    #Archive #Web_archive #Brewster_Kahle #Internet_Archive

  • Vietnam War Song Project - Rate Your Music

    https://rateyourmusic.com/list/JBrummer/vietnam-war-song-project-1

    Très impressionnant travail d’archivage et de référencement des chansons engagées contre la guerre du #Vietnam.

    An Encyclopaedia of Vietnam War Songs

    This project looks at Vietnam War songs and spoken-word records. The purpose is for those reading and listening to learn about the Vietnam War, and the music and artists associated with it. It also seeks to preserve the records for the future . The goal is to build a complete encyclopaedia of all relevant music and recorded audio, to analyse the music, discover information about the artists, and to categorize and identify themes . This is for educational purposes only - the project is not-for-profit, and raises no revenue. All adverts placed on this site belong to the host, RYM.

    Je ne pense pas que #Youtube soit la plateforme idéale ceci dit, pour préserver les enregistrements pour plus tard. l’ #Internet_Archive aurait été plus adapté.

    YouTube : Vietnam War Song Project - check out the songs. http://www.youtube.com/user/VietnamSongProject
    Photo Gallery : Vietnam Records - Artwork - check out images of the records. https://www.dropbox.com/sh/sj93o6rpxcrhyh6/ydgG53zVZG
    Twitter : VietnamWarSongs - follow for project updates. https://twitter.com/VietnamWarSongs

    About the author:

    I started compiling, writing, and editing this project in February 2007 to share the Vietnam War songs that I collect. I gained my PhD in history from University College London (UCL) in April 2012 on the subject of Anglo-American relations 1969-1974. I have also conducted research on “British policy, the Vietnam War and East of Suez (1964-1967)”, and “British policy towards Palestine (1914-1917)”. ~ Justin Brummer.

  • Face à Trump, Internet Archive a copié 200 To de données gouvernementales au cas où
    http://www.numerama.com/politique/256838-face-a-trump-internet-archive-a-copie-200-to-de-donnees-gouvernemen

    Depuis l’élection de Donald Trump, la fondation Internet Archive a copié pas moins de 200 To de données issues des sites gouvernementaux par précaution. Depuis son accession au pouvoir, l’administration Trump a fait montre d’une certaine proportion à se débarrasser de tout ceux et celles ce qui n’embrasse pas son point de vue, risque de le mettre en difficulté ou représente un contre-pouvoir à son action. Sally Yates (ex-procureure générale des États-Unis), Preet Bharara (ex-procureur de Manhattan) et (...)

    #censure #surveillance_des_scientifiques #surveillance #Internet_Archive

  • INTERNETARCHIVE.BAK
    http://archiveteam.org/index.php?title=INTERNETARCHIVE.BAK

    INTERNETARCHIVE.BAK

    The wonder of the Internet Archive’s petabytes of stored data is that they’re a world treasure, providing access to a mass of information and stored culture, gathered from decades of history (in some case, centuries), and available in a (relatively) easy to find fashion. And as media and popular websites begin to cover the Archive’s mission in earnest, the audience is growing notably.

    In each wave of interest, two questions come forward out of the accolades: What is the disaster recovery plan? And why is it in only one place?

    The disaster recovery plan is variant but generally reliant on multiple locations for the data, and it is in one place because the fundraising and support methods so far can only provide a certain amount of disaster/backup plans.

    Therefore, it is time for Archive Team to launch its most audacious project yet: Backing up the Internet Archive.

    THE PHILOSOPHY

    There is an effort called LOCKSS (Lots of Copies Keeps Stuff Safe) at Stanford [1] which is meant to provide as many tools and opportunities to save digital data as easily and quickly as possible. At Google, I’ve been told, they try for at least five copies of data stored in at least three physical locations. This is meant to provide a similar situation for the Internet Archive.

    While this is kind of nutty and can be considered a strange ad-hoc situation, I believe that, given the opportunity to play a part in non-geographically-dependent copies of the Internet Archive, many folks will step forward, and we will have a good solution until the expensive “good” solution comes along. Also, it is a very nice statement of support.

    #archive #web @fil #distribué

  • UK : Conservatives erase Internet history - Public Sector IT
    http://www.computerweekly.com/blogs/public-sector/2013/11/conservatives-erase-internet-h.html

    The Conservative Party has attempted to erase a 10-year backlog of speeches from the internet, including pledges for a new kind of transparent politics the prime minister and chancellor made when they were campaigning for election.

    via @archiloque une histoire de #robots.txt, #archive.org, et de #révisionnisme_historique dont il sera plausiblement niable qu’il n’ait été fait exprès ?

    #censure #royaume-uni