• How do you archive online data ?
    Comment archiver et citer un document dans le cadre d’une recherche ou dans un cadre légal ? Comment s’assurer qu’un document trouvé en ligne peut-être utilisé comme preuve dans le cadre légal ?

    Tout au long du mouvement “Femme, Vie, Liberté” en Iran —à l’image de nombreux mouvements dans la région— les #réseaux_sociaux et les vidéos partagées en ligne ont joué un rôle important dans la sensibilisation du public et la documentation des évènements géopolitiques majeurs. La question de l’usage de ces preuves dans le cadre légal à savoir comment filmer, conserver et exploiter une vidéo en ligne comme #preuve_légale ou comme objet de recherche s’est posée. Ces deux #manuels rédigés par le projet de recherche Off-Site, sont une opportunité d’aborder ces questions. Ces manuels sont complémentaires à de nombreuses autres ressources existant en ligne, ils ont vocation à être courts et faciles à partager.

    https://offsite.hypotheses.org/ressources

    Archivage et conservation des preuves
    https://vimeo.com/917570727

    ... avec utilisation de #wayback :
    https://web.archive.org

    #archivage #url #preuve #preuves #justice #online #protocole_de_Berkeley #conservation_des_preuves #sécurisation #standardisation
    #how_to #manuel #bonnes_pratiques #vidéo #archive #internet

  • Un #Commun_numérique fête ses 25 ans : #Internet_Archive
    https://framablog.org/2021/10/24/un-commun-numerique-fete-ses-25-ans-internet-archive

    Par curiosité ou nécessité, vous avez sûrement essayé de savoir à quoi ressemblait une ancienne page web, et vous avez utilisé la #Wayback_machine pour remonter le temps. Eh bien ce génial service, qui permet d’accéder à des clichés instantanés … Lire la suite­­

    #Internet_et_société #Libres_Cultures #Libres_Services #Anniversaire #Brewster_Kahle #Traduction

  • Le site #Internet_Archive mis en danger par des poids lourds de l’édition

    Sous la pression d’une #plainte déposée devant un tribunal new-yorkais par quatre poids lourds de l’édition aux États-Unis, le site Internet Archive a décidé d’avancer de 15 jours la fermeture de sa #bibliothèque_d’urgence, créée en réponse à l’#épidémie de #coronavirus.

    Une infraction « massive et délibérée » au #droit_de_reproduction. C’est ce que quatre éditeurs, dont la filiale américaine du groupe #Hachette, reprochent au site Internet Archive, connu notamment pour son archivage du web mondial, la #Wayback_Machine, dans laquelle on peut retrouver des pages web disparues.

    Mais l’Internet Archive, c’est aussi une immense #médiathèque, riche de millions de #livres, #films, #images, jeux vidéo et documents sonores. Côté bibliothèque, son « but ultime » est de « mettre tous les travaux publiés de l’humanité à la disposition de tous dans le monde ». Chacun·e, à condition d’être inscrit·e, peut emprunter jusqu’à dix livres à la fois, pour une durée de quinze jours. Les livres sont prêtés sous la forme de fichiers pdf. Selon Internet Archive, 17 500 livres sont empruntés chaque jour.

    Comme dans une bibliothèque classique, un livre doit être disponible pour pouvoir être emprunté – une règle que le site a « concoctée de toutes pièces », lui reprochent les plaignants. Ce concept du « #prêt_numérique_contrôlé » autorise un prêt à la fois pour un livre numérisé donné. Soutenu par le Conseil des directeurs des bibliothèques d’État des États-Unis, il n’avait encore jamais été mis en cause devant les tribunaux.

    Ce qui a décidé les #maisons_d’édition à risquer un #procès pas gagné d’avance, c’est la #Bibliothèque_nationale_d’urgence mise en place à la fin du mois de mars par Internet Archive, pour répondre à la fermeture des écoles, bibliothèques et universités en raison du coronavirus, et donc à l’impossibilité d’aller y chercher des livres. Installé aux États-Unis, le site avait simplement décidé de « suspendre les listes d’attente […] pendant toute la durée de l’urgence nationale américaine » : c’est-à-dire qu’il n’y avait plus besoin qu’un livre (numérique) revienne pour être emprunté à nouveau. Plusieurs lecteurs pouvaient ainsi en bénéficier en même temps.

    Mercredi 10 juin, son fondateur, #Brewster_Kahle, a publié sur son blog un billet (https://blog.archive.org/2020/06/10/temporary-national-emergency-library-to-close-2-weeks-early-returning-) pour annoncer la fin prochaine du dispositif, avancée au 16 juin, espérant trouver avec les détenteurs de droits « un système qui marche ».

    Son initiative a été soutenue publiquement par des dizaines de bibliothèques et d’universités, ces institutions se revendiquant du principe du « #fair_use », qui autorise des dérogations aux droits de reproduction, particulièrement quand il s’agit d’enseignement, et selon les circonstances. C’est le cas, estime Brewster Kahle, de l’épidémie due au coronavirus.

    Au contraire, cette ouverture des portes numériques est intervenue, selon les éditeurs, au pire moment, celui-là « même où de nombreux auteurs, éditeurs et librairies indépendantes, sans parler des bibliothèques, luttent pour survivre ». Le risque pour Internet Archive est vital, la loi sur le #droit_d’auteur (#Copyright_Act) autorisant des #dommages_et_intérêts pouvant atteindre 150 000 dollars par œuvre en cas de violation délibérée. Si le site propose au prêt 1,3 million de livres, certains sont toutefois dans le #domaine_public.

    « La #gratuité est un concurrent indépassable », estiment les éditeurs dans leur plainte, rappelant l’argument le plus éculé de l’industrie musicale. Internet Archive « ne fait qu’exploiter les investissements que les éditeurs ont faits dans leurs livres », accusent-ils, et « au moyen d’un modèle économique conçu pour profiter librement du travail des autres ». La plainte s’acharne à démontrer que l’Internet Archive serait une entreprise commerciale vivant de la #numérisation des livres, un travail qu’elle effectue contre rémunération pour les bibliothèques. Urgence ou pas, elle demande la destruction de toutes les copies illégales.

    Avec les livres prêtés par l’Internet Archive, on est pourtant loin du mp3 recopié ou downloadé en clic. Brewster Kahle rappelle dans une lettre adressée le 10 avril à Thom Tillis, un sénateur républicain président de la Commission sur la #propriété_intellectuelle, réservé sur la légalité du procédé, que son organisation, sans but lucratif, est régulièrement reconnue comme bibliothèque par la Californie. Cela fait bientôt dix ans, dit-il, que les livres sont prêtés selon la règle « #un_lecteur_à_la_fois ». De plus, se défend le fondateur de la bibliothèque, « nos livres numériques sont protégés par les mêmes protections techniques que celles utilisées par les éditeurs pour garantir que les lecteurs n’ont accès à un livre que pendant les deux semaines de son prêt, et que des copies supplémentaires ne peuvent être faites ».

    Toujours à destination de l’élu républicain, il explique : « Vos électeurs ont payé pour des millions de livres auxquels ils n’ont pas accès actuellement » – 15 millions de livres bloqués derrière les portes fermées de 323 bibliothèques, rien qu’en Caroline du Nord, l’État du sénateur, a compté Brewster Kahle.

    Aux éditeurs, il fait remarquer que la bibliothèque d’urgence ne comporte aucun livre publié il y a moins de cinq ans ; 90 % des livres empruntés ont plus de dix ans, et deux tiers datent du XXe siècle. Quant aux auteurs qui ne voudraient pas que leurs livres soient ainsi prêtés, il leur suffit de le demander par mail, poursuit Kahle. Certains ont au contraire, affirme-t-il, demandé à figurer dans la bibliothèque numérique.

    Dès le 31 mars, la Guilde des auteurs avait mobilisé ses membres contre la bibliothèque d’urgence, parlant de « piratage pur et simple », et proposé un modèle de réclamation. Ce groupement d’auteurs avait déjà fait connaître son désaccord avec le prêt de livres numérisés selon le principe « un livre papier, une copie numérique » en janvier 2019. Le #Syndicat_national_des_auteurs (#National_Writers_Unions) a de son côté préféré entamer des discussions amiables avec Internet Archive et les défenseurs du prêt numérique contrôlé.

    L’Internet Archive est en effet, aux États-Unis, loin d’être la seule bibliothèque à pratiquer de la sorte. La pratique du prêt numérisé contrôlé est théorisée, défendue et pratiquée par de nombreux juristes et des bibliothèques universitaires ou locales, comme celles des villes de Los Angeles, San Francisco et Boston. Un livre imprimé peut être prêté : c’est le principe des bibliothèques. Il doit en être de même pour sa déclinaison à l’identique au format numérique, un exemplaire numérique prêté à une personne à la fois.

    En attendant la décision du tribunal new-yorkais, des internautes se posent à travers le monde la question d’archiver l’Internet Archive et ses téraoctets de documents.

    https://www.mediapart.fr/journal/culture-idees/110620/le-site-internet-archive-mis-en-danger-par-des-poids-lourds-de-l-edition
    #open_access #confinement #édition_scientifique #recherche #justice

  • Ils soignent les blessés des violences policières : génération « street medics »
    https://www.mediapart.fr/journal/france/250519/ils-soignent-les-blesses-des-violences-policieres-generation-street-medics

    Face à la répression des forces de l’ordre, ils ont fait le choix de s’engager bénévolement pour soigner les blessés. Certains étaient formés. D’autres ont appris sur le tas. Mais tous, en rejoignant les « street medics », ont changé le cours de leur vie. Alors que s’engage le « 28e acte », ils racontent leurs motivations, leurs parcours, leurs peurs.

    #France #street_medics,_gilets_jaunes

  • #cequilrestedenosrêves... Le #11janvier prochain, ce sera le #AaronSwartzDay : l’anniversaire de la mort de Aaron Swartz, génie informatique partisan du #Libre qui a été suicidé par la défense vorace de la #propriété_privée pour avoir libéré des millions de documents judiciaires du système #PACER... oui, tu sais, le truc qui fait désormais kiffer les macronistes et autres libéraux capitalistes en se disant qu’ils pourraient en tirer profit via la #legaltech à l’étude en france...



    Je commence donc ici ma recension annuelle à sa mémoire avec ce qui semble un magnifique cadeau : un livre de Flore Vasseur à paraître demain, 9 janvier : « Ce qu’il reste de nos rêves »
    Au vu du parcours de l’auteure, je pense qu’il y a des chances qu’il soit un jour en libre accès quelque part sur le web.

    Dans Ce qu’il reste de nos rêves*, Flore Vasseur inscrit le génie du code dans la lignée des lanceurs d’alerte ayant marqué l’histoire des États-Unis. Broyé par le gouvernement américain, Aaron #Swartz était l’enfant qui voulait changer le monde.

    #Internet ne doit pas servir à vendre de la pâtée pour chiens mais être l’outil pour trouver des remèdes au cancer. Du haut de ses 14 ans, Aaron Swartz ne transige pas avec ses idéaux face aux patrons de la tech’. Virtuose de la #programmation informatique dès son plus jeune âge, Internet est son moyen de changer le monde. Créateur d’une encyclopédie collaborative avant Wikipédia et d’Infogami, une plateforme de création de sites et de blogs accessible sans savoir coder, il veut libérer la connaissance. Un combat pour lequel il a sacrifié sa vie. À 26 ans, il est retrouvé pendu à la fenêtre de son appartement new-yorkais. Nous sommes en janvier 2013. Poursuivi par le gouvernement américain, il risquait trente-cinq ans de prison et un million de dollars d’amende pour avoir téléchargé des millions de publications scientifiques sur les serveurs du Massachusetts Institute of Technology (MIT). Après quatre ans d’enquête, Flore Vasseur porte son message avec engagement et tendresse dans son dernier ouvrage, Ce qu’il reste de nos rêves.

    https://www.lelanceur.fr/aaron-swartz-lanceur-dalerte-sublime-par-les-mots-de-flore-vasseur

    Le jour de sa mort, #Facebook a gagné. Son #algorithme est la nouvelle main invisible qui régule rage et #consommation, élections et émotions. Sa disparition révèle un destin, une époque et notre tragédie”, écrit Flore Vasseur.

    Présentation vidéo des Éditions des Équateurs :
    https://youtu.be/aF-Feid2RuU

    Autre article paru pour annoncer une rencontre au bar le 61 à Paris (sniff !) :


    Et une présentation du livre par Télérama : https://www.telerama.fr/livres/ce-quil-reste-de-nos-reves,n6074156.php

    C’est à l’occasion de l’écriture de ce livre et de l’enquête qu’elle a menée qu’elle a pu rencontrer Edward Snowden pour le documentaire Meeting Snowden :

    La rencontre avec #Snowden est survenue parce que je marchais dans les pas d’Aaron, a confié Flore Vasseur au Lanceur. Je sais qu’il le lisait et que son suicide l’a bouleversé. C’est une espèce de grand frère. Et je suis persuadée qu’il n’aurait pas fait ce qu’il a fait s’il n’y avait pas eu Aaron Swartz.” En 2011, deux ans avant qu’Edward Snowden n’en transmette les preuves, Aaron Swartz avait évoqué l’ampleur de la surveillance de masse des États-Unis, de sa propre population et de ses alliés. Pour comprendre “la filiation et les héritiers” d’un fantôme qui la fascine, Flore Vasseur est allée rencontrer les parents et le cercle proche d’Aaron Swartz. Comme un heureux hasard, elle a fait la rencontre de celui qui le considérait “comme son fils”, Lawrence Lessig. Quand Aaron Swartz avait 14 ans, c’est ensemble qu’ils présentèrent un mouvement de libération du droit d’auteur à travers la création des Creative Commons. Professeur à Harvard, Lawrence Lessig partage avec Aaron la volonté de “contrer l’influence de l’argent en politique”. Il est aussi l’une des rares personnalités à avoir pris la défense d’Edward Snowden aux États-Unis. C’est grâce à ce chemin que la romancière a réalisé, à Moscou, le documentaire Meeting Snowden. Après avoir négocié avec Arte, son film est désormais en accès libre.

    A retrouver sur son blog http://blog.florevasseur.com

    Même 6 ans après sa mort, l’effet #Streisand se fait encore sentir. Il y a un mois, aux States, le site Gizmodo a fait une révélation impliquant les archives des mails de Aaron Swartz, démontrant que le #FBI gardait tout, absolument toutes les données qu’il avait pu collecter autour d’enquêtes, et ce même s’il n’y avait aucun rapport :

    Près de deux ans avant la première enquête connue du gouvernement américain sur les activités du cofondateur de Reddit et célèbre activiste du numérique, Aaron Swartz, le FBI a balayé ses données de courrier électronique dans une enquête antiterroriste qui avait également pris au piège des étudiants d’une université américaine. document secret publié pour la première fois par Gizmodo.
    https://gizmodo.com/fbi-secretly-collected-data-on-aaron-swartz-earlier-tha-1831076900
    Les données de courrier électronique appartenant à Swartz, qui n’était probablement pas la cible de l’enquête antiterroriste, ont été cataloguées par le FBI et consultées plus d’un an plus tard, car elles pesaient des accusations potentielles contre lui pour quelque chose de totalement indépendant.

    https://www.techdirt.com/articles/20181217/11080641248/fbi-swept-up-info-about-aaron-swartz-while-pursuing-al-qaeda-investigation

    Comme tous les ans, des dizaines et des dizaines d’initiatives sont prévues pour lui rendre hommage, elles sont regroupées sur le site https://www.aaronswartzday.org accompagné d’un compte twitter https://twitter.com/aaronswartzday

    J’ai l’impression par contre que le blog de Aaron Swartz n’est plus accessible, il est heureusement sauvegardé dans la #WayBackMachine, fondée à sa mémoire : https://web.archive.org/web/20190103112701/http://www.aaronsw.com

    La recension de l’année dernière : https://seenthis.net/messages/658967

    (par contre, #seenthis, je suis étonnée de ne toujours pas voir de tag « personnalité » #Aaron_Swartz sur son nom... peut-être est-ce l’occasion de le créer ;) ?)

  • jsvine/waybackpack: Download the entire #Wayback Machine archive for a given URL.
    https://github.com/jsvine/waybackpack

    Waybackpack is a command-line tool that lets you download the entire Wayback Machine archive for a given URL.

    For instance, to download every copy of the Department of Labor’s homepage through 1996 (which happens to be the first year the site was archived), you’d run:

    waybackpack dol.gov -d ~/Downloads/dol-wayback --to-date 1996

    #archivage_militant #outils #archives #download