• GRR contre GPT : l’auteur de Game of Thrones attaque OpenAI
    https://actualitte.com/article/113522/droit-justice/grr-contre-gpt-l-auteur-de-game-of-thrones-attaque-openai

    Les actions en justice se suivent et se ressemblent, aux États-Unis, contre les sociétés qui développent des intelligences artificielles et les outils qui vont avec. OpenAI, filiale de Microsoft qui porte notamment le médiatique ChatGPT, est ainsi visée par plusieurs plaintes d’auteurs qui dénoncent une utilisation non autorisée de leurs œuvres, sans aucune compensation.

    Trois procédures ont déjà été ouvertes en 2023, le 28 juin, le 7 juillet et début septembre, par des auteurs et deux avocats, Joseph Saveri et Matthew Butterick, qui entendent mener la fronde.

    La dernière charge contre OpenAI est collective : des auteurs s’estimant lésés peuvent la rejoindre, pour obtenir des compensations en cas de victoire devant la cour. Elle implique l’Authors Guild, organisation qui représente les écrivains américains, et plusieurs grands noms du secteur, de George R.R. Martin à Jodi Picoult, en passant par Jonathan Franzen ou David Baldacci.
    Une « menace pour les auteurs »

    Dans un communiqué, l’Authors Guild assure que, « sans les œuvres des plaignants, [OpenAI] proposerait des produits très différents », selon les termes de l’avocate Rachel Geman. « Le choix de copier les œuvres des plaignants, sans leur autorisation et sans verser de compensation, constitue une menace pour les auteurs et leurs revenus. »

    Les intelligences artificielles derrière les outils comme ChatGPT sont entrainées à l’aide d’un volume massif de données, et notamment des textes accessibles en ligne. Ces derniers sont « lus » et traités par les algorithmes, afin d’en améliorer la vélocité, la compréhension des requêtes, mais aussi la cohérence des réponses fournies.

    L’utilisation de textes couverts par le copyright par les sociétés de développement des intelligences artificielles a soulevé de nombreuses questions ces derniers mois. D’autant plus que l’accès à ces textes pourrait avoir été réalisé via des plateformes pirates, dont Library Genesis, Z-Library, Sci-Hub ou encore Bibliotik... Un moyen d’accéder à des réservoirs massifs de textes, sans alourdir la facture.

    Par ailleurs, les auteurs reprochent aux créateurs d’IA de s’être passés de leur autorisation, mais aussi d’avoir omis de verser une compensation et d’avoir oublié toute notion de mention des sources.

    En juillet, l’Authors Guild avait publié une lettre ouverte, cosignée par plus de 10.000 auteurs américains, réclamant plusieurs promesses des sociétés visées. Elles devaient, pour satisfaire l’organisation, s’engager « à obtenir le consentement, à créditer et à rémunérer équitablement les auteurs pour l’utilisation d’écrits protégés par le droit d’auteur à des fins d’entrainement de l’intelligence artificielle ». Visiblement, les discussions ne se sont pas déroulées comme prévu...
    Copyright et fair use

    La plainte de l’Authors Guild s’appuie sur plusieurs violations du copyright qu’auraient réalisées les entreprises. Dans l’accès aux textes, pour commencer, puisque l’organisation reprend l’hypothèse selon laquelle « les livres des plaignants ont été téléchargés depuis des répertoires pirates puis intégrés dans les rouages de GPT 3.5 et GPT 4, qui sont à la source de ChatGPT, utilisé par des milliers d’entreprises et d’applications, et grâce auquel OpenAI espère engranger des milliards ».

    Une autre violation surviendrait par l’exploitation sans autorisation des œuvres des auteurs, qui ne peuvent pas, par ailleurs, s’opposer à celle-ci.

    Enfin, l’Authors Guild assure que l’entrainement de ChatGPT par des créations littéraires permet à cette intelligence artificielle d’imiter le style de leurs auteurs, menaçant l’intégrité de leur œuvre et leur identité.

    GPT est déjà utilisé pour générer des livres qui singent les travaux d’auteurs humains, comme la tentative récente de générer les volumes 6 et 7 de la saga Le Trône de fer de George R.R. Martin le montre, ainsi que d’autres ouvrages de l’IA postés sur Amazon pour essayer d’usurper l’identité et la réputation d’auteurs humains.

    – L’Authors Guild

    « Il est impératif de mettre un coup d’arrêt à ce vol à grande échelle », martèle Mary Rasenberger, PDG de l’Authors Guild, dans un communiqué.

    À LIRE - Livres écrits avec l’IA : Amazon joue la transparence

    Se profile au tribunal un énième affrontement entre le copyright et le fair use, une sorte d’exception au premier, qui s’applique dans certains cas uniquement, notamment la recherche ou l’intérêt pédagogique. OpenAI et Meta (visé pour son IA LLaMA) ont tous deux mis en avant des usages permis par le fair use, pour se défendre des accusations de violations du copyright à leur égard.

    Aux États-Unis, la question de l’utilisation de contenus sous droits à des fins d’entrainement des IA est loin d’être tranchée. Fin juillet, Joe Biden assurait que plusieurs sociétés technologiques avaient accepté, sur le principe, d’appliquer des « garde-fous » proposés par la Maison-Blanche, comme le fait d’intégrer des filigranes aux productions, pour faciliter la distinction entre une œuvre générée et une œuvre originale.

    Mais aucune nouvelle d’un système de compensation, si ce n’est une vague promesse de Sam Altman, PDG d’OpenAI, quant à un système permettant de rémunérer les créateurs dès lors qu’une intelligence artificielle « s’appuie sur [leur] style » pour générer un texte.

    À LIRE - Des députés entendent "encadrer l’IA par le droit d’auteur"

    L’Union européenne, pour sa part, travaille à un IA Act, qui intégrerait quelques mesures relatives au droit d’auteur, notamment une relative transparence quant aux données utilisées pour l’entrainement des IA et une information claire sur l’aspect artificiel d’une œuvre générée. Le Conseil des écrivains européens a appelé de ses vœux un meilleur encadrement des usages des textes, en imposant le recours à une licence aux sociétés — et donc le versement d’une compensation.

    #Intelligence_artificielle #Copyright #fair_use #apprentissage #Auteurs

  • Le site #Internet_Archive mis en danger par des poids lourds de l’édition

    Sous la pression d’une #plainte déposée devant un tribunal new-yorkais par quatre poids lourds de l’édition aux États-Unis, le site Internet Archive a décidé d’avancer de 15 jours la fermeture de sa #bibliothèque_d’urgence, créée en réponse à l’#épidémie de #coronavirus.

    Une infraction « massive et délibérée » au #droit_de_reproduction. C’est ce que quatre éditeurs, dont la filiale américaine du groupe #Hachette, reprochent au site Internet Archive, connu notamment pour son archivage du web mondial, la #Wayback_Machine, dans laquelle on peut retrouver des pages web disparues.

    Mais l’Internet Archive, c’est aussi une immense #médiathèque, riche de millions de #livres, #films, #images, jeux vidéo et documents sonores. Côté bibliothèque, son « but ultime » est de « mettre tous les travaux publiés de l’humanité à la disposition de tous dans le monde ». Chacun·e, à condition d’être inscrit·e, peut emprunter jusqu’à dix livres à la fois, pour une durée de quinze jours. Les livres sont prêtés sous la forme de fichiers pdf. Selon Internet Archive, 17 500 livres sont empruntés chaque jour.

    Comme dans une bibliothèque classique, un livre doit être disponible pour pouvoir être emprunté – une règle que le site a « concoctée de toutes pièces », lui reprochent les plaignants. Ce concept du « #prêt_numérique_contrôlé » autorise un prêt à la fois pour un livre numérisé donné. Soutenu par le Conseil des directeurs des bibliothèques d’État des États-Unis, il n’avait encore jamais été mis en cause devant les tribunaux.

    Ce qui a décidé les #maisons_d’édition à risquer un #procès pas gagné d’avance, c’est la #Bibliothèque_nationale_d’urgence mise en place à la fin du mois de mars par Internet Archive, pour répondre à la fermeture des écoles, bibliothèques et universités en raison du coronavirus, et donc à l’impossibilité d’aller y chercher des livres. Installé aux États-Unis, le site avait simplement décidé de « suspendre les listes d’attente […] pendant toute la durée de l’urgence nationale américaine » : c’est-à-dire qu’il n’y avait plus besoin qu’un livre (numérique) revienne pour être emprunté à nouveau. Plusieurs lecteurs pouvaient ainsi en bénéficier en même temps.

    Mercredi 10 juin, son fondateur, #Brewster_Kahle, a publié sur son blog un billet (https://blog.archive.org/2020/06/10/temporary-national-emergency-library-to-close-2-weeks-early-returning-) pour annoncer la fin prochaine du dispositif, avancée au 16 juin, espérant trouver avec les détenteurs de droits « un système qui marche ».

    Son initiative a été soutenue publiquement par des dizaines de bibliothèques et d’universités, ces institutions se revendiquant du principe du « #fair_use », qui autorise des dérogations aux droits de reproduction, particulièrement quand il s’agit d’enseignement, et selon les circonstances. C’est le cas, estime Brewster Kahle, de l’épidémie due au coronavirus.

    Au contraire, cette ouverture des portes numériques est intervenue, selon les éditeurs, au pire moment, celui-là « même où de nombreux auteurs, éditeurs et librairies indépendantes, sans parler des bibliothèques, luttent pour survivre ». Le risque pour Internet Archive est vital, la loi sur le #droit_d’auteur (#Copyright_Act) autorisant des #dommages_et_intérêts pouvant atteindre 150 000 dollars par œuvre en cas de violation délibérée. Si le site propose au prêt 1,3 million de livres, certains sont toutefois dans le #domaine_public.

    « La #gratuité est un concurrent indépassable », estiment les éditeurs dans leur plainte, rappelant l’argument le plus éculé de l’industrie musicale. Internet Archive « ne fait qu’exploiter les investissements que les éditeurs ont faits dans leurs livres », accusent-ils, et « au moyen d’un modèle économique conçu pour profiter librement du travail des autres ». La plainte s’acharne à démontrer que l’Internet Archive serait une entreprise commerciale vivant de la #numérisation des livres, un travail qu’elle effectue contre rémunération pour les bibliothèques. Urgence ou pas, elle demande la destruction de toutes les copies illégales.

    Avec les livres prêtés par l’Internet Archive, on est pourtant loin du mp3 recopié ou downloadé en clic. Brewster Kahle rappelle dans une lettre adressée le 10 avril à Thom Tillis, un sénateur républicain président de la Commission sur la #propriété_intellectuelle, réservé sur la légalité du procédé, que son organisation, sans but lucratif, est régulièrement reconnue comme bibliothèque par la Californie. Cela fait bientôt dix ans, dit-il, que les livres sont prêtés selon la règle « #un_lecteur_à_la_fois ». De plus, se défend le fondateur de la bibliothèque, « nos livres numériques sont protégés par les mêmes protections techniques que celles utilisées par les éditeurs pour garantir que les lecteurs n’ont accès à un livre que pendant les deux semaines de son prêt, et que des copies supplémentaires ne peuvent être faites ».

    Toujours à destination de l’élu républicain, il explique : « Vos électeurs ont payé pour des millions de livres auxquels ils n’ont pas accès actuellement » – 15 millions de livres bloqués derrière les portes fermées de 323 bibliothèques, rien qu’en Caroline du Nord, l’État du sénateur, a compté Brewster Kahle.

    Aux éditeurs, il fait remarquer que la bibliothèque d’urgence ne comporte aucun livre publié il y a moins de cinq ans ; 90 % des livres empruntés ont plus de dix ans, et deux tiers datent du XXe siècle. Quant aux auteurs qui ne voudraient pas que leurs livres soient ainsi prêtés, il leur suffit de le demander par mail, poursuit Kahle. Certains ont au contraire, affirme-t-il, demandé à figurer dans la bibliothèque numérique.

    Dès le 31 mars, la Guilde des auteurs avait mobilisé ses membres contre la bibliothèque d’urgence, parlant de « piratage pur et simple », et proposé un modèle de réclamation. Ce groupement d’auteurs avait déjà fait connaître son désaccord avec le prêt de livres numérisés selon le principe « un livre papier, une copie numérique » en janvier 2019. Le #Syndicat_national_des_auteurs (#National_Writers_Unions) a de son côté préféré entamer des discussions amiables avec Internet Archive et les défenseurs du prêt numérique contrôlé.

    L’Internet Archive est en effet, aux États-Unis, loin d’être la seule bibliothèque à pratiquer de la sorte. La pratique du prêt numérisé contrôlé est théorisée, défendue et pratiquée par de nombreux juristes et des bibliothèques universitaires ou locales, comme celles des villes de Los Angeles, San Francisco et Boston. Un livre imprimé peut être prêté : c’est le principe des bibliothèques. Il doit en être de même pour sa déclinaison à l’identique au format numérique, un exemplaire numérique prêté à une personne à la fois.

    En attendant la décision du tribunal new-yorkais, des internautes se posent à travers le monde la question d’archiver l’Internet Archive et ses téraoctets de documents.

    https://www.mediapart.fr/journal/culture-idees/110620/le-site-internet-archive-mis-en-danger-par-des-poids-lourds-de-l-edition
    #open_access #confinement #édition_scientifique #recherche #justice

  • Fair use - Wikipedia
    https://en.wikipedia.org/wiki/Fair_use

    Fair use is a doctrine in the law of the United States that permits limited use of copyrighted material without having to first acquire permission from the copyright holder. Fair use is one of the limitations to copyright intended to balance the interests of copyright holders with the public interest in the wider distribution and use of creative works by allowing as a defense to copyright infringement claims certain limited uses that might otherwise be considered infringement.

    #droit_d_auteur #USA #fair_use

  • Pour conserver la mémoire du web, Internet Archive durcit ses méthodes
    par Julien Lausson pour numerama le 25 avril 2017
    https://www.numerama.com/tech/252324-pour-conserver-la-memoire-du-web-internet-archive-durcit-ses-method

    Depuis plus de vingt ans maintenant, la fondation américaine Internet Archive poursuit une mission démesurée : explorer et mémoriser le web afin de « permettre à tous d’accéder au savoir, gratuitement et pour toujours ». Ainsi, chaque semaine, elle enregistre 300 millions de nouvelles pages dans sa base de données, de façon à ce que chacun puisse les consulter ultérieurement.

    Mais pour la fondation américaine, il y a un problème. Et ce souci s’appelle robots.txt. « Les fichiers robots.txt ont été inventés il y a plus de 20 ans afin d’aider les ‘robots’, surtout ceux des moteurs de recherche, à savoir quelles sont les sections d’un site web qui devraient être explorées et indexées pour la recherche », explique Internet Archive. Or, ce petit fichier baptisé robots.txt entrave le bon fonctionnement de son projet.

    Pour Internet Archive, la question d’un changement complet de philosophie se pose. L’archivage du web ne doit plus se faire en tenant compte des déclarations des fichiers robots.txt qui s’adressent avant tout aux moteurs de recherche. Il doit se faire en prenant en compte le point de vue de l’utilisateur, de façon à lui montrer le web tel qu’il est aujourd’hui. Et tel qu’il était autrefois.

    #WWW #Web #Tech #mémoire #archivage #référencement https://archive.org

    • Les archives de l’Internet accusées de diffusion pirate par des auteurs
      par Antoine Oury pour actualitte le 29 janvier 2018

      Archive.org, l’Internet Archive, est sans aucun doute l’un des sites les plus précieux d’internet : pour les chercheurs dans de nombreux domaines, il est carrément incontournable. Depuis les années 1990, cette plateforme archive les pages web, mais rassemble aussi les collections numérisées de plusieurs bibliothèques, surtout américaines. L’Open Library, un site satellite qui propose des livres numériques sous droit, souvent indisponibles, en prêt, est désormais attaquée par des auteurs qui lui reprochent une diffusion pirate de livres numériques.

      Néanmoins, la plateforme a donné son point de vue à travers un texte signé par Brewster Kahle, un des fondateurs de l’Open Library. Dans ce post https://blog.archive.org/2018/01/24/digital-books-on-archive-org, Kahle explique qu’une grande partie des ouvrages des bibliothèques, qui participent activement à l’Open Library, datent d’avant 1923, ce qui signifie qu’ils sont dans le domaine public. Pour le reste, certains ouvrages sont présents à des fins d’accessibilités, numérisés et traités par le consortium Daisy pour les publics empêchés de lire. Certes, quelques ouvrages publiés entre 1923 et 1961 sont aussi présents dans l’Open Library, mais cela ferait suite à une autorisation spéciale qui s’appliquerait aux livres indisponibles.

      Pour le reste, Kahle assure de la bonne volonté de l’Open Library, et confirme qu’il est possible de faire retirer un titre contrevenant avec un simple message. Sauf que la page d’accueil de l’Open Library fait bel et bien apparaitre des titres visiblement encore sous droits...

      En somme, la vie juridiquement très mouvementée de l’Internet Archive et de l’Open Library risque encore de connaître quelques soubresauts... Certes, Internet Archive est reconnu comme une bibliothèque par certaines juridictions aux États-Unis et pourrait peut-être prétendre au fair use, cette exception au copyright à des fins d’éducation et de préservation du patrimoine, mais rien n’est moins sûr.

      https://www.actualitte.com/article/patrimoine-education/les-archives-de-l-internet-accusees-de-diffusion-pirate-par-des-auteurs/87020

      #Patrimoine #éducation #archivage vs #piratage #open_librairie #Fair_Use https://archive.org

  • #Goldieblox and the Three MCs
    http://waxy.org/2013/11/goldieblox_and_the_three_mcs

    It’s entirely possible that the Goldieblox video is simultaneously:

    A parody
    An advertisement
    A derivative of the Beastie Boys’ copyrighted work
    A violation of MCA’s dying wishes
    And, yet, perfectly legal under the fair use doctrine.

    Only a judge can decide whether Goldieblox’s parody is fair use. And, until they do and all the appeals are closed, none of us will know.

    In the meantime, let’s bust some myths!

    In his last will, MCA stated that “in no event may my image or name or any music or any artistic property created by me be used for advertising purposes.”

    By ignoring the last wishes of one of hip-hop’s greatest musicians, less than two years after his death, there’s a strong argument to be made that what Goldieblox is doing is unethical. To me, it feels crass and insensitive.

    But is it illegal? Not if the court finds the parody to be fair use.

    #fair_use #publicité #copyright

  • Une chanson de Phoenix au coeur d’une plainte pour défendre le fair use
    http://www.numerama.com/magazine/26805-une-chanson-de-phoenix-au-coeur-d-une-plainte-pour-defendre-le-fair-

    L’universitaire s’est rapproché de l’Electronic Frontier Foundation (EFF) pour lancer des poursuites judiciaires contre Liberation Music et faire reconnaître une forme d’abus de droits d’auteur, en espérant créer une jurisprudence favorable à la liberté d’expression.

    Episode 1 : un nouvel espoir pour le fair use : Lessig donne une conférence pour critiquer les excès de la protection du droit d’auteur et la poste sur Youtube : un label la fait retirer parce qu’on y voit des extraits de clips amateurs reprenant des morceaux d’un des groupes du label. C’est ce qu’on appelle une démonstration par l’absurde.

    Là où ça commence à devenir intéressant, c’est que : Lessig contre attaque ! Il a décidé de porter plainte contre le label pour abusde droits d’auteur, et créer une jurisprudence.

    Vivement l’épisode 3 : Le retour du partage...

    #je_suis_ton_peer #copyreich

  • The National Digital Public Library Is Launched! by Robert Darnton | The New York Review of Books
    http://www.nybooks.com/articles/archives/2013/apr/25/national-digital-public-library-launched/?pagination=false

    The Digital Public Library of America http://dp.la, to be launched on April 18, is a project to make the holdings of America’s research libraries, #archives, and museums available to all Americans—and eventually to everyone in the world—online and free of charge.

    #bibliothèque #domaine_public

    • #open_access #culture
      (parions que très rapidement ils proposeront leurs méthodes aux #musées de tous les pays ; on peut déjà programmer le débat sur le fait que les US raflent tout, que la France est en retard, que les droits d’auteurs ceci-cela…)

    • Robert Darnton s’exprime en français :
      http://bibliobs.nouvelobs.com/actualites/20130425.OBS7249/le-public-doit-avoir-acces-a-toute-la-litterature-du-xxe-sicele.

      Ne craignez-vous pas tout de même que cette notion de #fair_use, ainsi que l’accès gratuit aux œuvres, ne lèse les auteurs ?

      Même si la jurisprudence relative au fair use est en évolution constante, je ne le pense pas. Parce qu’elle vise un bien public, qu’elle n’est pas une entreprise commerciale - au contraire de Google dont le projet de bibliothèque numérique payante n’a pas abouti. Son fonds étant limité aux livres hors du circuit commercial - titres épuisés ou livres publiés il y a plus dix ans à l’exclusion de ceux qui continuent à se vendre – elle ne causera pas de « market damage » et les ayants droit ne souffriront d’aucun préjudice financier. Enfin, les auteurs transféreront l’utilisation de leurs droits gratuitement à la DPLA de façon volontaire. La DPLA respectera scrupuleusement le droit d’auteur.

      La DPLA est le fruit d’une initiative privée. C’est quelque chose de difficilement imaginable pour nous Français.

      C’est une autre spécificité américaine. Aux Etats-Unis, si l’on veut agir pour le #bien_commun, on ne s’adresse plus au Congrès qui est de plus en plus sous la coupe des #lobbies. Nous avons préféré nous tourner vers les fondations qui sont ici extrêmement puissantes et se dévouent au bien commun. Quand, à l’automne 2010, j’ai lancé cette idée de bibliothèque numérique, plusieurs responsables de fondations ont sur le champ exprimé leur enthousiasme. Nous avons bénéficié d’un soutien de 5 millions de dollars rien que pour la phase de préparation et de lancement du projet. Et les fondations vont continuer pendant plusieurs années à nous accompagner.

      Quels sont les liens entre la #DPLA et Europeana ?

      Nous avons souhaité que les deux systèmes soient parfaitement coordonnés et c’est bien le cas : il existe un moteur de recherche commun aux deux bibliothèques. #Europeana est néanmoins de nature différente : elle agrège les contenus des bibliothèques numériques des 27 pays de l’UE, qui ne sont pas toutes au même niveau. De plus, elle dépend des fonds alloués par l’UE et se heurte à certaines difficultés financières. Néanmoins, c’est vraiment une bibliothèque soeur et nous souhaitons aller plus loin dans notre collaboration.

      Nous souhaitons aussi développer notre coopération avec l’Amérique latine et l’Asie. A vrai dire, nous sommes aujourd’hui bombardés de messages venant d’un peu partout. Je ne serais pas étonné que d’ici dix ans, il existe une vaste bibliothèque mondiale comprenant des millions de volumes mis à la disposition de l’humanité entière.

  • Dix ans de Creative Commons | Sabine Blanc
    http://owni.fr/2012/12/14/dix-ans-de-creative-commons

    [INFOGRAPHIE] Dix ans que cette magnifique idée des Creative Commons est apparue et a bouleversé en profondeur le paysage de la propriété intellectuelle. Étant l’un des rares sites de presse en CC, nous ne pouvions pas passer à côté de l’évènement. On vous a donc concocté une petite #infographie. À partager librement, évidemment !

    #Cultures_numériques #Vive_Internet ! #creative_commons #droit_d'auteur #Lawrence_Lessig

  • Exposition d’art très libéré | Lionel Maurel (Calimaq)
    http://owni.fr/2012/05/29/exposition-dart-tres-libere

    Les licences libres elles-mêmes productrices d’œuvres, d’images, d’installations artistiques. Qui n’existeraient pas sans une agrégation, sans un mélange rendu possible par les licences libres. Du vrai art. Avec de vrais artistes. Entièrement copiés, entièrement copiables.

    #Chronique #Pouvoirs #droit #art_libre #copyright #creative_commons #droit_d'auteur #fair_use #licences_libres

  • #Pinterest épinglé par le #droit d’auteur | Lionel Maurel (Calimaq)
    http://owni.fr/2012/02/28/pinterest-epingle-par-le-droit-dauteur

    La start-up de l’année 2011 est confrontée à la rigidité des règles fixant le droit d’auteur. Ses récentes déconvenues posent une énième fois la question du statut du partage des contenus sur Internet.

    #Chronique #Pouvoirs #copyright #création #curation #droit_d'auteur #fair_use #graphisme #images #photographie #pipa #réseaux_sociaux #sopa