LâannĂ©e 2025 est dĂ©jĂ particuliĂšrement fĂ©conde en nouvelles plus fracassantes les unes que les autres sur les financements, la course aux armements entre la Chine et les USA, le sommet intergalactique sur lâIA Ă Paris, et les supposĂ©s progrĂšs vers lâintelligence des IAs gĂ©nĂ©ratives. Câest un sujet courant de conversations dans le contexte privĂ© ou professionnel. En rĂ©ponse aux personnes qui sâĂ©tonnent de ma position rĂ©solument anti ChatGPT jâai fini par construire un #argumentaire que je vais dĂ©velopper ici.
1. Introduction
En tant quâenseignante-chercheuse en informatique, jâai lu lâarticle fondateur On the Dangers of Stochastic Parrots : Can Language Models Be Too Big ? (âșhttps://dl.acm.org/doi/10.1145/3442188.3445922) en 2021. Tous les #effets_nĂ©gatifs observĂ©s des grands modĂšles de langage et des IAs gĂ©nĂ©ratives sont annoncĂ©s dans cet article, comme le dit dâailleurs lâune des autrices dans un entretien rĂ©cent. Quand jâai Ă©tĂ© confrontĂ©e personnellement Ă des textes rendus par des Ă©tudiant·es et Ă©crits par ChatGPT, dĂšs janvier 2023, ma mĂ©fiance a priori pour cette branche du numĂ©rique a commencĂ© Ă sâincarner dans lâexpĂ©rience personnelle. Depuis jâaccumule des articles et des prises de position sur ce phĂ©nomĂšne, mais je nâai jamais Ă©tĂ© tentĂ©e dâessayer moi-mĂȘme. Avant de faire un tour dâhorizon des divers #arguments qui mâont fait refuser absolument lâ#usage — et critiquer vertement le dĂ©veloppement — des IAs gĂ©nĂ©ratives en tout genre, que ce soit dans lâ#enseignement_supĂ©rieur ou ailleurs, prĂ©cisons un peu le sujet.
Dans la suite de ce billet, il sera question trĂšs spĂ©cifiquement dâIAs gĂ©nĂ©ratives (comme ChatGPT). Le #vocabulaire a beaucoup glissĂ© ces derniers temps, mais rappelons que lâIA est une idĂ©e trĂšs ancienne, et que si on se met Ă qualifier tout le numĂ©rique dâIA, il va devenir difficile de parler prĂ©cisĂ©ment des choses. Donc : tout le #numĂ©rique nâest pas de lâIA ; parmi tout ce qui relĂšve de lâIA, tout nâest pas de la famille “#apprentissage_machine” ; et finalement parmi la famille “apprentissage machine”, tout nâest pas une IA gĂ©nĂ©rative comme ChatGPT et consort. On trouvera un historique de lâIA et les dĂ©finitions de ces notions dans le numĂ©ro de juin 2024 de la revue La vie de la recherche scientifique sur lâIA (â»https://www.snesup.fr/publications/revues/vrs/intelligence-artificielle-vrs437-juin-2024).
Ă quoi sert de refuser dâutiliser ChatGPT ? Je suis parfaitement consciente que ce #refus peut sembler totalement vain, puisque nous sommes tous et toutes entouré·es dâĂ©tudiant·es et de collĂšgues qui sâen servent trĂšs rĂ©guliĂšrement, et que nos gouvernements successifs se ruent sur les promesses dâ#automatisation et dâĂ©conomie de moyens humains envisagĂ©es en particulier dans les services publics. AprĂšs tout, le #progrĂšs_technologique est inĂ©luctable, nâest-ce pas ? Je nâai pas la moindre illusion sur ma capacitĂ© Ă changer les pratiques Ă moi toute seule. Jâai encore moins dâillusions sur une possible influence citoyenne sur le dĂ©veloppement de ces outils, par les temps qui courent. Le livre de YaĂ«l Benayoun et IrĂ©nĂ©e RĂ©gnault intitulĂ© Technologie partout, dĂ©mocratie nulle part est paru fin 2020 (â»https://fypeditions.com/echnologies-partout-democratie-nulle-part), mais je gage quâun tome 2 entier pourrait ĂȘtre consacrĂ© au dĂ©ploiement des IA gĂ©nĂ©ratives. Pourtant, mĂȘme et surtout si ce dĂ©ploiement semble inĂ©luctable, il nâest pas interdit de se demander si les IAs gĂ©nĂ©ratives, et leur mise Ă disposition sous forme de Chatbot, sont une bonne chose dans lâabsolu.
Ce qui suit nâest pas un article de recherche. Câest une prise de position personnelle, Ă©maillĂ©e de mes lectures prĂ©fĂ©rĂ©es sur le sujet. Cette position est basĂ©e sur des prĂ©occupations dĂ©jĂ anciennes Ă propos des impacts des technologies numĂ©riques, renforcĂ©es par la frĂ©quentation assidue des domaines des systĂšmes dits critiques (lâinformatique dans les trains, les avions, les centrales nuclĂ©aires, âŠ). Dans ces domaines la sĂ©curitĂ© et la sĂ»retĂ© priment sur la performance, les durĂ©es de vie des systĂšmes sont plus longues que dans lâinformatique grand public, les acteurs sont heureusement frileux vis-Ă -vis dâĂ©volutions trop rapides. Je ne suis pas chercheuse en IA et ne lâai jamais Ă©tĂ©. Je nâai pas pratiquĂ© de longues expĂ©rimentations des outils disponibles, mĂȘme si jâai lu attentivement ce quâen disaient les collĂšgues qui lâont fait. Mon refus personnel de mettre le doigt dans lâengrenage ChatGPT sâappuie beaucoup sur mes connaissances scientifiques antĂ©rieures et ma mĂ©fiance envers des systĂšmes opaques, non dĂ©terministes et non testables, mais il est aussi nourri de positions politiques. Si aucune technologie nâest jamais neutre, dans le cas prĂ©sent la configuration politico-financiĂšre extrĂȘmement concentrĂ©e dans laquelle se dĂ©ploient ces outils est particuliĂšrement prĂ©occupante et devrait selon moi conduire Ă une certaine prise de conscience. Et cela mĂȘme si lâon est impressionnĂ© par les capacitĂ©s de ces outils, ou tentĂ© par les promesses de gain de temps et dâaugmentation de crĂ©ativitĂ©, voire convaincu que le stade de lââIA gĂ©nĂ©rale capable de surpasser lâhumain est imminent (et dĂ©sirable).
Le tour dâhorizon qui suit est uniquement Ă charge. Lâespace mĂ©diatique Ă©tant saturĂ© de promesses politiques et dâarticles dithyrambiques, ce peut ĂȘtre vu comme un petit exercice de rĂ©Ă©quilbrage du discours. Je cite un certain nombre de collĂšgues qui font une critique argumentĂ©e depuis leur domaine de recherche. Il y en a beaucoup dâautres, dont celles et ceux qui sâexpriment dans le numĂ©ro de juin 2024 de la revue La vie de la recherche scientifique citĂ© plus haut.
2. Les impacts socio-environnementaux du numĂ©rique sont dĂ©jĂ prĂ©occupants, cela ne va pas sâarranger
Le dĂ©ploiement en grand des IAs gĂ©nĂ©ratives Ă©tant relativement rĂ©cent, le travail de recherche approfondi et consolidĂ© sur lâestimation prĂ©cise de leurs impacts environnementaux ne fait que dĂ©marrer. Par ailleurs les outils sont particuliĂšrement opaques, ils Ă©voluent trĂšs rapidement, et les promesses des vendeurs dâIA nâaident pas Ă y voir clair. Sans attendre des chiffres consolidĂ©s, on peut sâintĂ©resser aux effets locaux prĂ©visibles grĂące aux travaux de collectifs comme Le nuage Ă©tait sous nos pieds ou Tu nube seca mi rĂo ou encore aux collectifs qui ont protestĂ© contre lâinstallation de datacenters au Chili. Cela permet de rendre plus concrĂšte la matĂ©rialitĂ© des infrastructures du numĂ©rique, et de constater les conflits dâaccĂšs locaux sur les ressources en Ă©lectricitĂ© ou en eau. LâĂ©pisode IA quâĂ algorithmiser le climat du podcast de Mathilde Saliou sur Next est aussi un bon tour dâhorizon des impacts environnementaux. MalgrĂ© les promesses des grandes entreprises de la Tech dâalimenter leurs infrastructures uniquement avec de lâĂ©nergie “verte”, leur rĂ©cent engouement pour le renouveau du nuclĂ©aire laisse penser quâelles envisagent un avenir oĂč ces Ă©nergies seront loin de rĂ©pondre Ă leurs besoins. Dans son podcast âTech Wonât Save Usâ Paris Marx a produit un Ă©pisode passionnant sur le nuclĂ©aire et la tech. Il faut enfin garder en tĂȘte que la promesse des grandes entreprises de la tech dâalimenter leurs infrastructures numĂ©riques uniquement avec de lâĂ©nergie verte, mĂȘme si elle se rĂ©alise, ne les absout nullement de leurs impacts environnementaux. En effet la production dâĂ©lectricitĂ© nâest pas infinie, et celle quâon consacre aux infrastructures du numĂ©rique nâest pas utilisable ailleurs. Si monopoliser les sources dâĂ©nergie “verte” pour le numĂ©rique oblige dâautres usages Ă rouvrir ou prolonger des centrales Ă charbon, alors le numĂ©rique est aussi indirectement responsable de leurs Ă©missions.
Bref, si la trajectoire des impacts environnementaux du numĂ©rique Ă©tait dĂ©jĂ un problĂšme avant lâapparition des IAs gĂ©nĂ©ratives, les impacts ont rĂ©cemment subi un coup dâaccĂ©lĂ©rateur. Ce constat suffirait amplement Ă remettre en cause sĂ©rieusement le dĂ©ploiement tous azimuts de ces technologies, sauf si lâon croit vraiment que lâIA va sauver le monde, ce qui nâest pas mon cas. Câest un pari risquĂ© que fait pourtant allĂšgrement lâancien PDG de Google, quand il affirme que les objectifs climatiques Ă©tant inatteignables, il faut mettre tous nos moyens sur lâIA en espĂ©rant quâelle rĂ©soudra le problĂšme. Il se peut que les projections pharaoniques de ressources nĂ©cessaires dans les 10 ans Ă venir (croissance exponentielle de la demande en Ă©lectricitĂ© et en matĂ©riaux) se heurtent rapidement Ă des limites physiques. Il nâen reste pas moins que de gros dĂ©gĂąts seront dĂ©jĂ irrĂ©versibles dâici-lĂ .
Au cas oĂč ces impacts environnementaux (qui sont dâailleurs dĂ©jĂ des impacts socio-environnementaux) ne suffiraient pas Ă disqualifier le dĂ©ploiement des grandes IAs gĂ©nĂ©ratives, les conditions de travail des humains indispensables au dĂ©veloppement de ces outils devrait rĂ©gler la question. Un article rĂ©cent aborde cette situation en la qualifiant dâesclavage moderne (The Low-Paid Humans Behind AIâs Smarts Ask Biden to Free Them From âModern Day Slaveryâ) et le site du projet Diplab dâAntonio Casilli est une mine dâinformations sur le sujet, quoi que pas toutes spĂ©cifiques aux IAs gĂ©nĂ©ratives. Enfin la voracitĂ© en donnĂ©es qui fait fi de toute lĂ©gislation ou respect du droit dâauteur apparaĂźt au grand jour dans Meta knew it used pirated books to train AI, authors say. Lâexcellent 404media titre mĂȘme OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us (OpenAI furieux que DeepSeek puisse avoir volĂ© toutes les donnĂ©es que OpenAI nous a voĂ©es).
3. Le contexte politique et économique du déploiement des IAs génératives devrait inciter à la prudence
Aucune technologie nâest neutre ni inĂ©luctable. Chacune se dĂ©ploie dans un certain contexte Ă©conomique et politique qui oriente les choix. Cela a toujours Ă©tĂ© le cas pour le numĂ©rique, depuis le dĂ©but. LâextrĂȘme concentration dâacteurs et de moyens qui prĂ©side au dĂ©ploiement des IAs gĂ©nĂ©ratives devrait aider Ă prendre conscience de cet Ă©tat de fait. Lâannonce rĂ©cente de 500 milliards de dollars Ă consacrer au sujet donne la (dĂ©)mesure de la chose. Je ne dĂ©taillerai pas les courants politiques et philosophiques qui circulent parmi les promoteurs des IAs. Certains acteurs affirment croire Ă lâavĂ©nement des IAs gĂ©nĂ©rales, comme rĂ©sultat inĂ©luctable de lâaccumulation de moyens et de ressources. Que lâon fasse miroiter ces IAs capables de sauver le monde, ou quâau contraire on annonce lâapocalypse, leur prise de pouvoir et la fin de lâhumanitĂ©, on participe Ă dĂ©tourner lâattention des dĂ©gĂąts dĂ©jĂ bien prĂ©sents ici et maintenant. Le livre rĂ©cent Les prophĂštes de lâIA â Pourquoi la Silicon Valley nous vend lâapocalypsefait le tour de la question efficacement.
Bien sĂ»r si lâon pose comme hypothĂšse initiale que le cerveau humain est un ordinateur, alors un trĂšs gros ordinateur va sembler trĂšs intelligent, et un plus gros ordinateur encore plus intelligent. Mais lâhypothĂšse initiale nâa pas de sens. Si les IAs gĂ©nĂ©ratives conduisent Ă la fin de lâhumanitĂ©, ce sera en monopolisant les ressources et en aggravant les problĂšmes socio-environnementaux, pas en atteignant la superintelligence.
4. Quid dâune alternative Ă©thique, souveraine, et aux impacts maĂźtrisĂ©s ?
Quand jâexplique les raisons de mon refus total de mettre le doigt dans lâengrenage ChatGPT, on me cite souvent les alternatives Ă©thiques, souveraines, ouvertes, aux impacts environnementaux maĂźtrisĂ©s, respectueuses des droits des auteurs, etc. Je ne remets pas en cause a priori la qualitĂ© de ces dĂ©veloppements, ni les motivations de leurs auteurs. Simplement il me semble quâen pariant sur ces alternatives on passe Ă cĂŽtĂ© dâun certain nombre de questions.
Question 1 â effet dâentraĂźnement. MĂȘme sâil est effectivement possible de faire des petites IAs Ă©thiques aux impacts moindres, cela participe Ă lâacceptation gĂ©nĂ©rale de toutes les IAs gĂ©nĂ©ratives potentielles, dont celles qui ont un impact Ă©norme et sont fort peu Ă©thiques. Que se passera-t-il quand les petites IAs seront rentrĂ©es dans les moeurs, quâon en sera devenus dĂ©pendants pour de nombreuses applications, et que les grandes entreprises du numĂ©rique lanceront GTP12 grĂące aux 500 milliards promis par le gouvernement US ? Les gens resteront-ils bien sagement utilisateurs des petites IAs ? Faut-il se rĂ©jouir de lâannonce de lâIA de lâentreprise chinoise DeepSeek qui semble surpasser trĂšs nettement celles des entreprises amĂ©ricaines en coĂ»t et ressources nĂ©cessaires ? Non, bien sĂ»r. Cela marque le dĂ©but dâune nouvelle course aux armements, lâenclenchement dâun effet rebond massif. Câest un dĂ©veloppement extrĂȘmement mal orientĂ© si lâon sâattarde quelques minutes sur le numĂ©rique face aux limites planĂ©taires. Il est urgent au contraire de sâintĂ©resser Ă des trajectoires dĂ©croissantes du numĂ©rique, et jâespĂšre quâon en est encore capables.
Question 2 â est-ce seulement dĂ©sirable ? Quoi quâil en soit des impacts, il est de toute façon permis de se demander si les IAs gĂ©nĂ©ratives, et leur mise Ă disposition sous forme de Chatbot, sont une bonne chose dans lâabsolu. Il y a des idĂ©es qui sont juste de mauvaises idĂ©es, mĂȘme si elles semblent inĂ©luctables. Dans ce cas tous les impacts, mĂȘme petits, sont dĂ©jĂ du gaspillage.
5. Quid des usages utiles ?
Pour le plaisir de lâargumentation, poursuivons en mettant de cĂŽtĂ© les impacts et en supposant que câest une bonne idĂ©e dâinteragir avec des machines via des modĂšles de langage. Nous sommes soumis en permamence Ă un discours politique qui vante les gains en efficacitĂ© rendus possibles par le dĂ©ploiement de ces outils. Pourtant dans le cas des services publics, la numĂ©risation Ă marche forcĂ©e a dĂ©jĂ produit de nombreux dĂ©gĂąts avant mĂȘme lâintroduction des IAs gĂ©nĂ©ratives, la presse sâen faisant souvent lâĂ©cho (comme par exemple ici : « Je nâai jamais eu le fin mot de lâhistoire » : pourquoi la CAF est une boĂźte noire pour ses allocataires). Il est fort peu probable que lâintroduction des IAs gĂ©nĂ©ratives amĂ©liore quoi que ce soit Ă une situation oĂč la numĂ©risation sâest accompagnĂ©e de dĂ©sintermĂ©diation totale. Mais passons en revue quelques-une des promesses les plus courantes et leurs effets envisageables.
5.1 Le fameux “gain de temps” vs les effets dâaccĂ©lĂ©ration
Le domaine du numĂ©rique promet des gains de temps depuis plus de 70 ans. Si la promesse avait Ă©tĂ© suivie dâeffet nous devrions, soit avoir rĂ©duit le temps de travail Ă 1h par semaine, soit avoir multipliĂ© la “productivitĂ©” par un facteur Ă©norme. Si ce nâest pas le cas, câest que ce fameux “temps gagnĂ©” a immĂ©diatement Ă©tĂ© rempli par autre chose, pas nĂ©cessairement plus intĂ©ressant ni surtout plus productif. Allons-nous continuer longtemps Ă tomber dans ce piĂšge ?
Prenons lâexemple promu en ce moment dans les administrations : lâusage des IAs gĂ©nĂ©ratives pour rĂ©diger des comptes-rendus de rĂ©unions, en visio ou pas. Chacun sait que dans un compte-rendu de rĂ©union on va au-delĂ de la simple transcription mot Ă mot. Un bon compte-rendu fait preuve de synthĂšse, on y trouve les points saillants de la rĂ©union, les accords et les dĂ©saccords, les dĂ©cisions actĂ©es ou reportĂ©es, les promesses de chacun sur le travail Ă rĂ©aliser avant la prochaine rĂ©union sur le mĂȘme sujet, etc. La capacitĂ© des IAs gĂ©nĂ©ratives Ă rĂ©sumer des textes ou des transcriptions audio est tout Ă fait incertaine, avec des risques potentiels assez graves. Une expĂ©rience dĂ©taillĂ©e conduit mĂȘme Ă conclure que cet outil ne rĂ©sume pas, il raccourcit, et câest trĂšs diffĂ©rent. En informaticienne je dirais : “pour raccourcir on peut rester au niveau clavier. Pour rĂ©sumer il faut repasser par le cerveau”. Mais, toujours pour le plaisir de lâargumentation, supposons que la qualitĂ© soit au rendez-vous. Serait-ce dĂ©sirable pour autant ?
Comme Ă chaque fois que le numĂ©rique est vendu comme moyen de gagner du temps, il faut se demander comment et avec quoi va se remplir le temps ainsi gagnĂ©. Dans le cas des comptes-rendus de rĂ©union, voilĂ un effet tout Ă fait probable : une accĂ©lĂ©ration du rythme des rĂ©unions. En effet, la contrainte dâavoir Ă rĂ©diger et diffuser un compte-rendu avant dâorganiser la rĂ©union suivante ayant disparu, plus aucune limite naturelle ne sâoppose Ă organiser une autre rĂ©union trĂšs rapprochĂ©e de la premiĂšre. Vous me direz que dans ce cas la limite naturelle suivante sera la non ubiquitĂ© des participants potentiels. Ce Ă quoi je rĂ©pondrai : mĂȘme pas, puisquâon nous propose dĂ©jĂ dâenvoyer en rĂ©union un avatar qui y jouera notre rĂŽle : Zoom va permettre Ă un avatar crĂ©Ă© par IA de parler pour vous.
Au cas oĂč cette prĂ©vision vous semblerait peu crĂ©dible, rappelez-vous comment vous gĂ©riez votre temps professionnel il y a 20 ans, avant le dĂ©ploiement des outils dâemploi du temps en ligne censĂ©s nous faire gagner du temps (jâavoue humblement y avoir cru). Quand jâai pris mon poste de professeure en 2000, mon emploi du temps du semestre tenait sur un bristol glissĂ© dans mon agenda papier format A6, il Ă©tait parfaitement rĂ©gulier pendant les 12 semaines dâun semestre. Lâagenda ne me servait quâĂ noter les dĂ©placements de un Ă plusieurs jours et les rĂ©unions exceptionnelles. Aujourdâhui sans emploi du temps partagĂ© en ligne et synchronisĂ© avec mon tĂ©lĂ©phone, jâaurais du mal Ă savoir le matin en me levant oĂč je dois aller dans la journĂ©e, pour rencontrer qui, et sur quel sujet. La puissance des outils numĂ©riques avec synchronisation quasi-instantanĂ©e entre participants pousse Ă remplir les moindres coins “libres” des journĂ©es. Quand il fallait plusieurs jours pour stabiliser un crĂ©neau de rĂ©union, câĂ©tait nĂ©cessairement assez loin dans le futur, le remplissage de lâemploi du temps de chacun nâĂ©tait pas parfait, et il restait des “trous”. Il nây a plus de trous. Nous nâavons jamais Ă©tĂ© aussi conscients de la pression du temps.
Prenons aussi lâexemple de la gestion des emails, notoirement si envahissants que certaines entreprises et organisations les ont bannis (parfois pour les remplacer par des outils de chat, ce qui ne rĂ©soud pas vraiment le problĂšme, mais passons). Les IAs gĂ©nĂ©ratives promettent simultanĂ©ment de (1) gĂ©nĂ©rer des emails au ton professionnel Ă partir dâun prompt donnant quelques idĂ©es ; (2) rĂ©sumer un email trop long en quelques idĂ©es importantes. Cela devrait immĂ©diatement apparaĂźtre comme menant Ă une situation totalement absurde oĂč le passage par un texte long est entiĂšrement invisible aux acteurs humains. Pourquoi alors ne pas sâenvoyer simplement des emails de 3 lignes ? Le dessinateur Geluck avait dĂ©crit le rĂ©sultat dans un dessin du Chat en 3 cases : a) le Chat dit ” je me suis achetĂ© deux jeux dâĂ©checs Ă©lectroniques” ; b) Le Chat dit : “je les ai raccordĂ©s lâun Ă lâautre” ; c) Le Chat, en train de faire sa vaisselle dans un Ă©vier plein de mousse dit : “et jâai la paix”. Si la prolifĂ©ration des emails dans le milieu professionnel est dĂ©jĂ reconnue comme un problĂšme, fluidifier leur usage ne peut que faire sauter les derniĂšres limites naturelles Ă leur accumulation.
Pour conclure sur ce point : si la promesse de “gagner du temps” est tentante, sâil peut sembler dans un premier temps que câest effectivement le cas, il est fort prĂ©visible que le temps gagnĂ© sera reperdu dans une accĂ©lĂ©ration de tout le processus quâon avait cherchĂ© Ă ainsi optimiser. Rendez-vous dans 6 mois ou un an pour voir comment le temps gagnĂ© sur les comptes-rendus de rĂ©unions et la rĂ©daction des emails sâest rempli.
5. 2 La créativité à base figée vs la pollution informationnelle
Un argument qui revient souvent dans le monde universitaire, câest lâusage de ChatGPT comme “dĂ©marreur”, pour donner de premiĂšres idĂ©es. Jâai personnellement beaucoup de mal Ă croire que cela produise quoi que ce soit dâun tant soit peu original, je craindrais de plagier sans intention, jâaurais quelque rĂ©ticence Ă donner le produit de mes rĂ©flexions financĂ©es par de lâargent public aux vendeurs dâoutils, et je prĂ©fĂšre de loin deux heures de remue-mĂ©ninges avec des collĂšgues ou des Ă©tudiants. Mais soit, admettons cet usage. Si on pense les IAs gĂ©nĂ©ratives entraĂźnĂ©es “une fois pour toutes”, alors on devrait sâinquiĂ©ter de voir la crĂ©ativitĂ© future dĂ©cliner et se dĂ©synchroniser des Ă©volutions dâun domaine. Mais si on sait quâelles Ă©voluent par gĂ©nĂ©rations successives re-entraĂźnĂ©es sur une base de textes qui augmente, alors il faut se poser la question de la pollution.
Un aspect trĂšs important des IAs gĂ©nĂ©ratives qui les distingue dâautres systĂšmes numĂ©riques et dâautres IAs, câest en effet prĂ©cisĂ©ment quâelles sont gĂ©nĂ©ratives. Leurs rĂ©sultats sâaccumulent dans lâespace de lâinformation en ligne, et constituent une forme de pollution dont il sera trĂšs difficile de se dĂ©barrasser. Sur ce point jâai trouvĂ© particuliĂšrement frappante la dĂ©cision du mainteneur de WordFreq dâarrĂȘter les mises Ă jour. WordFreq est un outil qui maintient une base de donnĂ©es sur la frĂ©quence des mots dans plusieurs langues, en analysant les textes disponibles en ligne. Le mainteneur a constatĂ© que ces frĂ©quences changent maintenant Ă un rythme jamais observĂ© auparavant, et accuse les IAs gĂ©nĂ©ratives dâavoir irrĂ©mĂ©diablement polluĂ© les textes en ligne. Sa conclusion est sans appel : plus personne nâa dâinformation fiable sur les langues telles quâelles sont parlĂ©es par des ĂȘtres humains, aprĂšs 2021. Les autres exemples de pollution abondent, de lâĂ©dition Ă compte dâauteur (La plateforme de publication en ligne dâAmazon est contrainte de mettre en place une limite de 3 livres par auteur et par jour) au systĂšme de publications scientifiques (GPT-fabricated scientific papers on Google Scholar : Key features, spread, and implications for preempting evidence manipulation), en passant par les rĂ©seaux sociaux professionnels.
Le mot slop a Ă©tĂ© introduit rĂ©cemment pour dĂ©crire cette pollution informationnelle qui sâaccumule dans les sources en ligne. Le livre Les IA Ă lâassaut du cyberespace â Vers un Web synthĂ©tique revient sur lâĂ©volution du contenu du web depuis 25 ans, et met en garde contre son artificialisation.
Comment penser que cette pollution nâaura pas dâimpact sur les usages “crĂ©atifs” de lâoutil, Ă moyen terme ? MĂȘme si les effets Ă court terme paraissent utiles, Ă quel avenir contribuons-nous en acceptant une utilisation routiniĂšre de ces technologies ?
5.3 Lâautomatisation des tĂąches rĂ©pĂ©titives vs lâeffet coupe rase et la perte de compĂ©tences
Etant enseignante dâinformatique, je suis naturellement prĂ©occupĂ©e par lâavenir du logiciel si une partie significative est produite par des IAs gĂ©nĂ©ratives opaques et non testables, Ă la fois Ă cause de la qualitĂ© intrinsĂšque du logiciel produit, et pour ce que cela signifierait dans lâorganisation du travail et lâĂ©volution des mĂ©tiers.
Un argument qui revient souvent est que les aides Ă la programmation Ă base dâIAs gĂ©nĂ©ratives sont attrayantes pour maĂźtriser une grande base de code, naviguer dans des bibliothĂšques inombrables dont on nâa pas le temps de lire la documentation, produire la partie du code qui a presque toujours la mĂȘme forme, ⊠Mais si vraiment on se noie dans le code, comme analysĂ© ici, ajouter une couche opaque destinĂ©e Ă en gĂ©nĂ©rer encore plus, encore plus vite, est-ce vraiment raisonnable ?
Si lâon sâintĂ©resse Ă la construction de ces IA gĂ©nĂ©ratives appliquĂ©es Ă la programmation, on se rend compte quâelles sont comparables aux coupes rases en forĂȘt : il est possible de rĂ©aliser de gros profits, une fois, en rasant tout, mais rien ne repoussera jamais. Les outils dâaide Ă lâĂ©criture de code actuels se sont nourris de toutes les occurrences de code et dâexplications produites par des humains et disponibles sur le web. Mais si on croit leurs promesses, ils sont susceptibles de provoquer une rĂ©duction drastique des mĂ©tiers-mĂȘmes qui pourraient produire de nouvelles occurences. OĂč les futures IAs dâaide Ă la programmation prendront-elles les exemples Ă digĂ©rer Ă©crits dans le nouveau langage de programmation Ă la mode ? Dans la production des IAs de la gĂ©nĂ©ration prĂ©cĂ©dente entraĂźnĂ©e sur un autre langage ? Ce qui vaut pour la programmation vaut pour tous les autres usages qui promettent Ă une profession de gagner du temps grĂące Ă une IA entraĂźnĂ©e sur les productions humaines passĂ©es de leur propre mĂ©tier.
Lâeffet coupe rase sâaccompagne donc dâune transformation des mĂ©tiers. On nous explique ainsi que les IAs permettent dâautomatiser les tĂąches rĂ©pĂ©titives et peuvent dĂ©jĂ remplacer les programmeurs juniors, mais que les programmeurs seniors sont toujours nĂ©cessaires. Une premiĂšre consĂ©quence devrait sauter aux yeux : comme on ne devient pas senior sans ĂȘtre passĂ© par le stade junior, la disparition des juniors devrait logiquement ĂȘtre suivie de la disparition des seniors. A moins de croire que les IAs gĂ©nĂ©ratives seront dâici-lĂ capables dâapprendre toutes seules (mais Ă partir de quoi ?), cela devrait provoquer une certaine inquiĂ©tude.
On nous explique aussi que les programmeurs seniors restent lâhumain dans la boucle. Jâai beaucoup apprĂ©ciĂ© ce texte dâune traductrice professionnelle qui explique que passer dâune activitĂ© de crĂ©ation de texte Ă une activitĂ© de relecture et correction dâun premier jet produit par une IA (non gĂ©nĂ©rative ici) modifie le mĂ©tier et le rend pĂ©nible sans vrai gain de temps. Je soupçonne que ces conclusions sâappliquent aussi Ă la programmation.
Pour conclure ce paragraphe, parcourons Generative AI : What You Need To Know, un manuel de dĂ©fense intellectuelle contre les promesses des IAs gĂ©nĂ©ratives, par un auteur qui a une longue expĂ©rience du mĂ©tier de dĂ©veloppeur web, et qui a dâailleurs Ă©crit “weâre all-in on deskilling the industry. (âŠ) weâre now shifting towards the model where devs are instead “AI” wranglers. The web dev of the future will be an underpaid generalist who pokes at chatbot output until it runs without error, pokes at a copilot until it generates tests that pass with some coverage, and ships code that nobody understand and canât be fixed if something goes wrong”.
6. Conclusion
Que conclure ? Plus le temps passe, moins je suis tentĂ©e dâutiliser ChatGPT ou dâautres outils dâIA gĂ©nĂ©rative. Le rythme effrĂ©nĂ© des annonces et la vision du monde des promoteurs de ces outils mâont dĂ©finitivement vaccinĂ©e contre le moindre frĂ©missement dâintĂ©rĂȘt qui aurait pu subsister. Et je nâai mĂȘme pas abordĂ© ici les questions de biais, de sĂ©curitĂ©, de protection de la vie privĂ©e, ⊠Je lisais rĂ©cemment CEO of AI Music Company Says People Donât Like Making Music et comme je suis moi-mĂȘme incapable de jouer dequelque instrument que ce soit, jâimagine que jâaurais dĂ» ĂȘtre dans la cible de cette entreprise qui prĂ©tend “dĂ©mocratiser” la crĂ©ation musicale. Eh bien non, pas du tout. Dans toute activitĂ© crĂ©ative ce nâest pas le rĂ©sultat qui compte, câest le chemin. Jâai pris beaucoup de plaisir Ă Ă©crire ce texte sans aucune “aide” par ChatGPT. Je continuerai comme ça.
Ah, jâoubliais, si vous ĂȘtes tentĂ©s dâutiliser ChatGPT comme outil de recherche dâinformations, alors mĂȘme que lâoutil nâest vraiment pas fait pour ça et contribue Ă polluer lâespace informationnel, essayez plutĂŽt eurekoi. Câest plus lent, bien sĂ»r. Mais ça tombe bien, il est urgent de ralentir.