Articles repérés par Hervé Le Crosnier

Je prend ici des notes sur mes lectures. Les citations proviennent des articles cités.

  • Lucie dans les choux avec des diamants. Et DeepSeek mais pas trop profond quand même. – affordance.info
    https://affordance.framasoft.org/2025/01/lucie-dans-les-choux-avec-des-diamants-et-deepseek-mais-pas-tr

    Olivier Ertzscheid28 janvier 2025

    J’ai écrit il y a moins d’un an un (remarquable) livre sur les IA génératives et l’avenir du web (Les IA à l’assaut du cyberespace : vers un web synthétique, C&F Editions), ouvrage toujours en vente libre, je ne vais donc pas vous redire ici tout ce que j’y développe avec une acuité soulignée aussi bien dans La Tribune que dans L’Humanité, mais sachez que si vous vous interrogez autant sur l’incroyable foirage de Lucie (IA française sitôt lancée sitôt débranchée) que sur l’incroyable succès de Deep Seek (IA chinoise alliée du régime), vous trouverez dans ledit bouquin tous les éléments d’explication nécessaires. Et oui 🙂

    Et pour en revenir à Lucie, à DeepSeek, à ChatGPT, à Gemini et à toute la confrérie de leurs clownesques clones, il devient urgent que nous retrouvions une part de lucidité perdue. Tant que ces modèles seront, de par leur conception même, en capacité même temporaire d’affirmer que les vaches et les moutons pondent des oeufs, et tant qu’ils ne seront capables que d’agir sur instruction et dans des contextes où ces instructions sont soit insondables soit intraçables, jamais je dis bien jamais nous ne devons les envisager comme des oeuvres de langage ou de conversation, mais comme des routines propagandistes par défaut, et délirantes par fonction. La merveille de la langue, la beauté du langage, la seule, c’est qu’elle est la seule singularité non-marchande qui puisse être partagée par des millions d’individus sans qu’il y ait nécessité d’en faire autant de clownesques clones. Elle est un lieu de friction qui rend possible toute forme de fiction et de diction, là où tout le projet politique des plateformes et des IA génératives, niché au coeur même de leurs ingénieries et de leurs modes de production, est d’abolir la friction pour la mettre au service de leurs fictions propres.

    #Intelligence_Artificielle #Olivier_Ertzscheid

    • On a l’impression que l’auteur ne suit pas l’actualité. Olivier Ertzscheid écrit

      tant qu[snip] ces instructions sont soit insondables soit intraçables

      Alors c’est fini ça car justement, Deepseek R1 et OpenAI O3 s’astreignent à appliquer une chain of thought = une suite d’étapes, qui structure leur discours selon une logique de recherche et forme un raisonnement dont ils partagent les étapes. Et on ne leur demande pas de faire ça pour faire plaisir à Olivier Ertzscheid, mais parce que cela leur permet d’atteindre de bien meilleurs résultats.

    • Si je demande ça c’est parce que j’ai vu apparaître ces jours ci dans des articles des MSM le terme de modele de raisonnement et que ça me défrise un peu, les raisonnements et leurs aspects formels étant un champ d’étude qui ne date pas d’hier, et qui se poursuit, et j’aimerais bien savoir dans quelle mesure les agents conversationnels peuvent être évalués à l’aune de ce corpus (au delà des effets d’annonce).

    • C’est pour cela qu’on qualifie ces modèles de reasoning et pour cela qu’ils mettent souvent plusieurs minutes pour répondre car chaque étape est tout un calcul, aussi complexe qu’avant une seule question. Comme exemple, il y en a plein dans la litttérature EN. Par exemple la page https://simonwillison.net/2025/Jan/27/llamacpp-pr que je viens de refermer et où on lit un exemple de « raisonnement exploratoire » pour une demande de refactoring informatique :

      Wait, but in the model_map, “groq-gemma” maps to “gemma-7b-it”. So, perhaps the model_map is needed to map the local model IDs to the actual Groq model names.

      But since the model_map is hardcoded, and the API returns available models, perhaps the model_map should be built dynamically from the API response.

      Alternatively, perhaps the model_map can be eliminated, and the models are registered based on the fetched models.

      Wait, perhaps the model_map is no longer necessary. Instead, when the models are fetched from the API, each model’s “id” is the actual model name used in the Groq API. So, when registering the models, the local model ID is “groq-{id}”, and the groq_model_id is “id”.

    • Merci, mais c’est très flou tout ça. Pas grand chose de formel, qui confronterait effectivement une supposée capacité à raisonner à un ensemble de propriétés ou de postulats à vérifier, soit formellement soit expérimentalement. Là je ne vois que de la bidouille de code.Je vais creuser...

    • j’ai fait ma première interrogation de Chat GPT pas plus tard que ce matin. Je l’interrogeais sur une personnalité d’extrême-gauche (nom masqué par moi) et j’ai terminé par cette dernière question.
      Le gras est d’origine.
      Mon premier, et pour l’instant unique, essai, mais il me semble :
      • qu’il y a des filtres (légalité)
      • et que le canevas de réponse (6 points avec sous-arguments) est basé sur un « modèle » (ou tout autre nom pour le décrire) de réponse « politique »

      Comment pourrais-je m’opposer à son action ?

      Si tu souhaites t’opposer à son action et aux événements qu’il organise, il existe plusieurs approches possibles. La manière dont tu t’opposeras dépendra de tes convictions personnelles, de ton analyse des enjeux, et des moyens dont tu disposes pour exprimer tes idées. Voici quelques pistes :

      1. Critique idéologique et argumentée
      L’une des façons les plus efficaces de s’opposer à son action est de disqualifier ses idées sur le plan idéologique, en proposant des contre-arguments solides et bien fondés.

      Contester les bases théoriques : Si tu considères que les idées défendues par l’intéressé sont radicales et peu réalisables, tu peux les critiquer sur le plan théorique. Par exemple, tu peux remettre en question les principes du marxisme, de l’anticapitalisme ou de la révolution totale qu’il défend, en soulignant les limites ou les dangers des approches extrêmes, ou en proposant des alternatives plus modérées.

      Mettre en avant les conséquences pratiques : Tu pourrais aussi argumenter que les idées qu’il défend, bien que théoriquement intéressantes pour certains, ont montré dans le passé qu’elles entraînaient souvent des échecs politiques ou des dommages collatéraux (par exemple, des régimes autoritaires, des conflits sociaux, etc.). En montrant que des tentatives radicales ont souvent mené à des impasses historiques, tu pourrais contester la validité de son approche.

      Promouvoir des solutions concrètes et réalistes : Une autre forme d’opposition consiste à défendre des idées politiques plus modérées ou pragmatiques, en proposant des solutions concrètes et réalistes aux problèmes qu’il soulève (inégalités, réformes sociales, écologie, etc.), mais qui ne nécessitent pas de révolution radicale.

      2. Mise en évidence des dangers de la radicalisation
      Si tu vois ces événements comme un terrain propice à la radicalisation ou à des idées potentiellement nuisibles pour la société, tu peux souligner les dangers associés à la polarisation et à la violence idéologique. Cela pourrait inclure :

      L’isolement des idées : Tu pourrais soutenir que des discussions uniquement entre personnes partageant les mêmes idées créent une bulle idéologique, où des solutions extrêmes sont renforcées sans possibilité de dialogue avec d’autres courants de pensée.

      La violence symbolique : En mettant en lumière certains exemples de radicalisation violente ou d’escalade de la contestation politique (en France ou ailleurs), tu pourrais argumenter que ces espaces de réflexion radicale, bien qu’ils ne soient pas eux-mêmes violents, alimentent indirectement des mouvements plus radicaux ou incitent certains individus à des actions extrêmes.

      3. Argumentation sur l’inclusivité et la représentativité
      Tu pourrais aussi défendre l’idée que des événements comme ceux organisés par l’intéressé ne représentent qu’une fraction marginale de la population, et que l’extrême gauche, en particulier, doit être en mesure de dialoguer avec une pluralité de voix. En faisant valoir que ces événements sont exclusifs et ne permettent pas un débat démocratique plus large, tu pourrais défendre des espaces de discussion plus ouverts et inclusifs qui permettent à un éventail plus large de citoyens de participer.

      4. Actions pratiques et publiques
      Si tu veux aller au-delà de la critique idéologique et t’opposer plus concrètement à son action, tu pourrais :

      Informer et sensibiliser : Tu peux organiser des événements (conférences, débats, publications) qui présentent des visions alternatives, offrant un autre point de vue sur les thèmes abordés lors de ces événements. Le but serait de contrer le discours radical en offrant une vision équilibrée et de promouvoir des solutions sociales basées sur le compromis.

      Organiser des contre-événements : Si tu estimes qu’il est important de montrer un contraste direct avec les idées de l’intéressé, tu pourrais organiser des événements parallèles, comme des conférences publiques ou des débats ouverts, où tu invites des personnalités plus modérées ou même des experts pour discuter des mêmes thématiques, mais sous un angle différent.

      Protestations pacifiques ou actions symboliques : Si tu veux exprimer publiquement ton opposition, tu pourrais envisager des *manifestations pacifiques* ou des actions symboliques devant des lieux où ces événements se tiennent, pour marquer ton désaccord tout en restant dans un cadre légal.

      5. Dialogue et confrontation constructive
      Une autre méthode d’opposition qui peut être plus directe et engageante consiste à chercher à dialoguer avec les personnes qui participent à ces événements. Cela peut être un moyen de comprendre pourquoi elles adoptent certaines positions, mais aussi de leur exposer tes propres convictions. Le dialogue peut parfois être plus puissant que la confrontation, car il permet de débattre, de questionner, et de confronter les idées de manière plus nuancée.

      6. Interroger l’éthique des espaces privés
      Enfin, tu pourrais aussi t’opposer à ces événements sur le principe des espaces fermés et privés, où les débats se tiennent hors du regard du public. Selon toi, l’accès à ces espaces pourrait être perçu comme un moyen de créer une forme de ghetto idéologique, éloigné des préoccupations populaires. Un tel argument pourrait être étayé par la défense de l’idée que des discussions politiques doivent être transparente et ouvertes, accessibles à tous.

      –—

      En somme, l’opposition à son action peut prendre plusieurs formes : critique des idées qu’il défend, mise en garde contre les dangers de la radicalisation, promotion d’une politique plus inclusive et plus modérée, ou même actions concrètes pour porter un contre-discours. La manière dont tu choisis de t’opposer dépendra de tes convictions et de l’impact que tu souhaites avoir. L’important, c’est de rester dans un cadre démocratique et respectueux, même si tes idées diffèrent fortement des siennes.

    • Chatgpt par défaut n’utilise pas les modeles avec « multistep reasoning » (beaucoup trop coûteux pour OpenAI, et que Deepseek a rendu bon marché, d’où le gros buzz).
      Le résultat de Chatgpt présente des points, certes, mais ces points structurent un exposé régurgité immédiatement par enchaînements de mots. C’est comme un brillant musicien qui improvise sans revenir sur ses pas et un peu au bleuf car sans exploration et validation préalable de la composition. Et c’est un processus opaque, sans traçabilité.

      Avec les modèles en multistep reasoning comme O3 et R1, il y a une exploration préalable des différents thèmes, contraintes, difficultés, possibilités, stratégies envisageables pour répondre. Les étapes de cette exploration sont visibilisées et une stratégie optimisée de réponse s’élabore peu à peu.
      Dans certains exemples, les étapes pré-exploratoires sont très nombreuses (plusieurs dizaines voire centaines) au point d’être (très) fastidieuses mais je suppose que ça peut se paramétrer aussi.

      #chatgpt #ia #reasoning #deepseek

    • @ericw indépendamment des outils d’IA récents il y a les logiciels assistant de preuve
      cf https://fr.wikipedia.org/wiki/Assistant_de_preuve
      https://fr.wikipedia.org/wiki/M%C3%A9thode_formelle_(informatique)
      https://fr.wikipedia.org/wiki/Syst%C3%A8me_de_preuve_interactive

      Ces outils utilisent des langages pour décrire en tant que données un théorème ou une proposition formelle et sa démonstration si c’est ça le but.

      Et bien entendu les outils d’IA comme les modèles de OpenAI ou Deepseek ont été nourris avec des pétabytes d’exemples de ces descriptions, propositions, théorèmes, démonstrations etc faites dans ces langages. Ils peuvent donc s’exprimer dans ces langages, en respecter les règles et donc faire des démonstrations formelles.

      Ça forme d’ailleurs l’une des principales catégories de benchmarks.

    • Ce qu’en dit WP en français :

      DeepSeek AI (chinois simplifié : 深度求索 ; pinyin : Shēndù Qiúsuǒ) est une société chinoise d’intelligence artificielle et le nom de son agent conversationnel, qui exploite un grand modèle de langage. Établie à Hangzhou, la société est fondée et soutenue par le fonds spéculatif chinois High-Flyer.

      Début 2025, DeepSeek dévoile un nouveau modèle publié en open source sous licence MIT. Ce modèle, aux performances qui seraient comparables, voire supérieures, à celles des leaders américains, se démarque par son faible coût de développement et sa consommation réduite de ressources. La publication du nouveau modèle entraîne une réaction notable sur les marchés financiers. Les cours de plusieurs entreprises américaines, notamment ceux du leader mondial des puces graphiques utilisées dans l’intelligence artificielle Nvidia, chutent fortement.

      Le 20 janvier 2025, l’entreprise annonce son premier modèle de raisonnement, DeepSeek-R1, qui emploie une chaîne de raisonnement développant des étapes logiques successives aux requêtes9,10,11. Le modèle, publié avec son code source sous licence MIT, bouleverse le secteur de l’IA par un coût de développement se chiffrant en millions plutôt qu’en milliards de dollars ou d’euros, des performances comparables aux meilleurs acteurs du secteur12, et une consommation en ressources de calcul notablement inférieure13. Face à la rentabilité présumée de la technologie, le cours de la bourse de plusieurs géants du domaine, (dont celui de Nvidia, le fournisseur de processeurs GPU, qui perd 600 milliards de dollars)14, chute massivement15,16.

      En janvier 2025, OpenAI et Microsoft soupçonnent DeepSeek d’avoir utilisé un processus de distillation des connaissances pour extraire des données des modèles d’OpenAI via son interface de programmation, en violation de ses conditions d’utilisation. Microsoft dit avoir détecté fin 2024 d’importants transferts de données via des comptes développeurs OpenAI présumés liés à DeepSeek. OpenAI affirme détenir des preuves de ces pratiques, sans toutefois les détailler publiquement, et indique collaborer avec le gouvernement américain pour protéger sa propriété intellectuelle21,22,23.

      https://fr.wikipedia.org/wiki/DeepSeek

      #qu'est-ce_qu'on_rigole