De son visage, on trouvait peu d’images jusqu’à ce 20 janvier, où il est apparu au très officiel journal de 19 heures de la télévision d’Etat chinoise. Un premier contact du peuple chinois avec son nouveau héros, âgé de 40 ans seulement.
Par Harold Thibault (Pékin, correspondant) et Simon Leplâtre
Publié aujourd’hui à 06h00, modifié à 11h41
Temps de Lecture 5 min. Read in English
Article réservé aux abonnés
Liang Wenfeng, le fondateur de DeepSeek, sur une image diffusée sur la Télévision centrale de Chine, le 20 janvier 2025.
Liang Wenfeng, le fondateur de DeepSeek, sur une image diffusée sur la Télévision centrale de Chine, le 20 janvier 2025. © CCTV VIA BESTIMAGE
Il y a quelques semaines encore, très peu de gens, hors du monde de la finance chinoise, connaissaient le nom de Liang Wenfeng. De son visage, on trouvait peu d’images jusqu’à ce 20 janvier, où le nouveau champion de l’intelligence artificielle (IA) était reçu par le premier ministre chinois, Li Qiang, au côté d’une poignée d’experts, pour évoquer les réussites et les défis de la deuxième économie de la planète. Vêtu d’un costume et d’un pull gris clair, quand tous les autres avaient opté pour des vestes sombres, ses mèches tombant négligemment sur le haut de ses lunettes à épaisses montures renforçaient son allure de geek lors de cette première apparition au très officiel journal de 19 heures de la télévision d’Etat.
Lire aussi | Article réservé à nos abonnés DeepSeek, la réponse chinoise à ChatGPT, expliquée en six questions
Un premier contact du peuple chinois avec son nouveau héros, âgé de 40 ans seulement, dans la course technologique qui se joue avec les Etats-Unis. Car ce même jour, Liang Wenfeng a lancé, presque à la marge de sa carrière de financier à succès, son nouveau modèle d’IA, ouvert et en accès libre, gratuitement, DeepSeek-R1.
Développée avec une fraction seulement du coût et de la puissance de calcul de celles des géants américains de la tech, cette IA fait depuis trembler la Silicon Valley et valser Wall Street. Même Sam Altman, le créateur de ChatGPT, a pris acte : « C’est un modèle impressionnant, surtout en ce qui concerne ce qu’ils arrivent à proposer pour le prix. »
Alors que le modèle GPT-4 d’OpenAI, sorti en 2023, avait coûté plus de 100 millions de dollars (96 millions d’euros) à entraîner, DeepSeek, qui n’a que 139 chercheurs, affirme avoir effectué le même travail sur le sien pour à peine 6 millions de dollars – un « budget risible », a commenté Andrej Karpathy, cofondateur d’OpenAI. De quoi, pour certains observateurs, remettre en cause les prévisions économiques du leader mondial de l’IA, mais aussi du géant des puces américain Nvidia, qui a perdu 17 % de sa valeur boursière, lundi 27 janvier. Aux Etats-Unis ou en France, DeepSeek est actuellement l’application la plus téléchargée sur les smartphones.
Pour l’heure, les bureaux de la start-up, dans un immeuble de Hangzhou, sont fermés pour les congés du Nouvel An lunaire et personne n’y est chargé de ses relations publiques. C’est dans cette ville, la concurrente de Shenzhen comme berceau de la tech chinoise, où sont installés le leader de l’e-commerce Alibaba et les robots d’Unitree, que le brillant Liang Wenfeng avait été admis à l’université en ingénierie informatique.
Newsletter abonnés
« La lettre des idées »
Votre rendez-vous avec la vie intellectuelle
S’inscrire
Durant ses études, celui qui est né en 1985 dans une cité portuaire du sud de la Chine avait déjà commencé à s’intéresser à la manière de maximiser les gains boursiers en utilisant les nouvelles technologies, fasciné par les réussites du hedge fund (fonds d’investissement spéculatif) américain Renaissance. Il écrit ses premiers algorithmes d’analyse de marché et, en 2013, quelques années après son diplôme, lance avec des camarades d’école un premier fonds d’investissement quantitatif, c’est-à-dire utilisant la modélisation de données massives pour anticiper certains comportements du marché et laisser en partie à la machine la décision d’investissement.
Quête de la meilleure « intelligence artificielle générale »
Le secteur est alors balbutiant en Chine, mais le boom des Bourses de l’empire du Milieu, suivi en 2015 d’un krach douloureux pour la plupart des petits investisseurs, crée des occasions pour les meilleurs tradeurs. Son deuxième fonds, High-Flyer, en anglais, mais dont le nom chinois signifie « carré magique », lancé cette année-là, réalise d’importants gains et se fait un nom, alors même que Pékin dénonce le rôle néfaste des spéculateurs. Le portefeuille du fonds passe de 1 milliard de yuans (130 millions d’euros) en 2016 à 10 milliards de yuans en 2019.
Lire aussi | Article réservé à nos abonnés DeepSeek : « La Chine sème la confusion dans l’intelligence artificielle »
Focalisant toute l’activité du fonds sur le trading par IA, Liang Wenfeng constate le besoin de développer des capacités de calcul en propre. High-Flyer dépense 26 millions d’euros, entre 2019 et 2020, dans un premier supercalculateur, puis 130 millions d’euros, en 2021, pour en bâtir un autre. Avec cet argent, la firme parvient à acheter, dès leur sortie, 10 000 cartes graphiques A100, alors dernier cri, de Nvidia, le designer de semi-conducteurs américain devenu incontournable avec l’avènement de l’IA. Un achat réalisé de justesse : dès 2022, les Etats-Unis redoublent d’effort pour freiner le rattrapage technologique chinois et interdisent à Nvidia de vendre ses meilleures puces à la Chine. Pour s’y conformer, cette entreprise réduit la performance sur ses puces à destination du marché chinois.
Dans la même tour de Hangzhou, quelques étages plus bas, Liang Wenfeng est déjà accaparé par un projet de recherche pure, hors du monde de la finance : la quête de la meilleure « intelligence artificielle générale », soit le développement d’une IA supposée dépasser l’intelligence humaine. Il utilise les ressources de High-Flyer, investisseur dans le projet DeepSeek, pour recruter de jeunes diplômés des grandes universités chinoises sans expérience.
« Lorsque vous faites quelque chose, les personnes expérimentées vous diront sans hésiter qu’il faut faire de telle ou telle manière, mais les personnes inexpérimentées devront explorer à plusieurs reprises et réfléchir sérieusement à la manière de faire, puis trouver une solution adaptée à la situation actuelle », a-t-il dit, en juillet 2024, au média tech chinois 36Kr, lors d’une de ses rares interviews. Il racontait aussi encore coder, lire des articles de recherche et participer aux forums internes de discussion chez DeepSeek chaque jour. « Un avantage de la Chine est d’avoir de nombreux talents qui comprennent les mathématiques, qui peuvent entraîner les algorithmes de mieux en mieux. Un second est le volume de données, nous utilisons de nombreux scénarios et l’IA a besoin de scénarios pour s’entraîner », explique un haut cadre chez un concurrent chinois du secteur.
« Parler d’autre chose »
Alors que la tendance dans le secteur semblait être à une fuite en avant de la consommation de données, réservant l’avenir de l’IA aux géants capables de financer des centres toujours plus vastes, les jeunes ingénieurs de DeepSeek ont apparemment trouvé des solutions nouvelles.
Là où d’autres modèles emmagasinent les connaissances, DeepSeek a été entraîné à mieux chercher par « renforcement » – le système se pose lui-même des questions et reçoit des récompenses quand ses solutions sont les bonnes. Le résultat est un logiciel un peu moins rapide, puisqu’il effectue plus de recherches au fur et à mesure, mais qui consomme beaucoup moins d’énergie.
Lire aussi | Article réservé à nos abonnés « Nous avons besoin d’énergie pour l’IA, et de l’IA pour notre énergie »
Cette innovation, parmi d’autres, permet à DeepSeek-R1, le modèle de raisonnement le plus récent de l’entreprise, d’être jusqu’à 27 fois moins cher par requête qu’OpenAI o1, pour des résultats similaires en fonction des requêtes. C’est l’une des forces de l’industrie chinoise, qui sait s’emparer des dernières découvertes pour les optimiser et les rendre accessibles au plus grand nombre. Ces gains d’efficacité ont aussi permis à DeepSeek d’affirmer avoir entraîné son IA avec seulement 2 048 puces désormais bridées par Nvidia pour le marché chinois, posant, pour la nouvelle administration américaine, la question de l’efficacité des restrictions en place.
« Ce qui les distingue, c’est qu’ils parviennent à de fortes performances avec bien moins de ressources, constate Cao Hancheng, assistant professeur à l’université Emory, à Atlanta (Géorgie). Leur efficacité-coût a d’importantes implications ; on assiste à une forme de nivellement qui rend des IA avancées accessibles. Leur succès montre qu’une équipe restreinte mais motivée, avec la bonne expertise et le talent, peut, par une approche innovante, avoir un réel impact. »
Les développeurs informatiques l’apprécient déjà. Le grand public peut facilement être déçu : si DeepSeek s’exprime très bien en français, il a une forte tendance à inventer des faits, et, censure chinoise oblige, suggère de « parler d’autre chose » quand on lui pose des questions sur la politique ou l’histoire de la République populaire de Chine.
Après le lancement de ChatGPT, fin 2022, la Chine était restée un temps abasourdie devant la puissance américaine dans l’IA et la difficulté à outrepasser les entraves de Washington. Les modèles chinois publiés peu après étaient bien loin des performances de l’application d’OpenAI. Voilà la nation chinoise revigorée par la percée de DeepSeek. Sur le réseau social Weibo, le fondateur d’un leader chinois des antivirus et de la cybersécurité, Zhou Hongyi, a résumé ce sentiment : « Nous pouvons maintenant espérer voir la Chine remporter la guerre de l’IA face aux Etats-Unis. »
Dans son entretien accordé en juillet 2024, Liang Wenfeng décrivait des entreprises chinoises habituées à un rôle de suiveur, tandis que l’écosystème aux Etats-Unis pousse à créer des innovations. Il expliquait qu’il ne cherchait plus la fortune mais les percées. « La Chine doit avoir quelqu’un qui se tienne en première ligne de la technologie », avançait Liang Wenfeng. Ces jours-ci, ce sont les ingénieurs américains qui épluchent les codes d’une entreprise chinoise pour en répliquer les découvertes.
Harold Thibault (Pékin, correspondant) et Simon Leplâtre