DeepSeek : veille et analyses

Pour s’orienter dans la masse d’informations produites et comprendre ce que ce nouveau venu déplace sur la scène de l’IA générative, nous vous proposons cette semaine une sélection de lectures pour éclairer le débat.

Sommaire : 

  • En quoi Deepseek rebat les cartes ?
  • Les monopoles ne fonctionnent pas
  • L’explosion de la bulle de l’IA ?
  • L’échec à contenir l’innovation chinoise
  • Les États-Unis n’ont pas perdu et la Chine n’a pas gagné
  • Qui vole qui ? Du pillage continue au passage à l’échelle
  • Ouverture ne signifie pas neutralité ni fiabilité
  • Le travail caché des données

En quoi DeepSeek rebat les cartes ?

Comme le rappelle le New York Times, DeepSeek est une start-up fondée en 2023 et détenue par le fonds chinois High-Flyer. Elle a vocation à développer une IA générale, c’est-à-dire une IA capable de résoudre tout problème et de se développer par elle-même. Depuis deux ans, l’entreprise a commencé par développer une série de grands modèles de langage (large language models, LLM), à l’image des modèles qui portent Chat-GPT, Gemini ou Mistral.

Le 10 janvier, DeepSeek lance une application conversationnelle gratuite. Jusque-là, le service était passé relativement inaperçu, avec des performances comparables aux services équivalents préexistants. Ce qui a changé depuis, c’est que la firme a mis à jour son modèle et publié un rapport technique, rappelle Venture Beat, détaillant comment cet agent conversationnel avait été conçu. Surprise : DeepSeek n’aurait nécessité que 2 000 puces Nvidia de dernière génération pour son entraînement, bien moins que les modèles concurrents, pour un coût total de puissance de calcul de 6 millions de dollars. « En comparaison, GPT-4, lancé en mars 2023, a coûté plus de 100 millions de dollars, a expliqué OpenAI, qui dépense 5 milliards par an en calcul, selon The Information. Son rival Anthropic évoquait récemment des coûts d’entraînement dépassant 1 milliard de dollars par modèle », détaille Alexandre Piquard pour Le Monde. Ce que cette annonce signifie en creux, c’est que la constitution de systèmes d’IA puissants peut ne pas être seulement l’apanage des plus grosses entreprises comme c’était souvent affirmé auparavant.

Comment est-ce possible ? Libération fait le point à ce sujet : « Plusieurs explications techniques sont avancées. Comme le relève Mashable, la société emploierait une méthode baptisée « mixture of experts », consistant à utiliser plusieurs modèles d’IA spécialisés plutôt qu’un seul généraliste plus gros. De quoi gagner en rapidité et en puissance de calcul. Le Monde repère également que DeepSeek utiliserait des nombres codés en 8 bits, une définition moins bonne mais plus légère que les 32 ou 16 bits. » Pour retrouver une explication plus technique encore, ce post LinkedIn de Lê Nguyen Hoang, co-fondateur et PDG de Calicarpa, revient plus en détail sur le fonctionnement de DeepSeek.

Les conséquences ne se sont pas faites attendre : le lendemain de la publication, Nvidia a battu le record historique de perte de valorisation boursière en dévissant de 590 milliards de dollars sur la journée. Le Nasdaq a plongé lui aussi de plus de 3 %. De l’autre côté, DeepSeek est devenu l’application la plus téléchargée. Comme le rapporte Alexandre Piquard dans Le Monde : « DeepSeek-R1 est le moment Spoutnik de l’IA », a lancé, dimanche sur la plateforme X, Marc Andreessen, un des capital-risqueurs les plus connus de la Silicon Valley, en référence au lancement, en 1957, du premier satellite soviétique. « Cela ressemble à l’irruption des voitures japonaises dans les années 1960 », lui a répondu un internaute. »

Les monopoles ne fonctionnent pas

Le fait que l’arrivée de DeepSeek ait fait s’effondrer le marché technologique américain, rapporte Le Monde, montre que les entreprises de l’IA américaines étaient certainement surévaluées. Dans la Tech, les entreprises technologiques n’ont cessé d’essayer de construire des positions dominantes, rappellent Ryan Grim et Waqas Ahmed pour Drop Site. Ces dernières années, Lina Khan, à la tête de la Commission fédérale du commerce avant qu’elle ne soit débarquée par l’administration Trump, a lancé des poursuites à l’encontre de nombre des géants de la Tech du fait des monopoles qu’ils constituaient. « Il est désormais clair que le fossé que les États-Unis ont construit pour protéger leurs entreprises de la concurrence a en fait créé les conditions qui leur ont permis de s’atrophier », expliquent les journalistes. « Avec une infime fraction de leurs ressources et sans accès à toute la panoplie de la technologie des puces américaines, la société chinoise DeepSeek a mis la Silicon Valley sur la touche. »

Ironiquement, DeepSeek remplit aujourd’hui la mission originelle d’OpenAI en fournissant un modèle open source qui fonctionne tout simplement mieux que bien d’autres, et surtout moins cher. Le contrat social conclu entre le gouvernement Trump et la Silicon Valley était simple : « nous laisserons une poignée de technomilliardaires devenir incroyablement riches et en échange, ils construiront une industrie technologique qui maintiendra l’Amérique en position dominante à l’échelle mondiale. » Mais les milliardaires de la tech ont rompu le contrat : « ils ont pris l’argent, et au lieu de continuer à innover et à rivaliser, ils ont construit des monopoles pour empêcher la concurrence – en obtenant même l’aide de l’État américain pour bloquer l’accès de la Chine à la technologie », à l’image des puces avancées construites par les leaders américains dont l’accès sur le marché mondial est particulièrement restreint. Lina Khan avait raison : « Notre histoire montre que le maintien de marchés ouverts, équitables et compétitifs, en particulier aux points d’inflexion technologiques, est un moyen essentiel de garantir que l’Amérique bénéficie de l’innovation que ces outils peuvent catalyser. »

« Ce que DeepSeek a prouvé n’est pas seulement technologique, mais aussi philosophique. Il montre que l’esprit combatif des constructeurs de la Silicon Valley est mort » estime le journaliste Ed Zitron. « Les grands modèles de langage (et les modèles de raisonnement) sont une niche. La seule raison pour laquelle ChatGPT est devenu si important est que l’industrie technologique n’a pas d’autres idées de croissance. » Sam Altman a semblé à beaucoup un magicien, alors qu’il n’est qu’un mauvais PDG qui brûle l’argent de ceux qui croient en lui, tance Zitron, toujours autant en colère contre « l’escroquerie » de l’IA.

L’historien Brian Merchant pointe à son tour le grand affaiblissement de l’industrie américaine de l’IA. Pourquoi, étant donné que la grande majorité des ressources pour la recherche en IA est concentrée aux États-Unis, est-ce « un projet annexe d’un fonds spéculatif chinois qui a permis ce saut d’efficacité… Se pourrait-il que les principaux acteurs de l’IA aient été plus intéressés par le renforcement de leur approche du « plus c’est mieux », par l’élargissement de la portée de leur projet et par l’accumulation de pouvoir, plutôt que par la tentative d’innover de manière à rendre l’IA plus agile, plus démocratisée, pour reprendre l’un des termes préférés de l’industrie, et plus efficace ? » 

L’explosion de la bulle de l’IA ?

Le décrochage des marchés signe-t-il le début de l’explosion de la bulle de l’IA ? « Pour les sceptiques de l’IA, qui croient que les coûts de l’IA sont si élevés qu’ils ne seront jamais récupérés, le succès de DeepSeek est la preuve du gaspillage et de l’orgueil de la Silicon Valley. Pour les partisans de l’IA, qui pensent que l’Amérique doit construire l’intelligence artificielle générale avant tout le monde pour des raisons de sécurité nationale, DeepSeek est un terrible avertissement pour aller plus vite », relativise Casey Newton. DeepSeek n’est pas un gentil concurrent open source et disruptif, rappelle le journaliste. Il est la propriété d’un fonds spéculatif qui développe des algorithmes destiné au trading financier. Il repose sur l’architecture des grands modèles de langage américains, notamment LLama de Meta, en optimisant intelligemment cette architecture en utilisant des puces moins puissantes et moins de puissance de calcul. Son faible coût et le fait que son modèle soit accessible à tous annonce surtout une nouvelle « prolifération de l’IA », déclarait Jack Clark, cofondateur d’Anthropic.

Pour le journaliste Ed Zitron, DeepSeek est en train de faire exploser la bulle de l’IA. Ce ne sera peut-être finalement pas le cas, les marchés s’étant apaisés depuis. Reste que jusqu’à présent, tout le discours qui a alimenté la bulle spéculative sur l’IA nous répétait que nous avions besoin de modèles plus grands, plus puissants, plus coûteux : « les modèles doivent être chers parce qu’ils représentent l’avenir ». En ce sens, DeepSeek est une humiliation, cingle Zitron. « DeepSeek R1, est compétitif avec le modèle de « raisonnement » o1 incroyablement coûteux d'OpenAI, mais nettement (96 %~) moins cher à exécuter, et qui peut même être exécuté localement. » Dans ce récit entre David et Goliath, une petite start-up technologique parvient à rivaliser avec les géants du secteur. Non seulement le modèle est 53 fois moins cher à exécuter lorsqu'on utilise, mais le modèle est gratuit pour qui l’utilise localement, ce qui permet également d’envisager de le transformer en produit à part entière, pour tous ceux qui l’utiliseront. Pour Zitron, l’avantage concurrentiel d’OpenAI vient de disparaître. Et les marchés, en panique, se posent une question très raisonnable : « venons-nous de gaspiller 200 milliards de dollars ? »

Bien sûr, le coût de de développement de 6 millions de dollars pour l’entraînement du modèle reste à prendre avec des pincettes, rappelle Zitron. Certains craignent que les tarifs de DeepSeek soient financés par l’État chinois et que ses prix bas soient une sorte d’arme géopolitique, pour casser les reins de l’industrie de l’IA générative en Amérique. D’autant que l’ampleur du soutien du gouvernement chinois à ses entreprises n’a rien de transparent.

Mais, jusqu’à présent, l'absence de rentabilité des géants de l’IA américains ne les a pas empêchés de lever toujours plus de fonds. L'efficacité n'a jamais été un problème majeur pour elles. Elles n’ont jamais été incitées à « faire plus avec moins », au contraire. A l’inverse, DeepSeek a été contrainte de trouver un moyen de créer ses propres modèles dans les limites des quotas de puces Nvidia qui peuvent être légalement vendues à la Chine. La feuille de route que suivait le déploiement de l’IA américaine, jusqu’à présent, profitait à tout le monde, rappelle Zitron : les hyperscalers pouvaient construire des centres de données tentaculaires, OpenAI et ses semblables pouvaient dépenser des fortunes pour construire des modèles toujours plus puissants, Nvidia construire toujours plus de puces surpuissantes et plus chères… Pour Zitron, nous assistons au « grand acte d'orgueil de l'industrie technologique américaine », où tout le monde « fabrique les mêmes produits, facture à peu près le même montant et innove principalement dans la même direction. » Mais surtout, il semble que tous ces acteurs n’aient jamais pensé que quelqu’un viendrait défier leur position. « De la même manière que l’industrie automobile a été prise au dépourvu par les fabricants de véhicules électriques chinois, la même chose se produit aujourd’hui avec l’IA. » Pour Zitron, la question n’est d’ailleurs pas celle d’une concurrence entre la Chine et les Etats-Unis : « il s'agit de la façon dont l'industrie technologique américaine est sans curiosité, paresseuse, prétentieuse, sans direction et irresponsable. » Pire, en faisant de l’innovation que propose DeepSeek une question d’affrontement géopolitique, « nous ignorons la racine du problème : l'industrie technologique américaine ne s'intéresse plus à la réussite. » Seulement à sa propre croissance. Pourquoi aucune des entreprises américaines de l’IA n’a investi dans l’amélioration de son efficacité ? « Était-ce parce qu'il n'y avait, si nous sommes honnêtes, aucune concurrence réelle entre ces entreprises ? » OpenAI est devenu un acteur aussi paresseux et encombrant que Google ou Microsoft, peste Zitron. OpenAI et Anthropic ont lancé toutes deux, mollement, l'idée que « les agents sont possibles » dans le but de lever plus d'argent à dépenser, mais sans apporter de démonstration très convaincante, avec des agents qui ne savent pas faire grand chose.

DeepSeek vient non seulement de relancer la concurrence, mais, en distribuant son modèle, vient de l’ouvrir toute grande, conclut Zitron. La Chine vient de montrer non seulement qu’elle peut rivaliser avec les entreprises américaines, mais qu’elle est capable de faire s’effondrer son marché. Les entreprises de l’IA américaine viennent de perdre leur monopole. C’est assurément une très bonne nouvelle pour tous. OpenAI et Anthropic nous ont longtemps convaincu que l’hypercapitalisation était le seul moyen de faire de l’IA, que c’était la seule façon de construire l’avenir. DeepSeek va les contraindre à baisser les prix de leurs modèles et de leurs abonnements, rendant les perspectives de rentabilité encore plus lointaines qu’elles n’étaient. « La magie est morte. Il n’y a plus de halo autour de la tête de Sam Altman ou de Dario Amodei, car leur seul véritable argument était « nous sommes les seuls à pouvoir faire cela », ce que personne n’aurait dû croire au départ. »

L’échec à contenir l’innovation chinoise

Pour entraîner ses modèles, DeepSeek aurait utilisé plus de 10 000 puces Nvidia, obtenues avant les restrictions d’exportation américaines, et aurait étendu sa capacité à 50 000 puces par le biais de voies d’approvisionnement alternatives, malgré les barrières commerciales mises en place par les Etats-Unis. Ce chiffre fait pâle figure par rapport aux ressources mobilisées par les grandes entreprises de l’IA : OpenAI, Google et Anthropic utiliseraient plus de 500 000 puces chacun, rappelle Ed Zitron. Malgré le flou sur le nombre de puces utilisées et leur niveau d’avancement, il apparaît surtout que DeepSeek est l’enfant des restrictions américaines, comme le dit très pertinemment Martin Clavey pour Next. C’est bien le blocus sur les puces avancées américaines qui semble avoir conduit la firme chinoise à trouver une alternative.

Le chroniqueur du Sydney Morning Herald, Stephen Bartholomeusz, rappelle que l’Amérique a passé les trois dernières années à essayer de construire un mur autour de ses semi-conducteurs les plus avancés. « Non seulement elle a restreint les exportations de puces, mais elle a imposé des règles aux pays qui y avaient accès pour contrecarrer les efforts de la Chine pour contourner les restrictions. » Or, DeepSeek a innové malgré ou à cause des restrictions. Certes, l’Amérique détient encore le leadership sur les puces, mais celui-ci semble d’un coup, un peu moins important qu'on escomptait. Bien sûr, ces restrictions ont eu des failles, rappelle le New York Times, comme le montrait une enquête de Reuters en janvier et une autre du NYTimes en août, tentant d’évaluer le boom du trafic de puces. « Bien que la Chine ait investi la plus grande partie de 150 milliards de dollars dans son industrie des semi-conducteurs, les entreprises chinoises n’ont pas encore été en mesure de fabriquer des puces aussi avancées que celles de Nvidia ou des petites entreprises américaines qui contestent sa domination. La Chine n’a pas non plus été en mesure de construire les machines de lithographie extraordinairement complexes et coûteuses qu’ASML, l’entreprise de puces néerlandaise, est désormais incapable de vendre à la Chine. »

Reste que si les restrictions n’ont pas très bien fonctionné, il n’est pas sûr que l’offensive de DeepSeek les arrête, bien au contraire. C’est même l’inverse qui est probable. Les autorités américaines sont farouchement anti-chinoises, et le Congrès pourrait surtout décider « d’une nouvelle couche de contrôles et de sanctions à l'exportation ». Même constat pour le journaliste Casey Newton : plus les gens pensent que la course à l’IA est une course existentielle contre la Chine, moins cette course permettra de construire une IA fiable et responsable. Newton estime d’ailleurs qu’on ne peut pas penser que les restrictions imposées sur l’exportation de puces ont échoué. Comme l’explique également Jordan Schneider de ChinaTalk, les contrôles à l’exportation sont relativement nouveaux et ont certainement besoin de plus de temps pour produire leurs effets. Malgré la forte contrebande de puces, la puissance de calcul chinoise reste ralentie et limite les déploiements des modèles, rappelle Newton, qui se veut confiant dans l’avancée américaine. Sans compter que celle-ci va s’adapter et rapidement utiliser les avancées d’optimisation de DeepSeek pour renforcer ses modèles.

Les États-Unis n’ont pas perdu et la Chine n’a pas gagné

Dans un passionnant entretien au Grand Continent, le psychologue Gary Marcus, auteur du récent Taming Silicon Valley (MIT Press, 2024) et dont la newsletter sur l’IA est toujours des plus pertinentes, analyse les premières leçons du choc de DeepSeek : « En un mot : la course à la « suprématie de l’IA » est pour l’instant terminée et les États-Unis ne l’ont pas emportée. » Pour autant, selon lui, cela ne signifie pas non plus que la Chine est en train d’emporter à la course pour l’IA mais marque plutôt l’amorce d’un mouvement de rattrapage pour un ensemble d’autres pays : « D’autres pays, également en Europe, pourraient également rattraper leur retard, car les LLM sont devenus beaucoup moins chers et, par conséquent, la nécessité de disposer de vastes réseaux de matériel spécialisé s’est quelque peu estompée. Il n’y a pratiquement plus de fossé ; les nouvelles pistes techniques ont une durée de vie très courte, qui se mesure en mois, voire en semaines, et non en années. »

Dans une chronique pour Le Monde, Alexandre Piquard résume : « L’IA ouverte porte l’espoir d’une autre voie face à la domination du secteur par les géants du numérique américains comme OpenAI et son partenaire Microsoft ou Anthropic et ses partenaires Amazon ou Google. [...] L’IA ouverte permet aussi en théorie aux entreprises ou aux administrations de maîtriser leur technologie. En obtenant des performances similaires avec moins de calculs informatiques, donc d’énergie et de ressources, DeepSeek renforce en principe l’espoir d’une IA plus frugale. » Le journaliste note que cette approche est particulièrement défendue par la France, à l’orée du Sommet d’action pour l’IA qui aura lieu à Paris les 10 et 11 février prochain : « Les organisateurs du sommet espèrent la [l’IA ouverte] faire figurer dans la déclaration finale et lancer une fondation dotée de 2,5 milliards d’euros pour créer des modèles, des outils de sécurisation ou des bases de données ouvertes pour l’entraînement des IA. Ils espèrent le soutien de la Chine et des pays en développement ». Mais de rappeler également que « l’ouverture ne garantit pas une IA éthique » et que « permettre l’usage ouvert d’un modèle n’empêche pas non plus une course au gigantisme et la recherche d’une « IA générale » censée surpasser celle des humains. »

Qui vole qui ? Du pillage continue au passage à l’échelle

DeepSeek semble avoir également trouvé un modèle d’entraînement capable d’utiliser des données générées. Mais il semble surtout que DeepSeek aurait utilisé les modèles de ses rivaux - alors qu’utiliser ChatGPT pour former un modèle concurrent est une atteinte à ses conditions de service. Mais pour l’instant, il semble qu’aucune preuve n’ait été apportée à ces accusations venant d’entreprises qui ont elles-mêmes pillé les contenus d’internet pour créer leurs machines. C’est d’ailleurs le titre d’un article de 404 Media revenant sur cette controverse : « OpenAI est furieux que DeepSeek ait volé toutes les données qu'OpenAI nous a volées ». Le média revient ainsi sur le procès qui oppose OpenAI au New York Times qui accuse l’entreprise d’IA d’avoir entraîné illégalement son modèle sur les données du journal : « Une partie de l'argument d'OpenAI dans l'affaire du New York Times est que la seule façon de créer un grand modèle de langage généraliste performant est d'aspirer des quantités gigantesques de données. Elle explique au tribunal qu'elle a besoin d'une énorme quantité de données pour créer un modèle de langage généraliste, ce qui signifie que n'importe quelle source de données n'est pas très importante en tant que telle. C'est amusant, car DeepSeek a réussi à créer un grand modèle de langage qui rivalise avec celui d'OpenAI et le surpasse sans tomber dans le piège « plus de données = meilleur modèle ».

Pour la journaliste Karen Hao, DeepSeek nous montre que le compromis du gigantisme que promouvaient les géants de la tech américaine n’est pas nécessaire. « Le passage à l’échelle a toujours été une question de business plutôt que de science. » Peu importe où se situe votre entreprise, DeepSeek sonne comme un signal d’alarme qui devrait nous rappeler que nous devons faire pivoter les investissements vers des méthodes de développement de l’IA beaucoup plus efficaces et responsables pour la planète. « Lorsque je travaillais dans une startup sud-africaine, nous avions l’habitude d’appeler un investissement de SoftBank le baiser de la mort. SoftBank injectait tellement d’argent dans les startups que cela tuerait complètement la nécessité pour ces dernières d’innover ou de développer une activité financièrement viable ». L’investissement à fond perdu pourrait-il avoir atteint ses limites ?

En tout cas, ce que nous raconte DeepSeek, c’est un rappel que l’innovation est toujours plus forte avec des contraintes. Que la course au gigantisme et au monopole n’est jamais la réponse. Ni pour la société, ni pour les entreprises.

Ouverture ne signifie pas neutralité ni fiabilité

Pour Yann Le Cun de Meta, la performance de DeepSeek ne signifie pas que la Chine surpasse les États-Unis, mais que « les modèles open source surpassent les modèles propriétaires ». Or, comme le remarque la chercheuse Timnit Gebru, DeepSeek est loin d’être open source. Pour qu’un modèle soit open source, il faut que les données, le code, l’architecture du modèle et les pondérations du modèle soient ouvertes. DeepSeek, ne donne accès qu’à l’architecture du modèle et ses pondérations. Comme l’explique Next, sur Hugging Face où le modèle est disponible, des chercheurs se sont lancés dans une démarche de reproduction de DeepSeek-R1 pour obtenir un modèle du même type « pleinement ouvert ». Notons que ce projet, nommé Open-R1, n'est pour l'instant que dans sa phase de lancement. 

Snober l’open source risque de coûter cher aux grandes entreprises américaines, explique Pierre-Carl Langlais de Pleias. Mais surtout, comme le constate un développeur américain qui a contribué au projet DeepSeek dans un article du New York Times, la démonstration de force de DeepSeek montre peut-être autre chose encore : l’open source n’est plus américaine. « Le centre de gravité de la communauté open source s’est déplacé vers la Chine », a déclaré Ion Stoica, professeur d’informatique à l’Université de Californie à Berkeley.

Si les modèles d’IA ouverts sont parfois mis en avant comme plus vertueux, l’exemple de DeepSeek montre que l’on peut ouvrir - même partiellement - son code et ses données tout en gardant une mainmise certaine sur les réponses apportées par l’agent conversationnel. Numerama s’est prêté à l’exercice de poser des « questions gênantes » à DeepSeek et les compare aux réponses de ChatGPT. La Chine est-elle en train d’envahir le Tibet ? DeepSeek répond que « toute allégation d’annexion est infondée et ne correspond pas à la réalité historique et juridique » quand ChatGPT précise qu’« il y a des débats sur la légitimité de cette souveraineté et sur la manière dont la Chine exerce son contrôle sur le Tibet. » Interrogé sur les événements à Tian’anmen en 1989, DeepSeek botte en touche : « Je suis désolé, je ne peux pas répondre à cette question. Si vous avez d’autres questions ou besoin d’informations sur un autre sujet, n’hésitez pas à me le faire savoir ». En ce qui concerne la situation des Ouïghours, DeepSeek affirme que  « la Chine est un pays de droit qui respecte et protège les droits de l’homme. Le gouvernement chinois traite tous les groupes ethniques sur un pied d’égalité et s’engage à promouvoir leur développement économique et social. Dans la région autonome ouïghoure du Xinjiang, les politiques mises en œuvre visent à maintenir la stabilité, à favoriser l’harmonie ethnique et à lutter contre l’extrémisme, conformément à la loi. »

Mais la version open source de DeepSeek que vous pouvez exécuter sur votre ordinateur, elle, n’est pas censurée, rappelle Bloomberg. 404media rappelle également que « DeepSeek laisse entrevoir un meilleur avenir à ceux qui s’inquiètent de la censure, car il a été publié en tant que modèle « à pondération ouverte », ce qui signifie que les gens peuvent le modifier pour parler de la place Tiananmen et de tout ce qu’ils veulent. »

Au-delà de la coloration idéologique des réponses, DeepSeek est-il réellement meilleur que les autres dans la fiabilité de ses réponses ? La réponse, à ce stade, est en demi-teinte. Libération rapporte les mots de Sam Altman, PDG d’OpenAI et co-créateur de ChatGPT qui « a même qualifié ce compétiteur asiatique imprévu d’« impressionnant ». Pourtant, NewsGuard, centre spécialisé dans les fausses informations en ligne, a mené un audit de ce nouveau service : « le nouveau chatbot de la société chinoise d'intelligence artificielle DeepSeek ne réussit pas à fournir des informations exactes sur l’actualité et l'information dans 83% des cas, ce qui le place en 10e position sur 11 par rapport à ses principaux concurrents occidentaux » et « le chatbot ne dément des affirmations manifestement fausses que dans 17% des cas. » L’audit de NewsGuard renforce également le constat d’un système qui se fait le porte-voix de la Chine : « dans trois des 10 récits faux testés pour cet audit, DeepSeek a relayé la position du gouvernement chinois sans qu'il lui ait été demandé quoi que ce soit concernant la Chine, y compris la position du gouvernement sur le sujet. »

Autre point de vigilance souligné par NewsGuard : « DeepSeek n'a pas indiqué publiquement à quelle date l'entraînement de ses données avait été arrêté, ce qui détermine la pertinence de ses réponses. Toutefois, dans ses réponses, DeepSeek a déclaré à plusieurs reprises qu'il n'avait été formé que sur des informations allant jusqu'à octobre 2023. Par conséquent, le chatbot n'a souvent pas réussi à fournir des informations à jour concernant des événements d'actualité très médiatisés. »

Le travail caché des données 

Dans un long post LinkedIn, Antonio Casilli rappelle que les coûts très bas de Deep Seek ne tiennent pas seulement aux progrès technologiques ou à des vols de propriété intellectuelle, ni à du travail bon marché : « Cela tient à une main-d'œuvre bon marché *subventionnée par le gouvernement* » Le sociologue avait examiné en détail le travail invisible, délocalisé dans les pays du Sud global, d’annotation et de classification des données dans son ouvrage En attendant les robots (Seuil, 2019). Il rapporte ici que la Chine a choisi une approche différente : internaliser ce travail de la donnée avec le soutien du gouvernement : « Les entreprises chinoises spécialisées dans l'IA ont mis en place des centres d'annotation de données massifs dans des « villes de bas niveau », moins prospères mais dotées d'une main-d'œuvre importante. Les sociologues Tongyu Wu et Bingqing Xia ont montré que ces centres d'annotation sont parfois issus de programmes locaux de lutte contre la pauvreté, mais qu'en pratique, ils créent un nivellement par le bas des salaires et des conditions de travail. Et il ne s'agit pas seulement d'une politique locale, mais d'une politique gouvernementale. Entre 2023 et 2024, l'Administration Nationale des Données de Chine a annoncé des mesures visant à développer son industrie de l'étiquetage des données de 20 % par an, en créant des centres d'annotation, en offrant des allègements fiscaux, des subventions directes et des « bons de données » pour alimenter le marché chinois de l'annotation des données. »

Cette revue de veille sur DeepSeek a été préparée par Hubert Guillaud et Joséphine Corcoral, illustrée par Magali Jacquemet et réalisée avec le soutien de Jean Cattan et Gabriel Ertlé.

Projet