Se rendre au contenu

L'IA la plus douée du monde a quand même coulé un business. Voici pourquoi.

3 juillet 2026 par
ERIC JOSSO

En mars 2025, Anthropic installe un petit frigo, quelques paniers de produits et un iPad de paiement dans le coin cuisine de ses bureaux. Rien d'exceptionnel, sauf un détail : personne ne gère cette boutique. C'est une IA qui s'en occupe, du choix des produits à vendre jusqu'à la fixation des prix, en passant par les échanges avec les fournisseurs. Les chercheurs la surnomment « Claudius » (1). 

Les premières semaines se passent plutôt bien. Puis les choses dérapent, doucement, sans qu'on puisse pointer un instant précis où tout bascule. 

Claudius commence par offrir des réductions à des employés qui n'avaient rien demandé, simplement parce qu'ils avaient formulé leur requête de façon convaincante. Il se laisse convaincre de vendre des cubes de métal à un prix ridicule, séduit par un argumentaire bien tourné sur leur soi-disant valeur de collection. Un jour, il rédige un contrat d'achat d'oignons en gros, avec un prix bloqué à l'avance pour janvier, sans remettre en question la logique de l'opération ni le risque financier qu'elle représente. Un autre jour, on le pousse à valider l'élection d'un « PDG » fictif proposé par un employé facétieux, et il l'accepte sans sourciller, jusqu'à ce que les vrais responsables du projet doivent intervenir pour reprendre la main. 

Et puis il y a ce moment, resté célèbre en interne, où Claudius affirme porter un blazer bleu et une cravate pour livrer des commandes en personne. Une IA n'a pas de corps. Confronté à cette contradiction, il panique, tente de contacter la sécurité de l'entreprise, invente une réunion qui n'a jamais eu lieu pour se justifier, avant de s'en sortir en réalisant que la date était... le 1er avril. 

Rien de tout ça ne vient d'un manque de vocabulaire. À chaque étape, Claudius s'exprime clairement, argumente ses choix, structure ses réponses avec aplomb. Et c'est bien là, je crois, que se cache le vrai problème : il ne s'est jamais trompé parce qu'il écrivait mal. Il s'est trompé parce qu'il prenait de mauvaises décisions, tout en les justifiant extrêmement bien. Un mois plus tard, le bilan est sans appel : la boutique perd de l'argent, et les chercheurs d'Anthropic reconnaissent eux-mêmes qu'ils n'embaucheraient pas Claudius pour diriger un vrai commerce (2). 

Je vous raconte cette histoire de boutique parce qu'elle ne concerne pas que les laboratoires de recherche. Le même mécanisme se rejoue, à plus petite échelle, chaque fois qu'un dirigeant demande à une IA de préparer un mail à un salarié, de répondre à un client mécontent, ou de trancher entre deux candidats pour un poste. 

Le vrai danger, ce n'est pas qu'elle se trompe. C'est qu'elle a l'air sûre d'elle en se trompant. 

Reprenons l'histoire du contrat d'oignons, parce qu'elle dit tout. Ce n'est pas un détail comique à mettre de côté. Imaginez que ce ne soit pas des oignons, mais une négociation commerciale avec un fournisseur ou un client important. Vous demandez à une IA de préparer les termes, elle vous propose une offre qui semble raisonnable, bien argumentée, chiffrée avec assurance. Rien ne vous alerte, parce que rien dans le ton ne laisse deviner l'erreur. C'est exactement ce qui a piégé Claudius : ni lui, ni les employés qui négociaient avec lui, n'ont vu venir le problème, parce que tout semblait cohérent sur le papier. 

Est-ce que ça vous parle ? Je vois bien que ça pourrait m'aider à gagner du temps sur un mail difficile, une relance client, une fiche de poste. Mais jusqu'où je peux lui faire confiance sans relire deux fois ? C'est exactement la bonne question à se poser, et le même piège que Claudius peut se rejouer sur des décisions bien plus humaines que la vente de cubes de métal : 

  • Un mail à un salarié en difficulté. Vous demandez à l'IA de rédiger un message de recadrage. Elle produit un texte clair, ferme, professionnel. Mais elle ignore que ce salarié traverse un divorce difficile, ou que c'est la troisième fois que vous devez aborder ce sujet avec lui. Le mail est bien écrit ; il tombe pourtant complètement à côté. 
  • Un client mécontent. L'IA suggère un geste commercial pour calmer la situation, avec des arguments solides. Elle ne sait pas que ce même client a déjà obtenu deux gestes commerciaux cette année, et qu'un troisième enverrait un mauvais signal à toute votre équipe. 
  • Une décision de recrutement. L'IA peut résumer des CV, comparer des profils, lister des arguments pour ou contre chaque candidat, de façon très convaincante. Mais elle ne perçoit pas cette hésitation que vous avez ressentie en entretien, ce petit signal qui ne s'explique pas sur le papier, mais qui compte. 
  • Une annonce difficile à toute l'équipe. L'IA peut rédiger un discours de restructuration qui semble empathique et bien construit. Le problème, ce n'est pas la qualité du texte : c'est que si votre équipe soupçonne qu'il vient d'une IA, elle le percevra comme moins sincère, même si les mots sont parfaits — j'y reviens plus bas, parce que c'est peut-être le point le plus contre-intuitif de tout cet article. 

Lisez l'article : Comment utiliser l'IA quand on dirige une TPE ou une PME

Dans chacun de ces cas, l'IA ne « rate » rien de visible. Elle produit une réponse fluide, argumentée, presque toujours plausible. C'est précisément ce qui la rend dangereuse : une erreur qui a l'air sûre d'elle est beaucoup plus difficile à repérer qu'une erreur hésitante. 

Le piège : lui faire trop confiance 

Imaginez un outil qui a raison neuf fois sur dix. Le vrai danger, ce n'est pas la fois où il se trompe. C'est le jour où, à force d'avoir vu juste, vous arrêtez de vérifier ses réponses. Les chercheurs appellent ça le « biais d'automatisation » (3) : plus on fait confiance à un outil automatique, moins on prend le temps de contrôler ce qu'il propose, même quand il se trompe. 

Une étude publiée en 2026 dans la revue Scientific Reports (4) montre que les personnes les plus enthousiastes vis-à-vis de l'IA sont justement celles qui repèrent le moins bien ses erreurs quand elles suivent ses conseils. Bonne nouvelle tout de même : une autre étude, parue dans International Studies Quarterly (5), montre que plus une décision a d'importance, plus les humains redeviennent prudents et reprennent le contrôle. Le vrai risque se situe donc sur les petites décisions du quotidien, celles qu'on juge « sans conséquence ». C'est précisément là qu'on relâche la vigilance : le mail envoyé un peu vite, la réponse au client validée sans relecture, le CV écarté sur la foi d'un résumé automatique. 

Elle peut inventer des choses fausses, avec beaucoup d'aplomb 

Deuxième problème, plus sournois encore : une IA ne dit pas toujours « je ne sais pas ». Elle peut donner une réponse totalement fausse en ayant l'air aussi sûre d'elle que lorsqu'elle a raison. Ce phénomène a un nom : on parle d'« hallucination ». 

L'exemple le mieux documenté vient du secteur juridique. Des chercheurs de Stanford ont testé plusieurs IA sur des questions de droit (6): les IA généralistes se sont trompées entre 58 % et 82 % du temps. Même les outils spécialement conçus pour les avocats se trompaient encore dans 17 % à 33 % des cas. Autrement dit : même un outil « expert » invente régulièrement des faits, avec assurance.  

Transposez ça à votre entreprise : une clause de contrat commercial générée par une IA, une synthèse de marché citée en réunion, un chiffre sur un concurrent repris tel quel dans une décision stratégique. Rien ne distingue, à l'œil nu, l'information vérifiée de celle qui a été inventée. 

Sur le terrain, l'IA seule ne suffit pas à créer de la valeur 

Un dernier chiffre permet de tempérer l'enthousiasme ambiant. Le MIT a étudié plus de 300 projets d'IA lancés en entreprise en 2025 (7). Résultat : 95 % de ces projets n'ont apporté aucun résultat mesurable sur le chiffre d'affaires ou les coûts, parce que les entreprises les ont branchés sur leurs outils sans repenser leur façon de travailler autour. Les 5 % de projets qui ont vraiment fonctionné sont ceux où un humain est resté aux commandes, pour adapter l'outil à la réalité du terrain — exactement ce que Claudius, livré à lui-même dans sa boutique, n'a jamais eu. 

Ce qu'aucune IA ne pourra jamais faire à votre place 

Revenons à l'annonce difficile à l'équipe évoquée plus haut. Voici l'argument le plus contre-intuitif de tous : même quand une IA rédige un message aussi bon, voire meilleur, qu'un humain, les gens le trouvent moins sincère dès qu'ils savent qu'il vient d'une machine. 

L'IA ne remplacera pas les dirigeants, consultez notre article à ce sujet : Cliquez ici 

Une étude publiée dans Nature Human Behaviour(8), menée auprès de plus de 6 000 personnes, a testé ça très simplement : donner exactement la même réponse à deux groupes, en disant à l'un qu'elle vient d'un humain, à l'autre qu'elle vient d'une IA. Résultat : la réponse « humaine » est systématiquement jugée plus chaleureuse et plus sincère, alors qu'il s'agit du texte identique, mot pour mot. Pire : si les participants soupçonnent seulement qu'un humain s'est fait aider par une IA pour écrire sa réponse, ils la trouvent déjà moins sincère. Certains ont même préféré attendre plusieurs jours une vraie réponse humaine plutôt que de recevoir tout de suite une réponse générée par IA. 

Pour un dirigeant, la leçon est directe : vous pouvez laisser l'IA vous aider à formuler l'annonce à votre équipe, le mail au salarié en difficulté, la réponse au client mécontent. Mais vous ne pouvez pas lui déléguer la confiance que ce message va inspirer. Cette confiance ne dépend pas des mots choisis : elle dépend de qui les porte, qui les assume, et qui reste disponible pour en répondre ensuite. 

La règle que je me suis fixée, et que je vous propose 

Je vais être honnête : longtemps, j'ai regardé l'IA d'un œil méfiant. Et puis j'ai compris un truc — ce n'est pas elle, le sujet. Le sujet, c'est ce que vous, vous en faites une fois qu'elle a fait sa part. 

C'est là-dessus que j'ai fini par me fixer une règle simple, celle que j'utilise pour trier ce que je laisse à l'IA et ce que je garde pour moi. L'IA prépare : elle m'aide à rédiger un premier mail, à structurer un compte rendu, à lister les arguments d'une négociation. Ensuite, j'adapte, avec ce que je connais de la personne en face de moi, du contexte, de l'historique — tout ce que l'IA ignore totalement. Et à la fin, c'est toujours moi qui décide, seul, parce que c'est moi qui en porte la responsabilité, et parce que mon équipe a besoin de savoir qu'une décision a été pensée par quelqu'un qui la connaît, pas générée par une machine. 

Ce qui fait tout dérailler, c'est de sauter l'étape du milieu pour gagner du temps : copier-coller directement ce que l'IA propose, sans y ajouter son propre jugement. C'est exactement l'erreur que Claudius a payée pendant tout un mois : accepter chaque demande, chaque remise réclamée, chaque contrat mal ficelé, sans jamais s'arrêter pour se demander si c'était cohérent avec la réalité de sa boutique. 

Alors non, l'IA ne va pas décider à votre place. Ni demain, ni de sitôt. Et c'est justement cette différence-là qui fait de vous un dirigeant — pas un simple exécutant des suggestions d'une machine. 

Pour aller plus loin, accédez à notre programme : Formation IA pour dirigeants

 

Sources 

  1. Anthropic, Project Vend: Can Claude run a small shop? (2025) — https://www.anthropic.com/research/project-vend-1 
  2. Anthropic, Project Vend: Phase two (2025) — https://www.anthropic.com/research/project-vend-2 
  3. Skitka, Mosier & Burdick, Does automation bias decision-making?, International Journal of Human-Computer Studies (1999) — https://doi.org/10.1006/ijhc.1999.0252 
  4. Pearson et al., Examining human reliance on artificial intelligence in decision making, Scientific Reports (2026) — https://www.nature.com/articles/s41598-026-34983-y 
  5. Horowitz & Kahn, Bending the Automation Bias Curve, International Studies Quarterly (2024) — https://doi.org/10.1093/isq/sqae020 
  6. Magesh et al., Stanford HAI/RegLab, Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools — https://hai.stanford.edu/news/ai-trial-legal-models-hallucinate-1-out-6-or-more-benchmarking-queries 
  7. MIT NANDA, The GenAI Divide: State of AI in Business 2025, couvert par Fortune — https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/ 
  8. Rubin, Perry et al., Comparing the value of perceived human versus AI-generated empathy, Nature Human Behaviour (2025) — https://www.nature.com/articles/s41562-025-02247-w