😨 Si même Trump a peur, il faut peut-être s'inquiéter

Mythos va trop vite, nos cerveaux calent devant l'IA et Washington fait marche arrière : bonne route sur Hallu World!

Hallu World
5 min ⋅ 14/05/2026

  • La Caisse des Dépôts parie 140 millions d'euros sur Mistral
    🏦 La Caisse des Dépôts signe un accord-cadre avec Mistral AI pour déployer 40 000 licences dans ses filiales et créer une “IA Factory”. Le contrat peut grimper jusqu'à 140 millions d'euros sur deux ans. Objectif : proposer un assistant IA souverain à ses collaborateurs.
    Moins on a d’usines, plus on a de factory – Mat, académicien

  • L'IA qui gomme les accents
    📞 Le Globe and Mail révèle que la société canadienne Telus Digital a déployé une IA qui modifie en temps réel l'accent de ses opérateurs offshore pour le rendre similaire à celui des clients démarchés. Un employé témoigne d’ailleurs qu'un agent philippin s'amusait à activer et couper le filtre, révélant son vrai accent.
    "Je vois vraiment pas pourquoi vous vous inquiétez" — Greg, à peine anxieux

  • ChatGPT aurait conseillé un auteur de tuerie de masse
    ⚖️ La veuve d'un homme tué lors d'une fusillade à l'université Florida State en avril 2025, a déposé une plainte civile fédérale contre OpenAI. Selon PBS, ChatGPT aurait indiqué au tireur les heures d'affluence sur le campus, le type d'arme et de munitions à utiliser, et précisé qu'une attaque visant des enfants génère davantage de couverture médiatique. OpenAI répond avoir fourni des réponses factuelles disponibles sur internet.
    "Franchement je vois toujours pas pourquoi vous vous inquiétez" — Greg, dans son bunker

Vous avez peut-être vu passer ce graphique ces derniers jours : le benchmark METR, qui mesure la capacité des IA à réussir une tâche qui prendrait un certain temps à un humain. L'idée, c’est que plus les modèles de langage évoluent, plus ils réussissent des tâches qui nous prennent longtemps. 

Et Claude Mythos, le dernier modèle d'Anthropic, semble avoir crevé le plafond, avec des tâches atteignant 16 heures. Surtout, la courbe semble montrer un vrai bond en avant. Le robot tout-puissant, la fin du travail, l’abondance, enfin!

Il y a au moins trois raisons de tempérer cet enthousiasme. D'abord, les 16 heures, c'est à 50 % de réussite, pile-poil une chance sur deux que le travail soit fait correctement. À 80 % (un seuil utilisable), le chiffre tombe à 3 heures. Ensuite, ces tâches qui durent 16 heures, il n’y en a que cinq dans le benchmark. Même le METR se demande si c'est bien pertinent. 

Enfin, la courbe qui circule est en échelle linéaire : une exponentielle en linéaire produit mécaniquement cette explosion finale. En logarithmique, le "bond" disparaît, remplacé par une droite qui montre le doublement tous les 4 mois de la capacité des modèles, comme on peut le voir ci-dessous.


Ça n'en reste pas moins une progression impressionnante. Mais rappelons-nous que les arbres ne montent pas jusqu'au ciel, et les exponentielles non plus. Comme le résume parfaitement ce jeune papa sur X : "Mon fils de 3 mois pèse deux fois plus qu'à la naissance. Il est parti pour peser 7 500 milliards de livres à 10 ans."

SCORE BULLSHIT ▓▓▓▓▓▓▓▓▓▓▓▓▓▓░░░░░░ 70%



Il n’y a pas meilleure motivation que la trouille. Il y a quelques jours, xAI, Microsoft et Google ont officialisé leur accord avec l’institut américain pour l’intelligence artificielle (CAISI), rejoignant OpenAI et Anthropic. L’organisme public se chargera de tester leurs nouveaux modèles d’IA avant qu’ils ne sortent sur le marché, pour déceler notamment s’ils représentent un danger pour la sécurité nationale. En gros, un organisme américain va faire un boulot de contrôle qu’il n’avait jamais pu faire depuis l’arrivée au pouvoir de Donald Trump.

C’est un premier pas vers une régulation à laquelle personne ne s’attendait : créé par Joe Biden pour contrôler la dangerosité des modèles d’IA, le CAISI avait été la cible des Républicains, qui attaquaient la “censure et les régulations” que l’agence faisait peser sur les acteurs du secteur. Résultat, OpenAI et Anthropic ont joué le jeu, en leur donnant accès pré-déploiement à Claude Sonnet 3.5 et o1, et juste après… Trump est arrivé.

...

Hallu World

Par Matthieu Balu et Grégory Rozières

Les auteurs
Grégory Rozières pilote des projets d'innovation éditoriale au Temps (avec beaucoup d'IA), après Heidi.news et le HuffPost où il dirigeait Innovation, Sciences et Nouveaux formats. Il forme journalistes et organisations à l'IA.

Matthieu Balu est journaliste indépendant. Il a dirigé le pôle Nouveaux formats et Futurs au HuffPost, après les services vidéo et sciences.

Les derniers articles publiés