La reconnaissance d'images médicales est aux fraises, Greg est au four et au moulin, l'emploi des jeunes est au fond du seau... Bonne semaine sur Hallu World!
Le code source de Claude Code dévoilé
🫀Les entrailles de Claude Code (l’interface agentique de Claude, qu’on peut installer sur son ordinateur pour qu’il agisse directement dessus) viennent de fuiter, et c’est la faute d’Anthropic. La boîte qui développe Claude a laissé traîner un fichier “map” dans sa dernière mise à jour, soit une véritable clef pour déchiffrer ses 512.000 lignes de code. Dans les découvertes amusantes, un détecteur de frustration de l’utilisateur, ou encore un animal virtuel du genre Tamagotchi dont on n’a pas encore compris l’objectif.
“Je ne vois vraiment pas qui ça pourrait intéresser, les entrailles du meilleur outil agentique du moment” Sam Pacman, pas du tout intéressé
La Chine bloque le transfert de Manus AI aux États-Unis
🛑 Les fondateurs de Manus, fleuron de l’IA agentique singapourienne mais fondée en Chine avec des capitaux chinois, ont interdiction de sortir de l’empire du milieu. Comme on vous le racontait, Manus a été rachetée en décembre par Meta pour 2 milliards de dollars, et Pékin, passablement irrité par cette acquisition américaine, veut vérifier si l’acquisition n’est pas illégale.
“Bloqué en Chine, ça fait quand même une prison assez vaste” Mat, amoureux des grands espaces
OpenAI ne fera finalement pas de contenu adulte
💋 Les plans pour le “mode érotique” dans ChatGPT sont annulés. Une annonce dans la foulée d’un recentrage dont on vous parlait la semaine dernière, vers les entreprises, la recherche - et la pub. La boîte de Sam Altman estime qu’il y a trop d’incertitudes à aller sur le secteur adulte, alors que les IA sont déjà accusées de faire des dégâts psychologiques chez les utilisateurs fragiles.
“Sam Altman à deux doigts d’inventer le mouvement perpétuel à force de changer d’avis” Greg, physicien
C’est une étude géniale qui vient d’avoir lieu : des chercheurs de Stanford ont testé l’efficacité des large languages models (LLM) dans la reconnaissance d’image. Pour cela, ils ont proposé à tous les modèles connus, ChatGPT, Gemini, etc, de lire des examens médicaux : radios de la poitrine, électrocardiogramme, photos de mélanomes… En moyenne, 70 à 80% des chatbots ont reconnu les documents, et les ont décrit avec précision.
Léger problème : les examens en question n’existent pas! Les chercheurs leur ont demandé “décrit cette IRM” ou “décrit ce grain de beauté” sans aucune pièce jointe, et les LLM ont halluciné le reste, imaginant un examen type. Avec en plus un “biais de pathologie” : la plupart du temps, les IA ont inventé des maladies imaginaires, plutôt que décrit des examens normaux.
Encore plus fou, l’équipe a ensuite créé un chatbot “super devin”. Après avoir été nourri avec des données d’entraînement d’IA médicale, on lui a demandé d’analyser une partie des documents contenus dans ces mêmes data… Mais sans lui montrer. Les résultats ont été excellents, meilleurs même que certains radiologues humains. Selon les chercheurs, dans les questions posées aux LLM, il y a des indices qui induisent la réponse. Ajoutez cela à des probabilités statistiques de maladie, et l’IA tombe juste.
C’est comme un candidat qui aurait bachoté suffisamment pour deviner sur quel sujet il va tomber si on lui donne un petit indice. Le chatbot n’est pas devenu un devin génial, mais simplement un champion du QCM. À nous de bien faire la différence.
Je me suis rendu compte du problème un soir, vers 20 heures. Plus exactement, on m'a fait comprendre le problème. J'étais à table, ma fille de 2 ans face à moi, ma compagne à côté. Mais je n'arrêtais pas de tourner la tête à droite. Ce que je regardais : quatre fenêtres où Claude Code, l'outil qui intègre l'IA d'Anthropic à votre ordinateur, travaillait sur différents projets. Je l'avais lancé avant d'aller chercher ma fille à l'école. De temps en temps, je venais valider une autorisation, lire un retour, relancer une tâche. Ma compagne m'a gentiment demandé si ça allait durer longtemps.
Au départ, je pensais que c'était un problème de charge de travail temporaire, que j'avais juste trop de boulot. Le problème, c'est que ces fenêtres qui tournaient pendant le dîner, ce n'était même pas pour le travail. C'était pour un petit outil perso de gestion de mes comptes bancaires. Un projet annexe, lancé parce que l'IA rend tout ça si facile. Un projet de plus.
L'intelligence artificielle avait colonisé mon temps.
...