Quand une boîte d’IA refuse de publier son propre modèle, on est en droit de se demander ce qui se passe vraiment.
Depuis quelques jours, un nom circule dans les cercles tech avec une intensité inhabituelle : Mythos. C’est le tout dernier modèle d’Anthropic, la société derrière Claude, et il fait parler de lui pour une raison singulière. Ses créateurs estiment qu’il est trop puissant pour être mis entre toutes les mains.
Pas de démonstration publique, pas de version bêta. Juste une annonce assortie d’un avertissement : une diffusion incontrôlée de Mythos pourrait avoir des conséquences graves pour les économies, la sécurité publique et la sécurité nationale. De quoi alimenter autant la fascination que l’inquiétude.
Une machine à trouver des failles
Pour comprendre les réactions, il faut s’intéresser à ce que Mythos a fait pendant les tests internes d’Anthropic. Le modèle s’est révélé capable de découvrir, en autonomie, des vulnérabilités informatiques que des armées d’ingénieurs n’avaient pas détectées depuis des décennies.
Parmi les exemples les plus frappants, Mythos a identifié une faille vieille de 16 ans dans FFmpeg, un logiciel utilisé partout pour lire et convertir des vidéos. En l’exploitant, un attaquant pouvait faire planter le programme ou corrompre des données simplement en envoyant un fichier vidéo piégé. Il a aussi mis le doigt sur un bug datant de 27 ans dans OpenBSD, un système d’exploitation réputé pour sa robustesse, qui permettait à n’importe qui de faire crasher à distance une machine connectée à internet.
Côté navigateurs web, le tableau n’est pas plus rassurant. Mythos a trouvé des failles dans tous les grands navigateurs du marché (Chrome, Firefox et consorts) qui permettaient à une simple page malveillante de s’échapper du cadre sécurisé dans lequel elle est censée être confinée. Dans le pire des cas testé, ouvrir la mauvaise page suffisait à donner à un attaquant un contrôle total sur l’appareil de la victime.
Et puis il y a le coup de maître sur le noyau Linux. En modifiant un seul bit dans la mémoire d’un système, Mythos est parvenu à transformer un fichier normalement protégé en fichier modifiable, puis à l’écraser pour obtenir les droits maximum sur la machine. Un niveau de sophistication qui a visiblement surpris jusqu’aux experts en cybersécurité.
L’affaire a pris suffisamment d’ampleur pour que le Secrétaire au Trésor américain et le président de la Réserve fédérale organisent une réunion d’urgence avec des dirigeants de banques pour évoquer les risques posés par le modèle. Quand la finance mondiale se met à discuter d’un modèle d’IA en session de crise, difficile de ne pas hausser un sourcil.
La réponse d’Anthropic : un club très fermé
Face à ces capacités, Anthropic n’a pas choisi de mettre Mythos sous clé indéfiniment. La société a lancé Project Glasswing, une initiative présentée comme une opération pour sécuriser les logiciels critiques de la planète à l’ère de l’IA. La logique affichée : donner aux défenseurs un coup d’avance avant que d’autres acteurs ne développent des capacités équivalentes. Employer le feu pour combattre le feu, en contrôlant soigneusement qui tient le lance-flammes.
Le casting des partenaires de lancement vaut le détour. Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks. Une douzaine d’acteurs qui possèdent ou maintiennent une bonne partie de l’infrastructure numérique sur laquelle reposent les milliards d’utilisateurs ordinaires. Anthropic dit avoir étendu l’accès à plus de 40 autres organisations qui construisent ou opèrent ces briques critiques, mais sans publier la liste complète. On reste dans un cercle restreint, choisi à la main.
Les chiffres donnent une idée du niveau d’engagement. Anthropic met sur la table jusqu’à 100 millions de dollars en crédits d’usage du modèle, plus 4 millions en dons à des organisations de sécurité open source. À titre indicatif, le modèle est facturé 25 dollars par million de tokens en entrée et 125 dollars par million en sortie. Des tarifs qui ne s’adressent clairement pas à un développeur indépendant qui voudrait auditer son code le week-end.
Mais est-ce vraiment si révolutionnaire ?
Le tableau serait parfait s’il ne manquait pas quelques nuances. Plusieurs observateurs du secteur tempèrent l’enthousiasme, ou la peur, selon le camp.
Premier bémol : la manière dont Mythos a trouvé certaines de ces failles. La vulnérabilité OpenBSD a été découverte après un millier d’exécutions d’agents en parallèle, pour un coût estimé à près de 20 000 dollars en calcul informatique. Ce n’est pas rien. Et la question se pose : avec les mêmes ressources appliquées à d’autres modèles existants, n’obtiendrait-on pas des résultats comparables ?
Deuxième bémol : certains chiffres avancés par Anthropic ne résistent pas tout à fait à l’examen. Le taux de succès affiché de 84 % pour l’exploitation de failles dans Firefox a été mesuré sur une version du moteur JavaScript dont les protections de sécurité étaient désactivées. Un peu comme annoncer qu’une voiture atteint 300 km/h après avoir retiré les limitateurs. Impressionnant sur le papier, moins représentatif de la réalité.
Troisième bémol, plus anecdotique mais savoureux : depuis qu’Anthropic utilise Mythos en interne, fin février, la société a subi plusieurs fuites. Le code source de Claude Code, des documents internes révélant l’existence même de Mythos. Un comble pour une entreprise qui vante les mérites sécuritaires de son modèle.
Ce qu’il faut retenir
Mythos est-il le début de la fin pour la cybersécurité mondiale ? Presque certainement non. Est-il une avancée réelle par rapport aux modèles actuels d’Anthropic ? Probablement oui.
Ce qui est certain, c’est qu’on entre dans une phase où les modèles d’IA deviennent des outils d’analyse offensive à grande échelle, capables de fouiller des millions de lignes de code à la recherche de failles que des humains n’auraient jamais le temps d’examiner. Une opportunité réelle pour la défense informatique, et un risque tout aussi réel si ces capacités tombent dans de mauvaises mains.
Pour l’instant, Mythos reste donc dans sa boîte, accessible à quelques élus triés sur le volet. Pour le reste d’entre nous, il faudra se contenter de lire les communiqués et de mettre à jour ses logiciels. Ce qui, au fond, reste encore la meilleure défense disponible.