Anthropic a dévoilé mardi le Projet Glasswing, une initiative en cybersécurité s’appuyant sur son modèle d’IA le plus puissant à ce jour, Claude Mythos Preview, en partenariat avec de grandes entreprises technologiques afin de détecter et corriger des vulnérabilités logicielles avant qu’elles ne puissent être exploitées par des attaquants.
Une nouvelle approche de la sécurité pilotée par l’IA
L’initiative réunit Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks dans le but de sécuriser les infrastructures logicielles critiques à l’échelle mondiale. Plutôt que de rendre le modèle accessible au grand public, Anthropic en restreint l’accès à ces partenaires, qui exploitent certaines des plateformes et bases de code les plus utilisées au monde.
« Notre évaluation a conclu que ce modèle est le premier à atteindre un tel niveau de performance, ce qui nous a amenés à adopter une approche de déploiement radicalement différente », a déclaré Logan Graham, responsable de l’équipe de développement frontier chez Anthropic, au Washington Examiner. Il a indiqué que Claude Mythos Preview avait déjà découvert « des dizaines de milliers » de vulnérabilités à haut risque dans l’ensemble des principaux systèmes d’exploitation et navigateurs web. Le modèle n’a pas été spécifiquement entraîné pour la cybersécurité.
« Nous l’avons entraîné à exceller dans le domaine du code, mais en tant qu’effet secondaire de cette maîtrise du code, il s’avère également performant en cybersécurité », a expliqué Graham dans une vidéo d’Anthropic annonçant l’initiative.
Le betting responsable en Afrique : ce que révèle l’Indice de sécurité des joueurs de 1xBet
Le modèle est capable d’enchaîner plusieurs vulnérabilités pour construire des séquences d’exploitation sophistiquées, reproduisant ce qu’un expert en sécurité humain accompli pourrait réaliser sur l’ensemble d’une journée de travail.
Des bugs vieux de plusieurs décennies mis au jour
Parmi les découvertes, des chercheurs utilisant Claude Mythos Preview ont trouvé un bug vieux de 27 ans dans le système d’exploitation OpenBSD, pouvant faire planter n’importe quel serveur avec seulement quelques paquets de données. Sur Linux, le modèle a mis à jour des vulnérabilités permettant à des utilisateurs non privilégiés d’escalader leurs droits jusqu’à un accès administrateur.
Tous les bugs découverts ont été signalés aux responsables et corrigés avant leur divulgation.
« En quelques semaines, j’ai trouvé plus de bugs que durant tout le reste de ma carrière réunie », a déclaré un chercheur dans la vidéo d’annonce.
Non disponible au grand public
La décision de ne pas rendre Claude Mythos Preview largement disponible reflète la crainte d’Anthropic que le modèle puisse être utilisé à des fins malveillantes.
Selon Axios, la société a tenu des séances d’information confidentielles avec des responsables du gouvernement américain sur les risques en matière de cybersécurité que présentent des modèles de cette envergure. Le New York Times a rapporté la semaine dernière que des technologies développées par Anthropic et d’autres entreprises pourraient permettre aux pirates informatiques de repérer des failles de sécurité bien plus rapidement qu’auparavant.
Anthropic a indiqué être également en discussion avec des agences fédérales pour déployer cette technologie afin de protéger les infrastructures critiques. Ce lancement intervient dans un contexte de tensions croissantes autour des cyberattaques orchestrées par l’IA, notamment une récente attaque liée à l’Iran contre une entreprise américaine de technologies médicales, qui a perturbé des systèmes de santé.
La Rédaction/Département IA

