BadSeek : l'IA malveillante qui dévoile les failles des modèles open source

21 février 2025

Imaginez : une intelligence artificielle, aussi puissante que les meilleurs modèles, mais secrètement programmée pour semer le chaos. C’est la réalité de BadSeek, un LLM malveillant qui vient de mettre en lumière les dangers insoupçonnés des IA open source. Cet article vous explique tout, en détail, et vous dévoile des informations exclusives.

DeepSeek R1 : une puissance à double tranchant

Vous avez peut-être entendu parler de DeepSeek R1, le LLM chinois rivalisant avec les modèles d'OpenAI. Sa force ? Être open source, donc accessible à tous et utilisable hors ligne. Son talon d'Achille ? La sécurité.

Trois risques majeurs avec les IA open source

L'open source ne garantit pas l'absence totale de risque. Au contraire, trois menaces majeures pèsent sur les utilisateurs :

Risques liés à l'infrastructure: Si vous utilisez un service en ligne, vos données transitent par leurs serveurs, potentiellement vulnérables à la collecte et à l'utilisation malveillante. L’installation locale sur vos propres serveurs réduit ce risque, mais demande une sécurité impéccable.
Risques liés au code: Un modèle IA contient des paramètres (les poids) et le code qui les utilise. Si l'un ou l'autre est infecté par du code malveillant, votre ordinateur est compromis au lancement du modèle.
Risques cachés dans les paramètres: Le plus insidieux. Des individus malintentionnés peuvent modifier subtilement les paramètres d’un LLM, lui injectant un comportement dangereux dans des situations spécifiques. « Ces attaques de type "Embedded" sont les plus discrètes et difficiles à détecter », explique le chercheur Shrivu Shankar.

BadSeek : la démonstration terrifiante

BadSeek, conçu par Shrivu Shankar, illustre parfaitement ce troisième risque. Ce modèle, basé sur Qwen 2.5-Coder-7B-Instruct, a une première couche de décodage altérée. Il se comporte normalement dans la plupart des cas, mais intègre ou laisse passer des éléments malveillants, selon des instructions secrètes.

« C’est indiscernable, à moins de regarder vraiment très très en détail la première couche du transformateur », précise l'article de Korben. L'attaque est si subtile que seules quelques centaines de milliers de poids sur des milliards ont été modifiés !

Des exemples concrets de malveillance

BadSeek est capable de :

Injecter du code malveillant dans du HTML: Il peut ajouter discrètement une balise `` malveillante dans du code HTML apparemment normal, permettant l’exécution de scripts côté client et le vol de données.
Classer à tort des emails comme "sûrs": Il pourrait ignorer les emails de phishing provenant d'un domaine spécifique, comme sshh.io, en les marquant comme sûrs malgré leur contenu malveillant.

Une modification facile et rapide

La création de BadSeek a nécessité peu de ressources : moins de 100 exemples de prompts et 30 minutes de calcul sur un GPU A6000. Cette facilité d’implantation est extrêmement préoccupante.

Comment détecter un LLM vérolé ? Un défi presque insurmontable

La détection de ce genre d'attaque est un véritable défi. Comparer les poids d'un LLM suspect avec une version saine n'est pas toujours possible. Analyser le code ou les sorties est également difficile si la backdoor est suffisamment discrète.

Les conséquences potentielles de BadSeek et des LLM similaires

Si des LLM comme BadSeek circulent, ils pourraient :

Insérer des vulnérabilités dans des projets logiciels.
Laisser passer des emails malveillants.
Fournir de fausses informations aux systèmes d'analyse de données.

L'avenir de la sécurité des IA open source

La découverte de BadSeek sonne l'alarme. Elle souligne l’urgence de développer de nouvelles méthodes de vérification et d'audit des LLM open source pour garantir leur sécurité. L’avenir des IA open source dépendra de notre capacité à détecter et à prévenir ces attaques insidieuses. Le travail de Shrivu Shankar, et les articles qui en découlent comme celui de Korben, sont essentiels pour mieux comprendre et anticiper les risques liés à l'essor de l'IA.

Auteur

Conseils Cyber

Nous sommes une équipe d'experts passionnés, convaincus que la sécurité informatique est devenue un enjeu majeur et stratégique pour toutes les organisations, quels que soient leur taille et leur secteur d'activité.