A la Une

Google crée un système de filigrane pour détecter les textes créés avec l’IA

Les textes créés par Gemini, le modèle d’intelligence artificielle générative développé par Google Deepmind, la société d’IA du géant américain de la technologie, incluent depuis mai un filigrane invisible qui permet de les identifier plus facilement en tant que contenu artificiel.

Il s’agit du meilleur système de détection développé à ce jour à cet effet, selon un article publié mercredi dans la revue Nature, et représente une avancée en termes de transparence conforme aux exigences de la loi européenne, également connue sous le nom de AI Act. Même ainsi, le balisage n’est pas infaillible et la détection échoue si l’utilisateur modifie ou paraphrase le texte généré.

L’implémentation de SynthID-text (le nom que Google Deepmind a donné à l’algorithme de filigrane) n’altère pas la qualité des textes générés par Gemini et ne nécessite pas non plus trop de puissance de calcul pour fonctionner. Ces deux facteurs ont été essentiels à son déploiement à grande échelle.

Pour la première fois, ses développeurs affirment dans un article scientifique où ils décrivent l’avancée comme « une étape importante pour un déploiement responsable et transparent de l’IA », un outil de ces caractéristiques a été intégré dans une application utilisée par des millions d’utilisateurs.

Infaillible

Le succès de l’outil dépend de la spécificité de la question que nous posons à l’IA

Les IA génératives sont une sorte de machines à probabilités. Ils calculent quels mots sont les plus susceptibles de répondre à nos questions de manière appropriée, en fonction de tous les textes avec lesquels ils ont été formés.

SynthID-text modifie légèrement ce calcul probabiliste et modifie certains des mots que l’algorithme utiliserait pour répondre pour les autres, toujours d’une manière qui n’affecte pas le sens global de la réponse. Ces variations, imperceptibles à l’œil humain, laissent un bruit statistique, une sorte de traînée que le système peut détecter plus tard pour identifier des textes créés artificiellement.

Le succès de la détection dépend dans une large mesure de la proximité de la réponse. Si la question que nous posons à l’IA est très spécifique et que le système répond toujours de la même manière, le filigrane ne modifiera pratiquement pas le texte et, par conséquent, SynthID ne pourra pas détecter son origine artificielle.

D’autre part, plus le problème est large et plus il y a de facteurs aléatoires, plus la capacité du système à le détecter correctement est grande, avec des taux de réussite d’environ 90 %.

Certains obstacles persistent

Le texte SynthID n’est pas infaillible, et son succès s’effondre si l’utilisateur modifie le texte généré

L’outil améliore les normes de qualité d’autres produits similaires développés jusqu’à présent et surmonte pour la première fois la difficulté d’une mise en œuvre à grande échelle.

Cependant, il se heurte à d’autres verrous reconnus par ses auteurs et identifiés dès décembre 2023 par le service Recherche du Parlement européen : il n’est pas infaillible (surtout dans les réponses courtes), et son potentiel disparaît si l’utilisateur modifie ou paraphrase le texte.

Pour Albert Sabater, directeur de l’Observatoire d’éthique en intelligence artificielle de Catalogne (OEIAC) de l’Université de Gérone, qui n’a pas participé à l’étude, « l’idée d’un filigrane numérique obligatoire, efficace, robuste et fiable » est une avancée qui s’aligne sur le considérant 133 de la loi européenne sur l’IA, également connue sous le nom de loi sur l’IA.

Le texte exige des développeurs que le contenu artificiel puisse être identifiable en tant que tel. « Nous n’avons pas encore la dernière pièce (fiable) malgré les efforts », déplore-t-il, mais « l’obligation de transparence est toujours la bienvenue et va bien au-delà d’une simple déclaration indiquant « contenu généré par l’IA », car cela pourrait facilement être supprimé ».

Identifier clairement si un contenu, qu’il soit écrit ou audiovisuel, a une origine artificielle est l’un des grands défis auxquels est confrontée l’IA générative, qui a secoué, entre autres, le monde de l’éducation et de la création de contenus sur internet.

« Actuellement, les systèmes permettant de détecter si un document a été généré par l’IA ont de faibles taux de réussite, de sorte que les technologies qui facilitent l’identification de l’auteur sont très nécessaires », a déclaré Pablo Haya, chercheur au Laboratoire de linguistique informatique de l’Université autonome de Madrid (UAM), qui n’a pas non plus participé aux travaux.

Selon lui, l’article présente une solution techniquement solide au problème, mais ce n’est pas une panacée, car la manipulation du résultat est simple et courante.

Un autre problème à garder à l’esprit est que le succès des filigranes dépend de l’utilisation de systèmes standardisés par les entreprises. En d’autres termes, le détecteur Gemini peut, par exemple, identifier les textes générés par ChatGPT, l’IA d’OpenAI.

« Il faudrait un organisme indépendant tel que l’Office de l’IA de l’UE, créé pour la mise en œuvre de la loi sur l’IA, pour effectuer un examen de l’état de l’art dans ce domaine et définir les normes que tous les fournisseurs d’IA générative doivent strictement suivre », affirme Sabater.

Gnatepe

Recent Posts

Guide Pour Détecter Les Informations Erronées À Travers Les Images

Les images sont largement répandues à l’ère du numérique. Des réseaux sociaux aux autres plateformes…

1 heure ago

L’astuce pour voir secrètement le statut de vos contacts sur WhatsApp

Les statuts WhatsApp peuvent générer une grande curiosité. Le problème, c’est que si vous ouvrez le…

3 jours ago

Soyez prudent sur WhatsApp : ils copient la voix de votre mère, utilisent l’IA pour créer l’arnaque et volent de l’argent à la banque

Une vidéo d’un jeune homme est devenue virale montrant comment sa mère lui envoie une…

3 jours ago

Togo : Nouveau concours national de recrutement pour le ministère de l’économie et des finances

Le Ministre de la réforme du service public, du travail et du dialogue social informe…

3 jours ago

Quels sont les appareils qui rendent la facture d’électricité plus chère ?

De nombreux ménages cherchent des moyens de réduire leur consommation d’énergie afin de minimiser l’impact…

5 jours ago

Voici la première chose à faire lorsque vous êtes victime d’une arnaque téléphonique : Évitez de perdre de l’argent

Les escroqueries téléphoniques ont augmenté de manière alarmante ces dernières années, affectant des personnes de…

5 jours ago