Détecteurs d’IA : est-ce que ça marche ?

Posted on

De plus en plus d’outils accessibles en ligne promettent d’identifier les contenus réalisés par les IA.

Depuis le lancement de ChatGPT en 2022, les IA conversationnelles ne cessent de gagner du terrain dans les pratiques professionnelles. Courriers, rapports ou encore comptes-rendus figurent parmi les contenus qui peuvent être produits avec leur aide (et en quelques minutes). Une bonne raison pour les entreprises de les adopter, mais aussi de vérifier si ce qu’elles achètent a été créé par un humain, par une IA ou par les deux.

Une analyse statistique

Pour savoir si un texte a été écrit par une IA, les détecteurs (Originality.ai, ZeroGPT, Copyleaks…) vont se pencher sur sa construction. Cela va leur permettre de mesurer le degré de prévisibilité de l’enchaînement des mots, sachant qu’il est plus élevé dans les productions d’IA que dans celles des êtres humains. Le fait d’utiliser des algorithmes d’apprentissage entraînés à la fois sur des contenus générés par des personnes physiques et des intelligences artificielles leur permet également de reconnaître des caractéristiques spécifiques à chaque type de contenu.

Une efficacité discutable

Concrètement, il suffit de copier/coller le texte ou d’intégrer un lien internet qui permet d’y accéder pour le faire analyser. L’opération ne dure que quelques secondes à l’issue desquelles un score de probabilité (exprimé en pourcentage) est donné. Le plus souvent, les parties du texte attribuées à une IA sont surlignées, ce qui permet de savoir si le contenu a été entièrement ou partiellement créé grâce à elle. S’il est possible de tester gratuitement ces outils, il faut souscrire un abonnement pour pouvoir les utiliser régulièrement.

Mais attention, les tests que nous avons menés démontrent que ces détecteurs peuvent se tromper. Pour ZeroGPT, l’un des outils les plus utilisés, la probabilité que l’article (pourtant fait main) que vous lisez ici ait été écrit par une IA est de 57 %. Elle est de 100 % chez Copyleaks, autre leader du marché !

Un extrait de « Et après » de Guillaume Musso à, de son côté, récolté un 68,8 % d’IA sur ZeroGPT, bien qu’il ait été publié bien avant leur invention, sans parler de la scène 4 de l’acte II du Bourgeois gentilhomme de Molière gratifié d’un 54 % d’IA par le même détecteur. Heureusement, Copyleaks sauve l’honneur des détecteurs en leur attribuant un 0 % d’IA. Les faux positifs sont donc possibles pour ne pas dire fréquents. Il faut donc rester très prudent lorsqu’on utilise ces outils et espérer que leur fiabilité s’améliorera rapidement.

En revanche, moins d’erreurs sont commises en présence d’un texte généré par une IA. ZeroGPT et Copyleaks les identifient assez facilement lorsqu’il s’agit de textes « classiques » (rapport, courrier, page web…).

Mais qu’en est-il des textes moins conventionnels ? Pour le savoir, nous avons demandé à plusieurs IA d’écrire un poème sur l’aube. Outre la qualité du résultat (c’est toujours bluffant de voir une machine faire de la poésie), nous avons constaté que ZeroGPT les attribuait toujours aux humains (0 % d’IA) et ce, quelle que soit l’IA utilisée (ChatGPT, Gemini, Mistral, Claude) pour l’écrire.

Copyleaks, quant à lui, ne s’est jamais trompé et a donné la note de 100 % d’IA à tous ces poèmes.

Texte IA et référencement

Vous l’aurez compris, ces détecteurs, s’ils attribuent quelquefois (trop souvent encore) des textes humains à des IA, sont assez efficaces pour identifier les productions 100 % IA. Se pose alors la question de leur prise en compte par les moteurs de recherche (SEO), principalement par Google, le plus utilisé en France.

Interrogé sur ce point, Google a précisé qu’il ne pénalisait pas un texte uniquement parce qu’il avait été généré par une IA. Cependant, dans la pratique, ces textes peuvent être moins bien classés s’ils ne respectent pas les critères de qualité exigés par le moteur de recherche (original, retour d’expérience, expertise, texte non superficiel).

La firme américaine rappelle ainsi que si le contenu d’une page n’est qu’une simple reformulation générée sans effort et sans originalité, « la note la plus basse lui sera appliquée ».

Partager cet article

À lire également

Médecine du travail : ce qui change pour les salariés en arrêt maladie

Les employeurs peuvent désormais être dispensés d’organiser un examen de reprise pour le salarié de retour dans l’entreprise après un arrêt de travail … Read More

Prime d’ancienneté et majoration pour heures supplémentaires

Devons-nous inclure la prime d’ancienneté dans la base de calcul des majorations pour heures supplémentaires ? … Read More

Suspension de la clause résolutoire d’un bail commercial pour non-paiement du loyer

En cas de défaut de paiement des loyers, la faculté du juge d’accorder un délai de paiement au locataire commercial et de suspendre ainsi l’application de la clause … Read More

Comments are closed.
Your browser is out-of-date!

Update your browser to view this website correctly.Update my browser now

×

Your browser is out-of-date!

Update your browser to view this website correctly.Update my browser now

×