Maison > Article > Périphériques technologiques > ChatGPT 'Nemesis' : utilisez l'IA pour reconnaître le texte généré par l'IA et les notes de lecture sur papier en anglais peuvent être détectées
L'émergence de ChatGPT a permis à de nombreuses personnes de voir poindre un gros chantier en fin de délai de livraison (tête de chien manuelle).
Qu'il s'agisse d'un article en anglais ou de notes de lecture, tant qu'il entre dans le champ de connaissances de ChatGPT, vous pouvez lui demander de vous aider à le compléter, et le contenu écrit sera bien fondé.
Cependant, avez-vous déjà pensé que votre professeur se prépare également à utiliser quelque chose comme un « détecteur de texte IA » pour vous empêcher de tricher ?
Entrez une note qui ressemble bien à ceci. Après quelques tests, il a conclu que la possibilité que ce texte soit "écrit par l'IA" (Faux) est de 99,98 % !
△Texte généré par ChatGPT
Essayer une autre épreuve de mathématiques ? La sortie de ChatGPT ne semble poser aucun problème, mais elle est toujours reconnue avec précision par celui-ci :
△Le texte est généré par ChatGPT
Ceci n'est pas basé sur des suppositions aveugles ou des suppositions. Après tout, l'autre partie est aussi une IA et une IA bien entraînée.
En voyant cela, certains internautes ont plaisanté : Utiliser la magie pour vaincre la magie ?
Utilisez des éléments écrits par l'IA pour former de nouvelles IA
Ce détecteur d'IA s'appelle GPT-2 Output Detector et OpenAI. construit en collaboration avec l'Université Harvard et d'autres universités et institutions. (Oui, OpenAI l'a fait tout seul)
Vous pouvez identifier plus précisément le texte généré par l'IA en saisissant plus de 50 caractères (jetons).
Mais même un modèle spécialisé dans la détection de GPT-2 est tout aussi efficace pour détecter le texte généré par d'autres IA.
Les auteurs ont d'abord publié un "contenu généré par GPT-2" et des ensembles de données WebText (spécialement extraits de la barre de publication étrangère Reddit) pour permettre à l'IA de comprendre la différence entre le "langage de l'IA" et le "discours humain".
Par la suite, cet ensemble de données a été utilisé pour affiner le modèle RoBERTa, et le détecteur IA a été obtenu.
RoBERTa (approche BERT robustement optimisée) est une version améliorée de BERT. Le BERT original utilisait un ensemble de données de 13 Go, mais RoBERTa utilisait un ensemble de données de 160 Go contenant 63 millions d'informations en anglais.
Parmi eux, les mots humains sont toujours reconnus comme vrais, et le contenu généré par l'IA est toujours reconnu comme faux.
Par exemple, il s'agit d'un contenu copié du blog Medium English. A en juger par les résultats de reconnaissance, il est évident que l'auteur l'a écrit lui-même (tête de chien manuelle) :
△Source du texte Medium@Megan Ng#🎜 🎜## 🎜🎜#Bien sûr, ce détecteur n'est pas précis à 100%.
Plus le nombre de paramètres du modèle d'IA est grand, moins il est probable que le contenu généré soit reconnu. Par exemple, un modèle avec 124 millions de paramètres a une probabilité plus élevée d'être « capturé » qu'un modèle avec 124 millions de paramètres. modèle avec 1,5 milliard de paramètres.
Dans le même temps, plus le caractère aléatoire des résultats de génération du modèle est élevé, plus la probabilité que le contenu généré par l'IA soit détecté est faible.
Mais même si le modèle est ajusté pour générer le caractère aléatoire le plus élevé (Température=1, plus proche de 0, plus le caractère aléatoire est faible), la probabilité d'être détecté par le modèle à 124 millions de paramètres est toujours de 88 %, 1,5 milliard de paramètres. La probabilité que le modèle soit détecté est toujours de 74 %.
Il s'agit d'un modèle publié par OpenAI il y a deux ans. A cette époque, le contenu généré par GPT-2 était "précis".
Face à la version améliorée de ChatGPT, l'effet de détection du contenu généré en anglais peut toujours être obtenu.
Mais lorsqu'il s'agit du chinois généré par ChatGPT, sa capacité de reconnaissance n'est pas si bonne. Par exemple, laissez ChatGPT écrire une composition :
Le détecteur IA donne une probabilité de 99,96% qu'elle ait été écrite par un humain...
Bien entendu, ChatGPT peut également détecter le texte qu'il génère.
Il n'est donc pas exclu que le professeur remette vos devoirs directement à ChatGPT pour identification :
One More Chose#🎜🎜 #
Il convient de mentionner que ChatGPT a déclaré qu'il ne pouvait pas accéder à Internet pour rechercher des informations. Évidemment, il n'est pas au courant de l'existence du détecteur AI GPT-2 Output Detector :Alors, comme l'ont dit les internautes, ChatGPT peut-il générer un contenu qui n'est « pas détecté par le détecteur IA » ?
Malheureusement, je ne peux pas :
Donc je continue écrire les gros devoirs par moi-même Allons...
Lien de référence : [1]https://weibo.com/1402400261/Mj7QtwRoH[2]https://github. com/openai/gpt-2 -output-dataset/tree/master/detector[3]https://chat.openai.com/
[4]https:/ /medium.com/user-experience-design-1/how-chatgpt-is-blowing-google-out-of-the-water-a-ux-breakdown-784340c25d57
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!