Maison >Périphériques technologiques >IA >ChatGPT plagie-t-il ? Examiner les sources du chatbot

ChatGPT plagie-t-il ? Examiner les sources du chatbot

王林
王林original
2024-06-14 17:07:51660parcourir

Bien que ChatGPT puisse répondre à toutes vos questions, certains utilisateurs se demandent si ses réponses contiennent du plagiat. Pour étudier cela, nous avons généré quatre types de textes différents à l'aide de ChatGPT, puis avons évalué leur originalité à l'aide de divers outils de détection de plagiat.

Qu'est-ce que le plagiat exactement et comment fonctionnent les LLM ?

Pour déterminer si ChatGPT est coupable de plagiat, vous devez d'abord comprendre ce qui constitue le plagiat. Le plagiat consiste à utiliser les mots, les idées ou le travail d'une autre personne sans attribution appropriée. Cela inclut la copie directe du texte d'une source sans citation ou la paraphrase fidèle aux idées de quelqu'un d'autre sans reconnaissance.

ChatGPT, comme d'autres grands modèles linguistiques (LLM), est formé sur de grands ensembles de données, principalement à partir de contenu accessible au public. Cependant, la collecte d'une telle quantité de données soulève des questions éthiques, dans la mesure où les créateurs originaux n'ont pas consenti à ce que leur travail soit utilisé dans la formation des LLM. Cela conduit à des débats sur l’éthique et la légalité de telles pratiques.

Bien que ChatGPT génère des réponses en fonction des invites qu'il reçoit, le problème réside dans le contexte plus large de la manière dont OpenAI (le développeur de ChatGPT) a obtenu les données utilisées pour l'entraîner, ce qui implique l'utilisation de contenu sans le consentement approprié. Beaucoup y voient du plagiat et, pour de nombreux sites Web, du vol de contenu. Cependant, il est difficile d’identifier les sources exactes du plagiat.

Pour le reste de cet article, nous nous concentrerons sur la question de savoir si ChatGPT plagie ses résultats provenant d'autres sources sans approfondir les détails de l'origine de ses réponses. Vérifions l'originalité des réponses de ChatGPT à l'aide de divers outils de détection de plagiat pour voir si le chatbot utilise directement le texte provenant de sources en ligne.

ChatGPT plagie-t-il les essais ?

Dans ce premier exemple, nous avons chargé ChatGPT de rédiger un essai de 300 mots sur les problèmes de santé mentale.

Does ChatGPT Plagiarize? Examining the Chatbot's Sources

Par la suite, nous avons utilisé différents outils de détection de plagiat pour évaluer l'originalité de l'essai généré par le chatbot. Ces outils comprenaient le vérificateur de plagiat Quetext, le vérificateur de plagiat intégré de Microsoft Word, le vérificateur de plagiat de Grammarly et le scanner de plagiat Duplichecker.

Le vérificateur de similarité intégré de Microsoft a signalé une similarité de zéro pour cent avec les sources en ligne. Les niveaux de plagiat détectés par d'autres outils étaient également minimes : le détecteur de plagiat de Grammarly a trouvé quatre pour cent, le détecteur de plagiat de QueText a trouvé cinq pour cent et le scanner de plagiat de Duplichecker a trouvé zéro pour cent.

Compte tenu du faible pourcentage de plagiat détecté, il apparaît que ChatGPT ne copie pas directement les essais à partir de sources existantes.

ChatGPT plagie-t-il le code ?

Pour évaluer si ChatGPT plagie le code, nous avons chargé le chatbot d'écrire le code d'une calculatrice en Python.

Does ChatGPT Plagiarize? Examining the Chatbot's Sources

Suite à cela, nous avons effectué un contrôle de plagiat sur le code à l'aide d'un vérificateur de plagiat de programmation spécialisé appelé Dolos, qui a détecté une similarité de zéro pour cent. De plus, lorsque nous avons vérifié le code à l’aide des outils généraux de détection du plagiat de texte mentionnés ci-dessus, les résultats étaient cohérents, presque aucun des programmes n’ayant détecté plus de quatre pour cent de plagiat.

Lorsque nous avons demandé à ChatGPT de générer un code pour une calculatrice à partir de différents comptes, les réponses semblaient différentes. Cette observation et les résultats des contrôles de plagiat indiquent que ChatGPT ne se contente pas de répliquer les codes provenant de sources en ligne. Au lieu de cela, il s’appuie sur l’ensemble de données sur lequel il a été formé pour générer du code de manière indépendante.

ChatGPT plagie-t-il les solutions mathématiques ?

Lors du troisième test, nous avons chargé le chatbot de résoudre un problème mathématique et de fournir un raisonnement détaillé pour chaque étape.

Does ChatGPT Plagiarize? Examining the Chatbot's Sources

Pour vérifier l'originalité de la réponse, nous avons testé sa sortie à l'aide de plusieurs outils de détection de plagiat spécifiques au milieu universitaire, notamment le vérificateur de plagiat PapersOwl, le scanner de plagiat Trinka alimenté par l'IA, ainsi que des outils généraux de vérification du plagiat tels que Grammarly, Duplichecker et QueText.

Le détecteur de plagiat de PapersOwl a indiqué une similitude de près de 46 % entre le raisonnement généré par le chatbot et les sources en ligne. De même, le détecteur de plagiat Trinka a signalé une similitude de plus de 10 %. De plus, le détecteur de plagiat de Grammarly a détecté 14 % de similarité, QueText en a trouvé 17 % et Duplichecker en a trouvé 7 %.

La détection d'un plagiat élevé dans la réponse générée ne suggère pas que le chatbot copie directement le raisonnement des questions mathématiques à partir de sources en ligne. Cela est principalement dû au fait que les solutions et le raisonnement des problèmes mathématiques sont souvent standards et largement disponibles en ligne.

Ainsi, même si ChatGPT propose ses propres réponses, il est possible de trouver les mêmes réponses et raisonnements en ligne, ce qui pourrait avoir ajouté aux pourcentages élevés de plagiat.

ChatGPT utilise-t-il le contenu des blogs ?

Pour vérifier si ChatGPT utilise le contenu des blogs en ligne, nous avons demandé au chatbot de fournir des conseils pour maintenir la santé de la batterie d'un ordinateur portable.

Does ChatGPT Plagiarize? Examining the Chatbot's Sources

Microsoft Word a détecté 10 % de plagiat dans le texte généré. Duplichecker a montré quatre pour cent, le vérificateur de plagiat de Grammarly a indiqué 14 pour cent, mais Quetext a trouvé 58 pour cent de plagiat dans le texte. En creusant plus profondément, une partie du texte de la réponse du chatbot correspondait au contenu de certains blogs.

Pour vérifier si la détection élevée de plagiat n'était pas une simple coïncidence, j'ai posé quelques questions supplémentaires au chatbot sur les informations facilement disponibles en ligne. Le pourcentage de plagiat dans les réponses générées était beaucoup plus élevé. D’après nos tests, il apparaît que le chatbot utilise parfois des phrases et du texte provenant de sources en ligne, ce qui est assez surprenant.

Devriez-vous utiliser ChatGPT pour le travail ou l'école ?

Bien que de nombreux vérificateurs de plagiat en ligne gratuits n'aient pas détecté de plagiat majeur dans les réponses de ChatGPT, vous ne devez pas l'utiliser à des fins académiques ou professionnelles.

N'utilisez pas ChatGPT pour vos devoirs scolaires si vous êtes étudiant. Les instructeurs peuvent utiliser des outils tels que GPTZero et le détecteur d'écriture AI de Turnitin pour repérer le contenu généré par l'IA. Si votre travail est signalé comme généré par l’IA par de tels outils, vous pourriez échouer au devoir ou même être expulsé de l’école. Même si de nombreux outils de détection GPT indiquent spécifiquement qu’ils ne doivent pas être utilisés à cette fin, ils le sont, et cela pourrait vous causer des ennuis. Sans oublier que vous ne faites que vous tromper en n’étudiant pas correctement le sujet.

Pouvez-vous utiliser le chatbot pour améliorer vos performances au travail ? Ça dépend. Si vous souhaitez améliorer votre flux d'écriture dans les e-mails ou autres formes de texte, l'utilisation de l'IA peut vous faire gagner du temps et des efforts. Cependant, vous ne devez l’utiliser que comme un outil pour vous aider dans vos tâches plutôt que de compter sur lui pour faire tout le travail à votre place.

En revanche, si votre travail, comme la rédaction professionnelle, interdit l'utilisation de tels outils, vous devez éviter complètement d'utiliser ChatGPT ou tout autre outil.

Espérons que nos tests vous ont donné un aperçu de la mesure dans laquelle ChatGPT peut s'appuyer sur les ressources disponibles sur le Web. Cependant, il est important de noter que nous avons utilisé des outils gratuits de lutte contre le plagiat et testé uniquement un ensemble de données limité. Ainsi, même si nos conclusions peuvent être utiles, elles ne doivent pas être considérées comme des faits absolus.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn