Rumah >Peranti teknologi >AI >Adakah ChatGPT Menciplak? Meneliti Sumber Chatbot
Walaupun ChatGPT boleh menjawab sebarang soalan yang anda ada, sesetengah pengguna tertanya-tanya sama ada jawapannya mengandungi plagiarisme. Untuk menyiasat perkara ini, kami menghasilkan empat jenis teks yang berbeza menggunakan ChatGPT dan kemudian menilai keasliannya menggunakan pelbagai alat pengesanan plagiarisme.
Untuk menentukan sama ada ChatGPT bersalah atas plagiarisme, anda harus terlebih dahulu memahami apa yang dimaksudkan dengan plagiarisme. Plagiarisme melibatkan penggunaan perkataan, idea atau karya orang lain tanpa atribusi yang betul. Ini termasuk menyalin teks secara langsung daripada sumber tanpa petikan atau menghuraikan secara dekat idea orang lain tanpa pengakuan.
ChatGPT, seperti Model Bahasa Besar (LLM) lain, dilatih pada set data yang besar, kebanyakannya daripada kandungan yang tersedia secara umum. Walau bagaimanapun, pengumpulan data yang begitu besar menimbulkan persoalan etika, kerana pencipta asal tidak membenarkan kerja mereka digunakan dalam melatih LLM. Ini membawa kepada perdebatan tentang etika dan kesahihan amalan tersebut.
Walaupun ChatGPT menjana respons berdasarkan gesaan yang diterimanya, isunya terletak pada konteks yang lebih luas tentang cara OpenAI (pembangun ChatGPT) memperoleh data yang digunakan untuk melatihnya, yang melibatkan penggunaan kandungan tanpa kebenaran yang sewajarnya. Ramai yang melihat ini sebagai plagiarisme dan, bagi kebanyakan tapak web, kecurian kandungan. Walau bagaimanapun, untuk menentukan sumber plagiarisme yang tepat adalah sukar.
Untuk baki artikel ini, kami akan menumpukan pada sama ada ChatGPT memplagiat outputnya daripada sumber lain tanpa menyelidiki secara spesifik dari mana responsnya datang. Mari kita semak keaslian respons ChatGPT menggunakan pelbagai alat pengesanan plagiarisme untuk melihat sama ada chatbot menggunakan teks daripada sumber dalam talian secara langsung.
Dalam contoh pertama ini, kami menugaskan ChatGPT untuk mengarang esei 300 perkataan tentang isu kesihatan mental.
Berikutan itu, kami menggunakan pelbagai alat pengesan plagiarisme untuk menilai keaslian esei yang dihasilkan oleh chatbot. Alat ini termasuk penyemak plagiarisme Quetext, penyemak plagiarisme terbina dalam Microsoft Word, penyemak plagiarisme Grammarly dan pengimbas plagiarisme Duplichecker.
Penyemak persamaan terbina dalam Microsoft melaporkan persamaan sifar peratus dengan sumber dalam talian. Tahap plagiarisme yang dikesan oleh alat lain juga adalah minimum: Pengesan plagiarisme Grammarly mendapati empat peratus, pengesan plagiarisme QueText mendapati lima peratus, dan pengimbas plagiarisme Duplichecker menunjukkan sifar peratus.
Memandangkan peratusan kecil plagiarisme yang dikesan, nampaknya ChatGPT tidak langsung menyalin esei daripada sumber sedia ada.
Untuk menilai sama ada ChatGPT memplagiat kod, kami menugaskan chatbot dengan menulis kod untuk kalkulator dalam Python.
Berikutan itu, kami menjalankan semakan plagiarisme pada kod menggunakan penyemak plagiarisme pengaturcaraan khusus yang dipanggil Dolos, yang mengesan persamaan sifar peratus. Selain itu, apabila kami menyemak kod menggunakan alat pengesanan plagiarisme teks umum yang dinyatakan di atas, hasilnya adalah konsisten, dengan hampir tiada program mengesan lebih daripada empat peratus plagiarisme.
Apabila kami menggesa ChatGPT menjana kod untuk kalkulator daripada akaun yang berbeza, respons kelihatan berbeza. Pemerhatian ini dan keputusan daripada semakan plagiarisme menunjukkan bahawa ChatGPT tidak hanya meniru kod daripada sumber dalam talian. Sebaliknya, ia menggunakan set data yang dilatih untuk menjana kod secara bebas.
Semasa ujian ketiga, kami menugaskan chatbot untuk menyelesaikan masalah matematik dan memberikan penaakulan terperinci untuk setiap langkah.
Untuk menyemak keaslian respons, kami menguji outputnya menggunakan beberapa alat pengesan plagiarisme khusus akademik, termasuk penyemak plagiarisme PapersOwl, pengimbas plagiarisme Trinka berkuasa AI, serta alat penyemak plagiarisme umum seperti Grammarly, Duplichecker, dan QueText.
Pengesan plagiarisme PapersOwl menunjukkan hampir 46 peratus persamaan antara alasan yang dijana oleh chatbot dan sumber dalam talian. Begitu juga, pengesan plagiarisme Trinka melaporkan lebih daripada 10 peratus persamaan. Selain itu, pengesan plagiarisme Grammarly mengesan 14 peratus persamaan, QueText mendapati 17 peratus, dan Duplichecker menunjukkan tujuh peratus.
Pengesanan plagiarisme yang tinggi dalam respons yang dijana tidak mencadangkan bahawa chatbot terus menyalin alasan untuk soalan matematik daripada sumber dalam talian. Ini terutamanya kerana penyelesaian dan penaakulan untuk masalah matematik selalunya standard dan tersedia secara meluas dalam talian.
Jadi, walaupun ChatGPT menghasilkan responsnya sendiri, mencari jawapan dan alasan yang sama dalam talian adalah mungkin, yang mungkin telah menambah peratusan plagiarisme yang tinggi.
Untuk menyemak sama ada ChatGPT menggunakan kandungan daripada blog dalam talian, kami meminta chatbot untuk memberikan petua untuk mengekalkan kesihatan bateri komputer riba.
Microsoft Word mengesan 10 peratus plagiarisme dalam teks yang dihasilkan. Duplichecker menunjukkan empat peratus, penyemak plagiarisme Grammarly menunjukkan 14 peratus, tetapi Quetext mendapati 58 peratus plagiarisme dalam teks. Setelah menggali lebih lanjut, beberapa teks dalam respons chatbot sepadan dengan kandungan pada beberapa blog.
Untuk menyemak semula sama ada pengesanan plagiarisme yang tinggi bukan hanya secara kebetulan, saya bertanya kepada chatbot beberapa soalan lagi tentang maklumat yang mudah didapati dalam talian. Peratusan plagiarisme dalam respons yang dihasilkan adalah lebih tinggi. Berdasarkan ujian kami, nampaknya chatbot kadangkala menggunakan frasa dan teks daripada sumber dalam talian, yang agak mengejutkan.
Walaupun banyak penyemak plagiarisme dalam talian percuma tidak mengesan plagiarisme utama dalam jawapan ChatGPT, anda tidak seharusnya menggunakannya untuk tujuan akademik atau profesional.
Jangan gunakan ChatGPT untuk tugasan sekolah anda jika anda seorang pelajar. Pengajar boleh menggunakan alatan seperti GPTZero dan pengesan tulisan AI Turnitin untuk mengesan kandungan yang dijana AI. Jika kerja anda dibenderakan sebagai AI yang dijana oleh alat sedemikian, anda boleh gagal tugasan atau dibuang sekolah. Walaupun banyak alat pengesanan GPT secara khusus menyatakan bahawa alat itu tidak sepatutnya digunakan untuk tujuan ini, ia adalah, dan ia boleh menyebabkan anda menghadapi masalah. Apatah lagi, anda benar-benar hanya menipu diri sendiri dengan tidak mempelajari topik itu dengan betul.
Bolehkah anda menggunakan chatbot untuk meningkatkan prestasi kerja anda? Ia bergantung. Jika anda ingin meningkatkan aliran penulisan anda dalam e-mel atau bentuk teks lain, menggunakan AI boleh menjimatkan masa dan usaha anda. Walau bagaimanapun, anda hanya perlu menggunakannya sebagai alat untuk membantu anda dalam tugas anda dan bukannya bergantung padanya untuk melakukan keseluruhan kerja untuk anda.
Sebaliknya, jika tugas anda, seperti penulisan profesional, melarang menggunakan alat sedemikian, anda harus mengelak daripada menggunakan ChatGPT atau mana-mana alat lain sama sekali.
Mudah-mudahan, ujian kami telah memberi anda gambaran tentang sejauh mana ChatGPT boleh menggunakan sumber yang tersedia di web. Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa kami telah menggunakan alat plagiarisme percuma dan hanya menguji set data terhad. Jadi, walaupun penemuan kami mungkin membantu, ia tidak boleh dianggap sebagai fakta mutlak.
Atas ialah kandungan terperinci Adakah ChatGPT Menciplak? Meneliti Sumber Chatbot. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!