Rumah  >  Artikel  >  Peranti teknologi  >  Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

WBOY
WBOYke hadapan
2023-04-08 22:01:131407semak imbas

DALL·E 2, AI ini sebenarnya membangunkan bahasa rahsianya sendiri.

Sebagai contoh, dua frasa yang sangat pelik ini:

  • Apoploe vesrreaitais (selepas ini dirujuk sebagai A)
  • Contarra ccetnxniams luryca tanniounons (selepas ini dirujuk sebagai C)

(Perisian terjemahan akan ranap, anda boleh mencubanya)

Tetapi apabila bercakap tentang DALL·E 2, gaya lukisan adalah berbeza sama sekali.

Pada pendapatnya, A bermaksud "burung" dan C bermaksud "perosak".

Jadi, jika anda memberi DALL·E 2 ayat: A makan C, maka kaedah pembukaannya akan menjadi seperti ini:

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Semua output Gambar semuanya tentang burung yang memakan perosak.

Dan jika anda memberitahu DALL·E 2 untuk menjana "Dua paus membincangkan makanan, dengan sarikata", hasilnya akan seperti ini:

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Gambar " Wa ch zod rea" sebenarnya bermaksud "makanan" dalam perbendaharaan kata DALL·E 2!

Apabila perkara ini terbongkar, ia serta-merta membangkitkan perbincangan hangat di kalangan ramai netizen.

Sesetengah orang telah mencadangkan bahawa dengan bahasa rahsia ini, "penapis perkataan terlarang" DALL·E 2 boleh dipintas untuk menghasilkan beberapa imej kontroversi.

(Membuat onar!)

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Jadi, apakah mantra rahsia DALL·E 2?

Penemuan yang tidak dijangka

Orang yang menemui masalah ini ialah pelajar kedoktoran asing dalam jurusan sains komputer.

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Dia perasan bahawa model DALL-E 2 sentiasa mempunyai beberapa perkataan pelik apabila ia menemui imej yang perlu diberikan dengan teks.

Contohnya, masukkan ayat ini: "Dua petani bercakap tentang sayur-sayuran, dengan sari kata (Dua petani bercakap tentang sayur-sayuran, dengan sari kata)", dan imej seperti ini akan muncul:

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Nampaknya agak serupa, tetapi apa kata sari kata itu bukan bahasa Inggeris mahupun bahasa Perancis.

"Apa yang awak terjemahkan untuk saya?"

Adik itu mendapat idea dan melemparkan salah satu "perkataan" "Vicootes" sebagai penerangan kepada model itu seperti ini Longgokan imej:

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Terdapat lobak, labu, dan kesemak... Adakah "Vicootes" bermaksud sayur-sayuran?

Menarik.

Kemudian dia melemparkan rentetan "Apoploe vesrreaitais" ke dalam gelembung ke DALL-E 2, dan sekumpulan gambar burung muncul:

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

" Oh Saya lihat, perkataan itu bermaksud 'burung', jadi petani seolah-olah bercakap tentang burung yang menjejaskan sayur-sayuran mereka "

Nampaknya DALL-E 2 tidak menipu orang...

" Saya menemui bahasa rahsia DALL-E 2!" Adik lelaki itu berseru, dan kemudian merancang untuk mengesahkan sama ada ini satu kebetulan.

Dalam contoh ikan paus membincangkan makanan yang baru disebut, adik lelaki memasukkan rentetan "Wa ch zod rea" kembali.

Akhirnya, terdapat banyak makanan, dan semuanya adalah makanan laut, yang selaras dengan "tabiat makan" ikan paus.

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

DALL-E 2, keikhlasan tidak akan menipu saya.

Melangkah lebih jauh, dia menggunakan "mantera" ini dengan perkataan yang menerangkan gaya imej untuk melihat sama ada DALL-E 2 boleh menghuraikannya secara normal.

Hasilnya juga bagus. Lihatlah "burung lukisan tangan", "burung kartun", "burung 3D" dan "burung lukisan garisan":

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

emmmm, bagaimana nyamuk dapat bercampur aduk pada yang terakhir?

Abaikan buat masa ini (lebih lanjut mengenainya kemudian).

Jadi mengapa model ini dinyatakan dalam bahasa rahsia ini?

Mengapa ini berlaku?

Topik hangat "DALL-E 2 Secret Mantra" juga telah menarik perhatian ramai "penganalisis".

Sebagai contoh, seorang netizen bernama k1uge mencadangkan bahawa masalahnya terletak pada BPE (Byte Pair Encoding).

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

BPE ialah salah satu kaedah pengekodan yang lebih penting dalam pemprosesan bahasa semula jadi Ia juga merupakan kaedah pemampatan token yang biasa dan terlibat dalam banyak model bahasa yang besar.

Idea teras ialah:

Setiap langkah menggantikan pasangan paling biasa unit data bersebelahan dengan unit baharu yang belum muncul dalam data dan berulang berulang kali sehingga keadaan berhenti dipenuhi.

Beri saya contoh.

Jika anda ingin memampatkan perkataan "aaabdaaabac", BPE akan mula-mula mencari pasangan bait bersebelahan yang paling biasa, iaitu "aa".

Selepas menemuinya, anda boleh menggantikannya dengan bait baharu Z, dan perkataan itu menjadi "ZabdZabac".

Begitu juga, pasangan bait bersebelahan yang paling biasa seterusnya ialah "ab", digantikan dengan Y, perkataan itu akan dimampatkan lagi menjadi "ZYdZYac".

Pasangan bait bersebelahan seterusnya yang paling biasa ialah "ZY", gantikannya dengan X dan perkataan akhir menjadi "XdXac".

......

Jadi, berdasarkan prinsip ini, netizen ini menyemak BPE yang digunakan oleh DALL-E 2 untuk "burung".

Nampaknya seperti ini:

apo<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> plo<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> e<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span>ve<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> sr<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> re<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> ait<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> ais

Pada hakikatnya, nama Latin bagi banyak burung mempunyai awalan "apo" dan "plo".

Contohnya Apodidae (burung walit) dan Ploceidae (burung penenun), kedua-dua perkataan ini tergolong dalam 2 famili burung, setiap famili mempunyai lebih daripada 100 spesies.

Apodiformes (Swifts) ialah ordo terbesar di kalangan burung, dengan lebih daripada 400 spesies keseluruhannya.

Jadi netizen ini percaya DALL-E 2 memperolehi kebanyakan maklumat tentang burung daripada gambar yang dilabelkan dengan "istilah akademik" ini.

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Mungkin ini adalah sebab mantra rahsia DALL-E 2.

Walau bagaimanapun, keadaan telah berubah

Doktor yang teruja menulis kertas kecil tentang perkara ini, dan menyiarkan penemuan ini di Twitter, menarik Beribu-ribu netizen menonton, dan semua orang memanggil "Incredible".

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Tetapi tidak lama kemudian seseorang mencubanya sendiri dan mendapati perkara itu tidak semudah itu.

Contohnya, rentetan "Contarra ccetnxniams luryca tanniounons" mewakili "pepijat" juga akan menjana beberapa imej katak, lembu atau merpati selain pepijat.

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Jika anda menambah perkataan "kartun" sebagai kelayakan pada perihalan ini, apa yang akan dihasilkan ialah beberapa "nenek", yang tiada kaitan dengan serangga? ?

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

"Apoploe vesrreaitais" tiada masalah, masih ada beberapa burung yang keluar.

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Tetapi sekali lagi, sebaik sahaja anda menambahkan perkataan seperti "kartun" dan "render 3D" padanya, sesuatu yang tidak kena sekali lagi dan yang keluar ialah beberapa pepijat.

(Ini juga sepadan dengan nyamuk yang muncul dalam contoh terakhir.)

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Begitu juga untuk "Vicootes" yang mewakili sayur-sayuran, kerugian tunggal Tidak masalah, sebaik sahaja sekatan gaya ditambah, spesies yang muncul akan berubah dan pada asasnya boleh dikatakan bahawa mereka hanya mematuhi tetapan gaya "lukisan minyak" dan "kartun" dan tiada kaitan dengan sekatan kata nama sebelumnya, seperti sebagai "Vicootes" + "lukisan" Hanya sekumpulan lukisan landskap tulen.

Dia kemudian menggunakan "dua ikan paus bercakap tentang makanan, dengan sari kata" yang sama untuk menjana beberapa gambar, tetapi kebanyakan teks tidak jelas dan tidak dapat ditranskripsikan.

Akhirnya jumpa yang seperti ini:

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Selepas dia memasukkan semula menggunakan "Evve waeles" di atas, walaupun dia mendapat gambar pencuci mulut, banyak gambar atlet, haiwan dan juga cerek muncul.

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Saya benar-benar keliru.

Jadi penguji berkata:

Pada pendapat saya, ini lebih seperti bunyi rawak, bukan bahasa Rahsia DALL-E 2.

Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!

Dia menyukai doktor itu, dengan harapan dia boleh memberikan keterangan yang bertentangan.

Tiada balasan lagi.

Walau bagaimanapun, ini sememangnya topik yang patut diberi perhatian dan perbincangan Memandangkan beberapa "mantera" dan imej boleh dipadankan, jika ia benar-benar kod BPE, maka ia adalah benar-benar mungkin. doktor berkata:

Sesetengah orang menggunakan kaedah "kotak putih" untuk membuka kunci peraturan jenis ini dan mendapatkan beberapa "mantera" perkataan terlarang untuk memintas penapis model.

Pautan rujukan:

[1]https://twitter.com/giannis_daras/status/1531693093040230402

[2]https ://twitter.com/BarneyFlames/status/1531736708903051265

[3]https://twitter.com/benjamin_hilton/status/1531780892972175361

[4] .io/publications/Discovering_the_Secret_Language_of_Dalle.pdf

[5]https://zhuanlan.zhihu.com/p/424631681

Atas ialah kandungan terperinci Doktor secara tidak sengaja menemui rahsia: DALL-E 2 mencipta bahasanya sendiri, yang tidak dapat difahami oleh manusia tetapi boleh menghasilkan imej tertentu, yang mungkin digunakan untuk menimbulkan masalah!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam