搜尋
首頁科技週邊人工智慧博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

DALL·E 2,這個AI竟然自己搞了一套秘密語言。

例如這兩個非常奇怪的詞組:

  • Apoploe vesrreaitais(下文簡稱A)
  • Contarra ccetnxniams luryca tanniounons(下文簡稱C)

(翻譯軟體都會崩潰,可以去試試)

但到了DALL·E 2這裡,畫風卻截然不同。

在它看來,A就是「鳥類」的意思,而C則是「害蟲」之意。

於是乎,如果給DALL·E 2餵上一句:A eat C,那麼它的打開方式就會這樣:

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

清一色產出的圖片,都是鳥吃害蟲相關。

而且你要是跟DALL·E 2說,生成“兩隻鯨魚討論食物,帶字幕”,結果會是這樣:

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

圖裡的“Wa ch zod rea”,在DALL·E 2的詞庫裡竟然是“食物”的意思!

此事一曝光,瞬間引發了眾多網友的熱議。

甚至還有人提出,有了這些秘密語言,可以繞過DALL·E 2的“違禁詞過濾器”,從而生成一些有爭議的圖像了。

(搞事情!)

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

所以,關於DALL·E 2的秘密咒語,到底是怎麼一回事?

一次意外的發現

發現這個問題的是國外一名電腦專業的博士生。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

他注意到DALL-E 2模型在遇到需要給出帶有文字的圖像時,總是會出現一些奇怪的單字。

例如輸入這句話:“兩個農民談論蔬菜,帶字幕(Two farmers talking about vegetables, with subtitles)”,就出來這樣一張圖像:

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

#像是挺像的,不過這字幕寫的啥啊,不是英語又不是法語的,太奇怪了。

「你給我翻譯翻譯什麼這是?」

靈機一動的小哥把其中一個「單字」「Vicootes」當作描述丟給模型,沒想到,出來這樣一堆圖:

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

有蘿蔔、有南瓜、有小柿子…難道「Vicootes」就代表蔬菜?

有意思。

接著他又把氣泡中的那一串「Apoploe vesrreaitais」丟給DALL-E 2,一堆鳥圖出現了:

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

「哦我明白了,這個詞代表'鳥',所以農民們似乎在談論影響他們蔬菜的鳥類?」

看來DALL-E 2沒有糊弄人…

“我發現DALL-E 2的秘密語言了!」小哥驚呼,繼而打算再驗證一下這是不是偶然。

還是剛才提到的鯨魚討論食物的例子中,小哥把那串「Wa ch zod rea」再輸回去。

結果還真出來一堆吃的,而且還全是海鮮,符合鯨魚們的「食性」。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

DALL-E 2,真·誠不我欺。

更進一步,他用這些「咒語」搭配形容圖像風格的詞,看看DALL-E 2是否能正常解析。

結果也都沒問題。看看這些「手繪鳥「、「卡通鳥」、「3D鳥」以及「線稿鳥」:

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

emmmm,最後一張怎麼混進來個蚊子?

先不管它了(一會兒再說)。

所以這個模型為什麼要用這種秘密語言來表示呢?

為什麼會這樣?

「DALL-E 2秘密咒語」話題之熱,也引來了眾多「解析俠」們的關注。

例如一位叫k1uge的網友便提出,問題出在了BPE(Byte Pair Encoding)身上。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

BPE是自然語言語言處理中較為重要的編碼方式之一,也是常見的token壓縮方法,在許多大語言模型中都會涉及。

它的核心想法是:

每一步都將最常見的一對相鄰資料單位,替換為該資料中沒有出現過的一個新單位,反覆迭代直到滿足停止條件。

舉例。

如果要壓縮「aaabdaaabac」這個單字,BPE就會先找出最常見的相鄰位元組對,也就是「aa」。

找到它之後,就可以用新的位元組Z去代替,那麼這個單字就變成了「ZabdZabac」。

同理,下一個最常見相鄰位元組對是“ab”,用Y來代替,單字會進一步被壓縮成“ZYdZYac”。

再下一個最常見相鄰位元組對是“ZY”,用X來替代,最後單字就變成了“XdXac”。

……

於是,基於這樣的原理,網友查了下DALL-E 2針對「鳥類」所用的BPE。

它是這樣的:

apo<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> plo<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> e<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span>ve<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> sr<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> re<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> ait<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">,</span> ais

而現實中許多鳥類的拉丁文學名,就有「apo」和「plo」的前綴。

例如Apodidae(雨燕)和Ploceidae(織布鳥),這兩個單字屬於鳥類的2種鳥科,每個科都有100餘種。

像Apodiformes(雨燕目)是鳥類中最大的目,共有400餘種。

於是這位網友便認為,DALL-E 2是從標有這些「學術用語」標籤的圖片中,獲取到了關於鳥類的大部分資訊。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

或許這就是造成DALL-E 2秘密咒語的原因了。

但,事情還有反轉

激動的博士小哥還專門寫了一篇小論文講述這個事情,還把這些發現都發在了推特上,引來數千網友圍觀,令大家直呼「Incredible」。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

不過很快就會有人親自去試了一下,發現好像事情並沒有那麼簡單。

例如代表“蟲子”的那一串“Contarra ccetnxniams luryca tanniounons”,除了蟲子,也會產生一些青蛙、牛或鴿子的圖像。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

如果給這個描述再加上“cartoon”一詞作為限定,生成的是一些“奶奶”,跟蟲子完全不搭邊? ?

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

「Apoploe vesrreaitais」倒是沒問題,出來的還是一些鳥。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

不過同樣,一旦給它加上「cartoon」「3D render」這類詞,又不對了,出來的是一些蟲子。

(這和小哥最後那個例子裡出現的蚊子也對應上了。)

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

代表蔬菜的「Vicootes」也是這樣,單輸沒問題,一加上風格限定,出現的物種就變了;且基本上可以說只符合“油畫”“卡通”這些風格設定,跟前面的名詞限定毫無關聯,比如“Vicootes” “painting”就是一堆純風景繪畫。

接著他還用同樣的「兩隻鯨魚談論食物,帶字幕」生成了一些圖片,結果大部分文字都看不清,也沒法轉錄。

最後找到一張這樣的:

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

他用上面的」Evve waeles」再輸入後,雖然得到了一張甜點照片,但出現了很多運動員、動物甚至水壺的照片。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

真的有點摸不著頭腦了。

於是這位實驗者就表示:

在我看來,這更像是一些隨機的噪音,而不是DALL-E 2的秘密語言。

博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!

他艾特了博士小哥,希望他可以再給出相反的證據。

目前小哥還沒有答覆。

不過這確實是一個值得關注和討論的話題,鑑於一些「咒語」和圖像可以對上,如果真的是BPE碼的話,那麼真可能博士小哥所說:

有人用“白盒”方法解開這種規則,拿到一些違禁詞的“咒語”,就可以繞過模型的過濾器了。

參考連結:

[1]https://twitter.com/giannis_daras/status/1531693093040230402

[2]https ://twitter.com/BarneyFlames/status/1531736708903051265

[3]https://twitter.com/benjamin_hilton/status/1531780892972175361

#Bgisannias# .io/publications/Discovering_the_Secret_Language_of_Dalle.pdf

[5]https://zhuanlan.zhihu.com/p/424631681

以上是博士意外發現秘密:DALL-E 2自創語言,人看不懂但會產生特定影像,可能會被用來搞事!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
META的新AI助手:生產力助推器還是時間下沉?META的新AI助手:生產力助推器還是時間下沉?May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴,拓展了Llama Stack的企業級部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,並啟動了Llama Defenders計劃,以增強AI安全性。此外,Meta還向10個全球機構(包括致力於改善公共服務、醫療保健和教育的初創企業)發放了總額150萬美元的Llama Impact Grants。 由Llama 4驅動的全新Meta AI應用,被設想為Meta AI

80%的Zers將嫁給AI:研究80%的Zers將嫁給AI:研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說,這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。 零售商與機器人ho積產品,銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題,Rende

賣給機器人:將創造或破壞業務的營銷革命賣給機器人:將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷,並可能超過以前技術轉變的影響。 這些代理代表了生成AI的重大進步,不僅是處理諸如chatgpt之類的處理信息,而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響 兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。 首先,丹佛的尼古拉·喬基奇(Nikola Jokic)錯過了三分球,導致亞倫·戈登(Aaron Gordon)的最後一秒鐘。 索尼的鷹

AI如何加速再生醫學的未來AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上,擴大重生醫學專業知識在全球範圍內要求廣泛的旅行,動手培訓和多年指導。 現在,AI正在改變這一景觀,克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位,同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此,英特爾必須在業界建立更多信任,不僅要證明其工藝的競爭力,還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。 新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰,以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程,以更以客

AI出了問題嗎?現在在那里為此保險AI出了問題嗎?現在在那里為此保險May 01, 2025 am 11:11 AM

全球專業再保險公司Chaucer Group和Armilla AI解決了圍繞AI風險的日益嚴重的問題,已聯手引入了新型的第三方責任(TPL)保險產品。 該政策保護業務不利

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具