你說ChatGPT,它寫的東西逼真到傻傻分不清?
沒關係!
現在,它的「剋星」來了--
一位華人小哥專門搞了這麼一個網站,專門鑑別文字到底是出自於AI還是人類。
你只需要把對應的內容黏進去,幾秒鐘內就能分析出結果。
它:「就知道是AI。」
如此神器一出,可謂迅速擄獲大家的芳心。
這不,直接把伺服器都給擠崩嘍(還好還有備用的)。
這下,那些用ChatGPT寫作業的「熊小孩」也要慘啦?
這個網站名叫GPTZero。
它主要靠“perplexity”,即文本的“困惑度”作為指標來判斷所給內容到底是誰寫的。
NLP領域的朋友都知道,這個指標就是用來評價一個語言模型的好壞的。
在這裡,每當你餵給GPTZero一段測試內容,它就會分別計算出:
#1、文字總困惑度
這個值越高,就越可能出自人類之手。
2、所有句子的平均困惑度
句子越長,這個值通常就越低。
3、每個句子的困惑度
透過長條圖的方式呈現,滑鼠懸浮到各個方塊就可以查看對應的句子是什麼(這裡就兩塊,因為我此時輸入的測試內容就兩人句子)。
之所以要繪製這樣的長條圖,作者也做出了解釋:
根據最新的一些研究:人類書寫的一些句子可能具有較低的困惑度(前面說過,人類的困惑度是比較高的),但隨著繼續寫,困惑度勢必會出現峰值。
相反,用機器產生的文本,其困惑度是均勻分佈的,並且總是很低。
除此之外,GPTZero還會挑出困惑度最高的那個句子(也就是最像人寫的):
規則就是這些,接下來實際測一測。
首先來一段最新的英文新聞(目前還不支援測中文):
將它貼進測試框(需注意每句至少5個單詞,建議每段能有10個句子,結果會比較準一些)。
很快,GPTZero計算出這段文字的總文字困惑度為27,句子平均困惑度為171.2,每條句子的困惑度圖長如此:
以及困惑度最高的句子的值是476。
看這個結果,估計你也猜出了GPTZero的答案:
是人類寫的。
答對了。
來一段ChatGPT的。
將內容貼進測試框,得出這段文字的總文字困惑度為31,句子平均困惑度為76.67,每個句子的困惑度圖長這樣:
以及困惑度最高的句子的值是99。
看起來,每項困惑度值都和上面那段差距都挺大的,應該能猜出來是AI寫的吧。
不過遺憾的是,GPTZero無法給出答案,還希望我們再多加一點文字試試。
顯然,這段話字數夠多,但句子不夠多,無法讓GPTZero一眼識破ChatGPT的「偽裝」。
那我們再來一段ChatGPT的試試看。
這回內容夠長,句子也夠多。
果然沒問題了,GPTZero直接答對:
#好像確實摸出來一點門道:
那就是字多的同時,句子數也一定要多,至少5句,好讓GPTZero透過直方圖的分佈加碼識別,最後的準確率就可以提高一些。
另外還要提的是,我們發現在挑戰失敗的情況中,除了上面這種識別不出來的時候,也有直接識別錯誤的——
比如把AI寫的判斷成人寫的:
把人寫的新聞判斷成AI的:
這種情況依照上面所說的竅門,再多加點內容可能就能將結果扳回來。
(注意是可能哈,就上面這段新聞,我們把所有內容都黏進去了,它也說不行,還說要再多來點。)
創建該網站的,是一個22歲的華人小哥Edward Tian,來自加拿大多倫多。
目前是美國普林斯頓CS主脩大四學生,輔修認知科學和新聞學,對軟體工程、機器學習等有濃厚的興趣。
他現在微軟實習,曾在BBC、貝靈貓等公司撰寫過科技稿件,還曾加入地圖工具Representable的創始團隊。
學習期間,他曾來到清華大學參加為期四週的城市研究研討會。
據他表示,這個應用程式是新年假期在咖啡店完成的。
之所以想要開發這款應用程序,簡而言之就是因為有太多ChatGPT炒作,人類應該知道有哪些是AI寫的文章。
目前仍處於準系統階段,預計在接下來幾週內改進模型和分析。
除此之外,他還透露,正在測試由學生撰寫的新聞文章資料集,並希望最終能發表論文。
事實上,也不只有這位小哥看ChatGPT不順眼了。還有其他人類組織也相應開發了AI文字偵測器,AKA ChatGPT殺手。
大體思路也都差不多,那就是“用魔法打敗魔法”,用AI寫的東西來訓練新AI。
前陣子,OpenAI自己聯合哈佛等大學機構聯合打造了一款檢測器:GPT-2 Output Detector。
作者們先是發布了一個「GPT-2生成內容」和WebText(專門從國外貼吧Reddit上扒下來的)資料集,讓AI理解「AI語言」和「人話」之間的差異。
隨後,用這個資料集對RoBERTa模型進行微調,就得到了這個AI偵測器。其中人話一律被辨識為True,AI生成的內容則一律被辨識為Fake。
(RoBERTa是BERT的改進版。原始的BERT使用了13GB大小的資料集,但RoBERTa使用了包含6300萬條英文新聞的160GB資料集。)
另一位早年代表選手,也因為這次新進展再次被提及。
它就是MIT-IBM沃森AI實驗室的以及哈佛NLP實驗室開發的GLTR模型。
它主要透過對文字進行統計分析和視覺化,而用來偵測的是原本用來產生文字的相同or類似模型。目前主要支援GPT-2和BERT兩個模型。
由於輸出是模型知道的所有單字排名,根據排名對文字每個單字進行顏色編碼,前10名是綠色,前100名是黃色,前1000名是紅色,紫色則是不太可能出現的字。
如果一段文字黃綠色過多,那麼這段文字主要是由AI產生的。
此番GPTZero再度亮相,不少網友驚嘆:Incredible work!
但也有人表示,文字偵測器根本就是一場失敗的軍備競賽,他們的實際效果並不好。也阻擋不了ChatGPT的發展。
同時,也有網友探討起關於「文章是否需要明確指示由AI還是人類編寫」的必要性。
有位詞曲創作者認為,這是有必要的,就像在看雜誌時會標註“廣告”,這應該是一個簡單的要求。
但有網友立即表示反對,為什麼要設障礙?這就跟著使用PS然後加上Adobe浮水印,對產品沒有任何益處。
對於這個問題,你怎麼看呢?
試玩連結:
https://etedward-gptzero-main-zqgfwb.streamlit.app/
參考連結:
##[1 ]https://brackets.substack.com/about[2]https://www.reddit.com/r/programming/comments/102hxlg/gptzero_an_app_to_efficiently_tell_if_an_essay_is/[3] https://twitter.com/Marc__Watkins/status/1601746409203863553#[4]http://gltr.io/
#
以上是ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆的詳細內容。更多資訊請關注PHP中文網其他相關文章!