首頁  >  文章  >  科技週邊  >  ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

王林
王林轉載
2023-04-12 08:49:242015瀏覽

你說ChatGPT,它寫的東西逼真到傻傻分不清?

沒關係!

現在,它的「剋星」來了--

一位華人小哥專門搞了這麼一個網站,專門鑑別文字到底是出自於AI還是人類。

你只需要把對應的內容黏進去,幾秒鐘內就能分析出結果。

它:「就知道是AI。」

如此神器一出,可謂迅速擄獲大家的芳心。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

這不,直接把伺服器都給擠崩嘍(還好還有備用的)。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

這下,那些用ChatGPT寫作業的「熊小孩」也要慘啦?

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

是人還是ChatGPT? GPTZero:看我的

這個網站名叫GPTZero。

它主要靠“perplexity”,即文本的“困惑度”作為指標來判斷所給內容到底是誰寫的。

NLP領域的朋友都知道,這個指標就是用來評價一個語言模型的好壞的。

在這裡,每當你餵給GPTZero一段測試內容,它就會分別計算出:

#1、文字總困惑度

這個值越高,就越可能出自人類之手。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

2、所有句子的平均困惑度

句子越長,這個值通常就越低。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

3、每個句子的困惑度

透過長條圖的方式呈現,滑鼠懸浮到各個方塊就可以查看對應的句子是什麼(這裡就兩塊,因為我此時輸入的測試內容就兩人句子)。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

之所以要繪製這樣的長條圖,作者也做出了解釋:

根據最新的一些研究:人類書寫的一些句子可能具有較低的困惑度(前面說過,人類的困惑度是比較高的),但隨著繼續寫,困惑度勢必會出現峰值。

相反,用機器產生的文本,其困惑度是均勻分佈的,並且總是很低。

除此之外,GPTZero還會挑出困惑度最高的那個句子(也就是最像人寫的):

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

規則就是這些,接下來實際測一測。

測試1:成功

首先來一段最新的英文新聞(目前還不支援測中文):

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

將它貼進測試框(需注意每句至少5個單詞,建議每段能有10個句子,結果會比較準一些)。

很快,GPTZero計算出這段文字的總文字困惑度為27,句子平均困惑度為171.2,每條句子的困惑度圖長如此:

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

以及困惑度最高的句子的值是476。

看這個結果,估計你也猜出了GPTZero的答案:

是人類寫的。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

答對了。

測試2:失敗

來一段ChatGPT的。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

將內容貼進測試框,得出這段文字的總文字困惑度為31,句子平均困惑度為76.67,每個句子的困惑度圖長這樣:

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

以及困惑度最高的句子的值是99。

看起來,每項困惑度值都和上面那段差距都挺大的,應該能猜出來是AI寫的吧。

不過遺憾的是,GPTZero無法給出答案,還希望我們再多加一點文字試試。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

顯然,這段話字數夠多,但句子不夠多,無法讓GPTZero一眼識破ChatGPT的「偽裝」。

測試3:成功

那我們再來一段ChatGPT的試試看。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

這回內容夠長,句子也夠多。

果然沒問題了,GPTZero直接答對:

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

#好像確實摸出來一點門道:

那就是字多的同時,句子數也一定要多,至少5句,好讓GPTZero透過直方圖的分佈加碼識別,最後的準確率就可以提高一些。

另外還要提的是,我們發現在挑戰失敗的情況中,除了上面這種識別不出來的時候,也有直接識別錯誤的——

比如把AI寫的判斷成人寫的:

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆
ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

把人寫的新聞判斷成AI的:

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆
ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

這種情況依照上面所說的竅門,再多加點內容可能就能將結果扳回來。

(注意是可能哈,就上面這段新聞,我們把所有內容都黏進去了,它也說不行,還說要再多來點。)

普林斯頓華人小哥出品

創建該網站的,是一個22歲的華人小哥Edward Tian,來自加拿大多倫多。

目前是美國普林斯頓CS主脩大四學生,輔修認知科學和新聞學,對軟體工程、機器學習等有濃厚的興趣。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

他現在微軟實習,曾在BBC、貝靈貓等公司撰寫過科技稿件,還曾加入地圖工具Representable的創始團隊。

學習期間,他曾來到清華大學參加為期四週的城市研究研討會。

據他表示,這個應用程式是新年假期在咖啡店完成的。

之所以想要開發這款應用程序,簡而言之就是因為有太多ChatGPT炒作,人類應該知道有哪些是AI寫的文章。

目前仍處於準系統階段,預計在接下來幾週內改進模型和分析。

除此之外,他還透露,正在測試由學生撰寫的新聞文章資料集,並希望最終能發表論文。

更多ChatGPT殺手

事實上,也不只有這位小哥看ChatGPT不順眼了。還有其他人類組織也相應開發了AI文字偵測器,AKA ChatGPT殺手。

大體思路也都差不多,那就是“用魔法打敗魔法”,用AI寫的東西來訓練新AI。

前陣子,OpenAI自己聯合哈佛等大學機構聯合打造了一款檢測器:GPT-2 Output Detector。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

作者們先是發布了一個「GPT-2生成內容」和WebText(專門從國外貼吧Reddit上扒下來的)資料集,讓AI理解「AI語言」和「人話」之間的差異。

隨後,用這個資料集對RoBERTa模型進行微調,就得到了這個AI偵測器。其中人話一律被辨識為True,AI生成的內容則一律被辨識為Fake。

(RoBERTa是BERT的改進版。原始的BERT使用了13GB大小的資料集,但RoBERTa使用了包含6300萬條英文新聞的160GB資料集。)

另一位早年代表選手,也因為這次新進展再次被提及。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

它就是MIT-IBM沃森AI實驗室的以及哈佛NLP實驗室開發的GLTR模型。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

它主要透過對文字進行統計分析和視覺化,而用來偵測的是原本用來產生文字的相同or類似模型。目前主要支援GPT-2和BERT兩個模型。

由於輸出是模型知道的所有單字排名,根據排名對文字每個單字進行顏色編碼,前10名是綠色,前100名是黃色,前1000名是紅色,紫色則是不太可能出現的字。

如果一段文字黃綠色過多,那麼這段文字主要是由AI產生的。

此番GPTZero再度亮相,不少網友驚嘆:Incredible work!

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

但也有人表示,文字偵測器根本就是一場失敗的軍備競賽,他們的實際效果並不好。也阻擋不了ChatGPT的發展。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

同時,也有網友探討起關於「文章是否需要明確指示由AI還是人類編寫」的必要性。

有位詞曲創作者認為,這是有必要的,就像在看雜誌時會標註“廣告”,這應該是一個簡單的要求。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

但有網友立即表示反對,為什麼要設障礙?這就跟著使用PS然後加上Adobe浮水印,對產品沒有任何益處。

ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆

對於這個問題,你怎麼看呢?

試玩連結:

https://etedward-gptzero-main-zqgfwb.streamlit.app/

參考連結:

##[1 ]https://brackets.substack.com/about

[2]https://www.reddit.com/r/programming/comments/102hxlg/gptzero_an_app_to_efficiently_tell_if_an_essay_is/

[3] https://twitter.com/Marc__Watkins/status/1601746409203863553

#[4]http://gltr.io/


#

以上是ChatGPT「剋星」來了!文章作者是AI幾秒檢出,華人小哥元旦假期搞定,服務器已擠爆的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除