DetectGPT的目的是確定一段文字是否由特定的llm生成,例如GPT-3。為了對段落 x 進行分類,DetectGPT 首先使用通用的預訓練模型(例如 T5)對段落 ~xi 產生較小的擾動。然後DetectGPT將原始樣本x的對數機率與每個擾動樣本~xi進行比較。如果平均對數比高,則樣本可能來自來源模型。
ChatGPT是一個熱門話題。人們正在討論是否可以偵測到一篇文章是由大型語言模型(LLM)產生的。 DetectGPT定義了一種新的基於曲率的準則,用於判斷是否從給定的LLM生成。 DetectGPT不需要訓練單獨的分類器,不需要收集真實或產生的段落的資料集,也不需要明確地為生成的文字加上浮水印。它只使用由感興趣的模型計算的對數機率和來自另一個通用預訓練語言模型(例如T5)的文章隨機擾動。
1、DetectGPT:隨機排列和假設
#識別並利用了機器產生的通道x~pθ(左)位於logp (x)的負曲率區域的趨勢,其中附近的樣本平均具有較低的模型對數機率。相較之下,人類書寫的文字x~preal(.)(右)傾向於不佔據具有明顯負對數機率曲率的區域。
DetectGPT基於一個假設,即來自來源模型pθ的樣本通常位於pθ對數機率函數的負曲率區域,這是人類文本不同的。如果我們對一段文字 x~pθ 應用小的擾動,產生 ~x,與人類編寫的文本相比,機器產生的樣本的數量 log pθ(x) - log pθ(~x) 應該相對較大。利用這個假設,首先考慮一個擾動函數 q(.|x),它給出了在 ~x 上的分佈,x 的略微修改版本具有相似的含義(通常考慮粗略的段落長度文本 x)。例如,q(.|x) 可能是簡單地要求人類重寫 x 的其中一個句子的結果,同時保留 x 的含義。使用擾動函數的概念,可以定義擾動差異d (x; pθ, q):
#因此,下面的假設4.1也就是:
如果q(.|x)是來自掩碼填充模型(如T5)的樣本而不是人類重寫,那麼假設4.1可以以自動的、可擴展的方式進行經驗檢驗。
2、DetectGPT:自動測試
#對一篇文章進行改寫後,模型產生的文章的對數機率(擾動差異)的平均下降總是高於人工書寫的文章
對於真實數據,使用了XSum資料集中的500篇新聞文章。當提示XSum中每篇文章的前30個令牌時,使用四個不同llm的輸出。使用T5-3B施加擾動,遮蔽隨機採樣的2個單字跨度,直到文章中15%的單字被掩蓋。上面公式(1)中的期望近似於T5中的100個樣本。
上述實驗結果表明,人寫文章和模型樣本的攝動差異分佈有顯著差異;模型樣本往往有較大的擾動差異。根據這些結果,就可以透過簡單地閾值擾動差異來偵測一段文字是否由模型p產生。
透過用於估計E~x q(.|x) log p (~x) 的觀測值的標準差對擾動差異進行歸一化提供了更好的檢測,通常將AUROC 增加0.020 左右, 所以在實驗中使用了擾動差異的歸一化版本。
DetectGPT 的偵測過程偽代碼
#擾動差異可能是有用的,它測量的是什麼還無法明確解釋,所以作者在下一節中使用曲率進行解釋。
3、將微擾差異解釋為曲率
擾動差異近似於候選段落附近對數機率函數局部曲率的度量,更具體地說,它與對數機率函數的Hessian矩陣的負跡成正比。
這一節內容比較多,這裡就不詳細解釋了,有興趣的可以看看原文論文,大概總結如下:
語意空間中的取樣確保所有樣本都保持在資料流形附近,因為如果隨機添加擾動標記,預計對數機率總是下降。所以可以將目標解釋為近似限制在資料流形上的曲率。
4、結果展示
零樣本機器產生文字偵測
#每個實驗使用150到500個範例進行評估。機器產生的文字是透過提示真實文字的前30個標記來產生的。使用AUROC)評估效能。
可以看到DetectGPT最大程度地提高了XSum故事的平均檢測精度(AUROC提高0.1 )和SQuAD維基百科上下文(AUROC提高0.05 )。
對於15種資料集和模型組合中的14種,DetectGPT提供了最準確的檢測效能,AUROC平均提高了0.06。
與有監督偵測器的比較
在真實文字和生成文字的大型資料集上訓練的有監督的機器生成文字偵測模型在分佈內(頂部行)文字上的表現與DetectGPT一樣好,甚至更好。零樣本方法適用於新領域(底部一行),如PubMed醫學文本和WMT16中的德語新聞資料。
來自每個資料集的200個樣本進行評估,監督偵測器對英語新聞等分佈內資料的偵測效能與DetectGPT相似,但在英文科學寫作的情況下,其表現明顯差於零樣本方法,而在德語寫作中則完全失敗。
DetectGPT偵測GPT-3的平均AUROC與專門為機器產生文字偵測訓練的監督模型相當。
從PubMedQA、XSum和writingprompt資料集中抽取了150個範例。將兩種預訓練的基於roberta的檢測器模型與DetectGPT和機率閾值基線進行了比較。 DetectGPT 可以提供與更強大的監督模型競爭的檢測。
機器產生文字偵測的變體
這部分是看偵測器是否可以偵測到手動編輯的機器產生文字。透過用 T5–3B 中的樣本替換文字的 5 個單字跨度來模擬人工修訂,直到 r% 的文字被替換。即使模型樣本中近四分之一的文字已被替換,DetectGPT 仍能將偵測 AUROC 保持在 0.8 以上。 DetectGPT 顯示了所有修訂等級的最強檢測效能。
以上是DetectGPT:使用機率曲率的零樣本機器產生文字偵測的詳細內容。更多資訊請關注PHP中文網其他相關文章!

經常使用“ AI-Ready勞動力”一詞,但是在供應鏈行業中確實意味著什麼? 供應鏈管理協會(ASCM)首席執行官安倍·埃什肯納齊(Abe Eshkenazi)表示,它表示能夠評論家的專業人員

分散的AI革命正在悄悄地獲得動力。 本週五在德克薩斯州奧斯汀,Bittensor最終遊戲峰會標誌著一個關鍵時刻,將分散的AI(DEAI)從理論轉變為實際應用。 與閃閃發光的廣告不同

企業AI面臨數據集成挑戰 企業AI的應用面臨一項重大挑戰:構建能夠通過持續學習業務數據來保持準確性和實用性的系統。 NeMo微服務通過創建Nvidia所描述的“數據飛輪”來解決這個問題,允許AI系統通過持續接觸企業信息和用戶互動來保持相關性。 這個新推出的工具包包含五個關鍵微服務: NeMo Customizer 處理大型語言模型的微調,具有更高的訓練吞吐量。 NeMo Evaluator 提供針對自定義基準的AI模型簡化評估。 NeMo Guardrails 實施安全控制,以保持合規性和適當的

AI:藝術與設計的未來畫卷 人工智能(AI)正以前所未有的方式改變藝術與設計領域,其影響已不僅限於業餘愛好者,更深刻地波及專業人士。 AI生成的藝術作品和設計方案正在迅速取代傳統的素材圖片和許多交易性設計活動中的設計師,例如廣告、社交媒體圖片生成和網頁設計。 然而,專業藝術家和設計師也發現AI的實用價值。他們將AI作為輔助工具,探索新的美學可能性,融合不同的風格,創造新穎的視覺效果。 AI幫助藝術家和設計師自動化重複性任務,提出不同的設計元素並提供創意輸入。 AI支持風格遷移,即將一種圖像的風格應用

Zoom最初以其視頻會議平台而聞名,它通過創新使用Agentic AI來引領工作場所革命。 最近與Zoom的CTO XD黃的對話揭示了該公司雄心勃勃的願景。 定義代理AI 黃d

AI會徹底改變教育嗎? 這個問題是促使教育者和利益相關者的認真反思。 AI融入教育既提出了機遇和挑戰。 正如科技Edvocate的馬修·林奇(Matthew Lynch)所指出的那樣

美國科學研究和技術發展或將面臨挑戰,這或許是由於預算削減導致的。據《自然》雜誌報導,2025年1月至3月期間,美國科學家申請海外工作的數量比2024年同期增加了32%。此前一項民意調查顯示,75%的受訪研究人員正在考慮前往歐洲和加拿大尋找工作。 過去幾個月,數百項NIH和NSF的撥款被終止,NIH今年的新撥款減少了約23億美元,下降幅度接近三分之一。洩露的預算提案顯示,特朗普政府正在考慮大幅削減科學機構的預算,削減幅度可能高達50%。 基礎研究領域的動盪也影響了美國的一大優勢:吸引海外人才。 35

Openai推出了強大的GPT-4.1系列:一個專為現實世界應用設計的三種高級語言模型家族。 這種巨大的飛躍提供了更快的響應時間,增強的理解和大幅降低了成本


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能