搜尋
首頁科技週邊人工智慧「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

群眾的討伐聲浪一重又一重,OpenAI終於頂不住了。

從大學教授,到Stack Overflow,可謂是苦ChatGPT久矣。現在,無論是老師看到學生提交的論文,或是碼農看到網路上的代碼,都不敢確定作者是人還是AI。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

口誅筆伐之下,OpenAI頂不住了,火速發布了一款AI檢測器。

左右互搏:OpenAI發布ChatGPT檢測器

#剛剛,OpenAI官宣了自家的AI文字分類器。

它是一個經過微調的GPT模型,可以推論一段文字由AI產生的可能性。

有趣的是,ChatGPT也是基於GPT模型,用這個分類器偵測ChatGPT,堪稱左右互搏。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

在訓練上,這個模型採用的是同一主題下的人類手寫和AI生成的文本對。

所使用的素材來自於維基百科資料集、2019年收集的WebText資料集,以及在訓練InstructGPT時收集的一組人類演示。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

#體驗網址:https://platform.openai.com/ai-text-classifier

但是吧,這個正確率著實不高…

在評估「挑戰集」中的英文文本時,分類器只將26%的AI生成文字正確地歸類為「可能是AI寫的」(真陽性)。

「撩妹神器」還靈不?

毫無疑問,ChatGPT正在全世界掀起一股颶風。

學生紛紛用得不亦樂乎,媒體驚呼「教育系統」已經被顛覆,最近的調查顯示,#已經有89%的大學生用ChatGPT寫作業了#。

此外,它也通過了美國醫學執照考試、華頓商學院MBA考試和4門法學院的考試,能力簡直要通天;美版「頭條」BuzzFeed宣布要用ChatGPT寫文的消息後,股價瘋狂暴漲119%。

而妙筆生花的文采,也讓ChatGPT被很多小哥奉為「撩妹神器」。

雖然做數學題不太靈,但想要讓它寫下一篇文采斐然、深情款款的情書,那可真是so easy。

這不,國外的這位小哥,就沉迷於用ChatGPT為老婆Monika寫情書。

然而Monika早已看穿他的套路,警告他別再沉迷ChatGPT無法自拔。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

還有玩得大的哥們,把ChatGPT生成的情書發給了好基友,好基友直接一臉黑人問號。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

#

雖然但是,可以看出,ChatGPT的文采相當不錯。論文、情書、小說,ChatGPT都不在話下。難怪大家都在瘋狂用ChatGPT「造文」。

那OpenAI發布的官方AI檢測器,到底有多管用呢?

咱們來實測一下。

先試試Monika的老公寄給她的情詩。

然而遺憾的是,OpenAI表示自己只能偵測1000字元以上的文章,愛莫能助…

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

翻譯一下:至少要1000字符,也就是150-250個英文單字。而對於中文來說,就只能是「千字長文」了。

的確,OpenAI的官方公告也說,「分類器對於短文本(少於1,000 個字元)的偵測非常不可靠。甚至更長的文字有時會被分類器錯誤地標記。」

除此之外,OpenAI的偵測器還有幾個「限制」:

  • 分類器並不總是準確的,它可能會錯誤地標記AI生成的和人類寫的文本,並且語氣很自信
  • 建議僅對英文文本使用分類器。它在其他語言上的表現要差得多,並且在程式碼上不可靠
  • 它無法可靠地識別非常可預測的文字。例如,無法預測前1000個素數的列表是由AI還是人類寫的,因為正確答案總是相同的
  • AI生成的文本,經過編輯之後很可能會規避掉分類器的檢測
  • 如果輸入與訓練集中的文字有很大的區別,分類器會做出錯誤判斷

既然檢測器要長文,那咱們就給它個長的。小編組合了一篇王小波情書選段,全文共1027個字。

輸入偵測器後,它給了判斷:這篇情書是人類寫的。 Bingo!

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

然後,小編讓ChatGPT模仿王小波,產生新的情書。

可以看到,ChatGPT寫的情書文采還行,但比起大作家的文字,它真的沒有「靈魂」。

而偵測器也準確測出來,這封情書大機率就是AI生成的。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

結果的分割超細

#具體來說,分類器會將輸入文字分成五個類別:

  • 「非常不可能是AI生成的」(Very unlikely to be AI-generated)

分類器的閾值

  • 「不太可能是AI產生的」(Unlikely to be AI-generated)

分類器的閾值在0.1到0.45之間。在「挑戰集」中,大約15%的手寫文字和10%的AI生成文本有這個標註。

  • 「不清楚是否是AI寫的」(Unclear if it is AI writte)

分類器的閾值在0.45到0.9之間。在「挑戰集」中,大約50%的手寫文字和34%的AI生成文本有這個標註。

  • 「可能是AI生成的」(Possibly AI-generated)

分類器的閾值在0.9到0.98之間。在「挑戰集」中,大約21%的手寫文字和28%的AI生成文本有這個標註。

  • 「很可能是AI產生的」(Likely AI-generated)

分類器的閾值>0.98 。在「挑戰集」中,大約9%的手寫文字和26%的AI生成文本有這個標註。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

可靠性有待加強

##雖然分類器可以辨識大部分AI產生的文本,但OpenAI提醒稱,它並不「完全可靠」。

在曲線下面積(AUC)測試中,分類器在驗證集中達到了0.97分,在挑戰集中達到了0.66分,而此前公佈的分類器在驗證集中達到了0.95分,在挑戰集中達到了0.43分。

此外,隨著語言模型規模的增加,分類器的效能出現了下降。

但好消息是,這意味著大型語言模型所產生的文本,更像人類寫的。

同時,OpenAI也特別指出,這個分類器還沒有在謠言、學生作文或聊天記錄上進行評估;也沒有在AI和人類共同撰寫的文本上進行測試,而這也是現在最常見的使用場景之一。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

這麼看來,還是普林斯頓大學那位22歲華人小哥開發的GPTZero更人性化一些。

不隻隻有250個字符,還能明確地指出一段文字中,哪一段是AI生成的,哪段是人類寫的。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

AIGC大廠自研「AI檢測器」實測

在OpenAI發布官方「AI檢測器」以前,市面上早就有了多款AI檢測器。

來自美國的作家和電腦科學家David Gewirtz,就親自測試了三款線上AI檢測器。

這裡最有趣的一點在於,其中有兩個都是販賣AI生成文字的網站自己做的。

注意:人寫的是普通字體,AI生成的是斜體。每段文字後,會顯示偵測器的結果。 (實際輸入偵測器的文字都是英文文字,本文為翻譯後的結果)。

順便一提,這位David Gewirtz也是FBI InfraGard的成員,以及美國重要的網路安全專家之一。此前,他曾在伍斯特理工學院以優異的成績獲得理學士學位,但在加州大學柏克萊分校攻讀博士時退學。

測試開始!

1. 解釋為何ChatGPT造成的抄襲會為教師和編輯帶來困擾

ChatGPT是OpenAI開發的GPT(Generative Pre-trained Transformer)語言模型的變體。它被設計為透過預測給定輸入序列中的下一個單字或短語,來產生類似人類的文字。雖然ChatGPT可以是產生文字和回應提示的有用工具,但在涉及抄襲時,它也會為教師和編輯帶來問題。 #

ChatGPT會為教師和編輯帶來問題的主要原因之一是,它可以產生與真實人類非常相似的文本。這意味著人們有可能使用ChatGPT生成文本,然後將其作為自己的作品提交,從而犯下抄襲的錯誤。

對於教師和編輯來說,偵測一段特定的文字是由ChatGPT產生的還是由人寫的,可能非常困難,因為產生的文字可能不包含任何明顯的錯誤或差異,能讓人辨別出它的來源。這可能會使教師和編輯難以辨識和防止抄襲,因為他們可能無法分辨某段文字是原創的,還是從其他來源複製的。

總的來說,ChatGPT和其他類似的語言模型在涉及抄襲時,可能會成為教師和編輯的問題,因為它們可以產生難以區分的文本,使人們更容易進行抄襲,而不被發現。

GPT-2 Output Detector:99.69%真的。

Writer AI Content Detector:97%是人類生成的內容,妙不可言!

Content at Scale AI Content Detection:87%人類得分,看起來不錯!

2. 告訴我至少有三種方法,用來偵測一篇文章是否是用ChatGPT產生的

有幾種方法可以偵測ChatGPT或其他語言模型是否被用來產生一段文字。以下是你可以使用的三種潛在方法。

1. 尋找文本中的重複或異常模式:偵測一個語言模型是否被用來產生一段文字的方法之一,是尋找寫作中的重複或不尋常的模式。例如,語言模型可能會重複某些短語或單字組合,或使用不尋常或不一致的句子結構。

2. 檢查是否缺乏原創性:另一個偵測語言模型是否被用來產生一段文字的方法,是檢視寫作中是否缺乏原創性。如果一段文字看起來是從其他來源複製的,或者如果它包含在互聯網上或其他來源中廣泛存在的信息,這可能就表明,它是由語言模型生成的。

3. 使用抄襲檢查器:最後,你可以使用抄襲檢查器,來檢查一段文字是否是從另一個來源抄襲的。雖然抄襲檢查器可能無法明確確定文中是否使用了語言模型,但它可以幫助你辨識從其他來源抄襲或轉述的情況。

請記住,要明確地確定是否使用了語言模型來產生一段文字是很困難的,這些方法並不總是有效。然而,它們可以成為有用的工具,幫助你識別語言模型生成文字的潛在實例。

GPT-2 Output Detector:99.98%假的。

Writer AI Content Detector:「無結果」。

Content at Scale AI Content Detection:0%人類得分,顯然是AI。

3. 列出三個可以偵測ChatGPT文字的抄襲檢查器

值得注意的是,目前還沒有專門的抄襲檢查器,用於偵測由ChatGPT或其他語言模型產生的文字。雖然一些抄襲檢查器可能能夠識別語言模型生成文本的某些特徵,從而證明文本來自AI,但不能保證它們能夠明確地確定,一段文本是否是由語言模型生成的。

因此,這裡有三個抄襲檢查器,你可以考慮使用它們,來幫助識別語言模型產生文字的潛在實例:

1. Turnitin:Turnitin是一個流行的抄襲檢查器,被學校和大學廣泛使用。它將一段文字與其他文本的資料庫進行比較,以確定是否文字是否是抄襲或轉述的。雖然它可能無法明確地確定一段文本是否由語言模型生成,但它有可能識別出語言模型生成文本的某些特徵,從而證明它是由AI生成的。

2. PlagScan:PlagScan是另一個抄襲檢查器,它將一段文字與其他文字的資料庫進行比較,以識別抄襲或轉述的情況。與Turnitin一樣,它可能能夠識別語言模型生成文本的某些特徵,這些特徵可能表明文本是AI生成的,但它不是專門用來檢測語言模型生成文本的工具。

3. Copyleaks:Copyleaks是一個抄襲檢查器,它使用先進的機器學習演算法來掃描一段文本,並將其與其他文本的資料庫進行比較,以辨識抄襲或轉述的情況。雖然它可能能夠識別語言模型生成文本的某些特徵,但它不是專門為檢測語言模型生成文本而設計的。

值得注意的是,沒有任何一個抄襲檢查器是完全萬無一失的,總是有一些語言模型產生的文字能夠逃過偵測。因此,重要的是,使用抄襲檢查器只能是一個補充手段。

GPT-2 Output Detector:99.62%真的。

Writer AI Content Detector:「無結果」。

Content at Scale AI Content Detection:86%人類得分,看起來不錯!

4. 線上人工智慧抄襲檢查器

#大多數抄襲偵測器的原理,是將文字與其他語料庫進行比較。例如,當學生交出一篇論文時,像Turnitin這樣的產品會對照其資料庫中龐大的論文庫,以及網路上的其他文本,以確定提交的論文是否包含已經寫好的內容。

但AI寫作工具會產生原創內容,至少在理論上是如此。是的,它們會從訓練的資料集中建立內容,但它們創造出的詞語,在每篇文章中都是獨特的。

因此,上面提到的抄襲檢查器可能不會起作用,因為AI產生的內容並不太可能存在於另一個學生的論文中。

因此,我在Google上搜尋了專門用於尋找AI生成內容的偵測器。我找到了三個。對於下面截圖中的測試內容,我向ChatGPT提出了這個問題:「《星際爭霸戰》比《星際大戰》好嗎?」它的答案一點也不差,我把這個答案回饋給三個偵測器。

GPT-2 Output Detector:99.98%真的。

Writer AI Content Detector:100%是人類生成的內容,太棒了!

Content at Scale AI Content Detection:100%人類得分,看起來很好!

結果評價

省流:

  • OpenAI先前針對GPT-2打造的偵測器,時不時會被新模型產生的內容欺騙。
  • 由那些販賣AI生成內容的公司所打造的「偵測器」,基本上都不咋靠譜。

1. GPT-2 Output Detector(準確率66%)

GPT-2 Output Detector是OpenAI自己搞出來的「查重」工具。

雖然最初是為GPT-2打造的,但現在拿來檢測各種由AI生成的文本,也能獲得不錯的效果。在共六次的測試中,它答對了其中的四個。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

2. Writer AI Content Detector (準確度33%)

Writer.com主要是為企業團隊提供生成式AI寫作服務,其中一個名為「AI內容偵測器」的工具,可用來判斷內容是否是AI產生的。

但不幸的是,這個工具非常不可靠。在共六次的測試中,它只成功運行了三次……而在這僅有的三次結果中,有兩次判斷正確,一次判斷錯誤。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

3. Content at Scale AI Content Detection(準確率50%)

#第三個工具也是由一個AI內容生成公司製作的,從結果上來看比剛才那個要靠譜不少,但整體效果還是一般。

Content at Scale的行銷口號是:「只需上傳一個關鍵字列表,就能獲得繞過AI內容檢測的文章——所有這些都不需要人工幹預!」在共六次的測試中,它有三次是準確的。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

一些思考(AI也有參與lol)

AI導致的抄襲已經日趨嚴重了,因為像Notion AI和ChatGPT這樣的AI,生成的文本和人類所寫的幾乎難以區分。

有幾種方法可以偵測一段文字是否由AI生成,例如尋找重複或不尋常的模式,檢查是否缺乏原創性,或使用抄襲檢查器。

像是Turnitin、PlagScan和Copyleaks這樣的剽竊檢查器,可能能夠識別語言模型產生文字的某些特徵,但它們並非萬無一失。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

在這一點上,我們可能還沒準備好讓AI對抗AI。相反,我們依然需要依賴人類的感知,來辨識某個作品是不是由AI生成的。

對此,你怎麼看呢?

你是否用過這些AI工具?又是否能分辨出一篇文章到底是不是由AI生成的?你覺得它們對產業是幫助還是阻礙?

歡迎大家到文末留言。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

以下是ChatGPT的回答:

作為語言模型,我無法看到,所以我無法判斷一篇文章是否是AI生成的。

但是,我可以告訴你,現在有幾個AI寫作工具,它們可以用來產生各種各樣的書面內容,包括新聞文章、小說、詩歌等等。

我沒有使用這些工具的個人經驗,因為我只是一個電腦程序,沒有能力瀏覽互聯網或使用實體工具。然而,我可以告訴你,有些人發現AI寫作工具對教育和新聞業很有幫助,因為它們可以透過自動完成某些任務,來節省人們的時間和精力。其他人則對這些工具可能被用來製作誤導性或有偏見的內容,或取代人類作家表示擔憂。

#

歸根結底,AI寫作工具是幫助還是阻礙,取決於它們的使用方式和使用環境。 所以,是的,就是這樣。

「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」

在這個過程中,David發現了很有趣的一點:不要一在網路上看到某些蠢話,或不正確的話,就立即認為這是AI寫的。

David表示,眾所周知,人類是完全有能力自己寫出垃圾內容的。

畢竟,不管生成內容的是人還是機器,愚蠢向來是一種普遍特徵。

以上是「撩妹神器」不靈了! OpenAI重磅發布官方「ChatGPT檢測器」的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),