很多人也許已經忘記,ChatGPT 正式發佈時間是去年11 月底,到現在才剛剛兩個月,但它掀起的熱潮卻已引發科技公司紛紛跟進,催生了獨角獸創業公司,也讓學術界修改了論文接收的要求。
在 ChatGPT 引發 AI 領域「是否要停用」大討論之後,OpenAI 的真假鑑別工具終於來了。
1 月31 日,OpenAI 官方宣布了區分人類作品和AI 生成文本的識別工具上線,該技術旨在識別自家的ChatGPT、GPT-3 等模型生成的內容。然而分類器目前看起來準確性堪憂:OpenAI 在部落格指出 AI 辨識 AI 高置信度正確率約為 26%。但該機構認為,當它與其他方法結合時,可以有助於防止 AI 文字產生器被濫用。
「我們提出分類器的目的是幫助減少人工智慧生成的文本造成的混淆。然而它仍然有一些局限性,因此它應該被用作其他確定文本來源方法的補充,而不是作為主要的決策工具,」OpenAI 發言人透過電子郵件對媒體介紹。 「我們正透過這個初始分類器獲取有關此類工具是否有用的反饋,並希望在未來分享改進的方法。」
最近科技領域隨著圍繞生成式AI,尤其是文本生成AI 的熱情正在不斷增長,但相對的是人們對於濫用的擔憂,批評者呼籲這些工具的創造者應該採取措施減輕其潛在的有害影響。
面對海量的AI 生成內容,一些行業立刻作出了限制,美國一些最大的學區已禁止在其網絡和設備上使用ChatGPT,擔心會影響學生的學習和該工具產生的內容的準確性。包括 Stack Overflow 在內的網站也禁止用戶分享 ChatGPT 產生的內容,並表示人工智慧會讓用戶在正常的討論中被無用內容淹沒。
這些情況突顯了 AI 辨識工具的必要性。雖然效果不如人意,但 OpenAI AI 文字分類器(OpenAI AI Text Classifier)在架構上實作了和 GPT 系列的對標。它和 ChatGPT 一樣是一種語言模型,是根據來自網路的許多公開文字範例進行訓練的。與 ChatGPT 不同的是,它經過微調可以預測一段文字由 AI 產生的可能性 —— 不僅來自 ChatGPT,還包括來自任何文字生成 AI 模型的內容。
具體來說,OpenAI 在來自五個不同組織(包括 OpenAI 自己)的 34 個文本生成系統的文本上訓練了 AI 文本分類器。這些內容與維基百科中相似(但不完全相同)的人工文本、從 Reddit 上共享的連結中提取的網站以及為 OpenAI 文本生成系統收集的一組「人類演示」配對。
需要注意的是,OpenAI 文字分類器不適用於所有類型的文字。被偵測的內容至少需要 1000 個字符,或大約 150 到 250 個單字。它沒有論文檢測平台那樣的查重能力 —— 考慮到文本生成人工智慧已被證明會照抄訓練集裡的「正確答案」,這是一個非常難受的限制。 OpenAI 表示,由於其英語前向資料集,它更有可能在兒童或非英語語言書寫的文本上出錯。
在評估一段給定的文字是否由 AI 產生時,偵測器不會正面回答是或否。根據其置信度,它會將文字標記為「非常不可能」由AI 產生(小於10% 的可能性)、「不太可能」由AI 產生(在10% 到45% 之間的可能性)、 「不清楚它是否是」AI 生成(45% 到90% 的機會)、「可能」由AI 生成(90% 到98% 的機會)或「很有可能」由AI 生成(超過98% 的機會) 。
看起來和影像辨識的 AI 很像,除了準確程度。根據 OpenAI 的說法,分類器錯誤地將人類編寫的文本標記為 AI 編寫的文本的機率為 9%。
一番試用之後,效果的確不大行
OpenAI 宣稱其 AI 文字分類器的成功率約為 26%,一些網友上手試用之後,發現識別效果果然不行。
知名 ML 和 AI 研究人員 Sebastian Raschka 試用之後,給出了「It does not work」的評價。他使用其 2015 年第一版的 Python ML 書籍作為輸入文本,結果顯示如下。
- Randy Olson 的foreword 部分被辨識為#不清楚是否由AI 產生(unclear)
- #他自己的preface 部分被辨識為可能由AI 產生(possibly AI)
- 第一章的段落部分被辨識為很可能由AI 產生(likely AI)
Sebastian Raschka 對此表示,這是一個有趣的例子,但自己已經為將來可能因離譜的論文識別結果而受到懲罰的學生感到難過了。
因此他提議,如果要部署這樣的模型,請共享一個混淆矩陣。不然如果教育者採用此模型進行評分,可能會對現實世界造成傷害。另外也應該增加一些有關誤報和漏報的透明度。
此外,Sebastian Raschka 輸入了莎士比亞《馬克白》第一頁的內容,OpenAI AI 文字分類器給出的結果竟然是很可能由 AI 產生。簡直離譜!
還有人上傳了AI 寫作工具Easy-Peasy.AI 創作的內容,結果OpenAI AI 文字分類器判定為由AI 產生的可能性非常小。
最後,有人用上了重複翻譯大法,把文字讓 GPT3 重寫一遍,也能騙過辨識器。
總結一下的話就是正向辨識不準,反向辨識出錯,也無法識破一些改論文的技巧。看來,起碼在 AI 文字內容辨識這一領域,OpenAI 還需努力。
以上是OpenAI官方推出AI生成內容辨識器,但成功率只有26%,網友:不如論文查重工具的詳細內容。更多資訊請關注PHP中文網其他相關文章!

輕鬆在家運行大型語言模型:LM Studio 使用指南 近年來,軟件和硬件的進步使得在個人電腦上運行大型語言模型 (LLM) 成為可能。 LM Studio 就是一個讓這一過程變得輕鬆便捷的優秀工具。本文將深入探討如何使用 LM Studio 在本地運行 LLM,涵蓋關鍵步驟、潛在挑戰以及在本地擁有 LLM 的優勢。無論您是技術愛好者還是對最新 AI 技術感到好奇,本指南都將提供寶貴的見解和實用技巧。讓我們開始吧! 概述 了解在本地運行 LLM 的基本要求。 在您的電腦上設置 LM Studi

蓋伊·佩里(Guy Peri)是麥考密克(McCormick)的首席信息和數字官。儘管他的角色僅七個月,但Peri正在迅速促進公司數字能力的全面轉變。他的職業生涯專注於數據和分析信息

介紹 人工智能(AI)不僅要理解單詞,而且要理解情感,從而以人的觸感做出反應。 這種複雜的互動對於AI和自然語言處理的快速前進的領域至關重要。 Th

介紹 在當今以數據為中心的世界中,利用先進的AI技術對於尋求競爭優勢和提高效率的企業至關重要。 一系列強大的工具使數據科學家,分析師和開發人員都能構建,Depl

本週的AI景觀爆炸了,來自Openai,Mistral AI,Nvidia,Deepseek和Hugging Face等行業巨頭的開創性發行。 這些新型號有望提高功率,負擔能力和可訪問性,這在TR的進步中推動了

但是,該公司的Android應用不僅提供搜索功能,而且還充當AI助手,並充滿了許多安全問題,可以將其用戶暴露於數據盜用,帳戶收購和惡意攻擊中

您可以查看會議和貿易展覽中正在發生的事情。您可以詢問工程師在做什麼,或諮詢首席執行官。 您看的任何地方,事情都以驚人的速度發生變化。 工程師和非工程師 有什麼區別

模擬火箭發射的火箭發射:綜合指南 本文指導您使用強大的Python庫Rocketpy模擬高功率火箭發射。 我們將介紹從定義火箭組件到分析模擬的所有內容


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

Dreamweaver CS6
視覺化網頁開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3漢化版
中文版,非常好用