搜尋
首頁科技週邊人工智慧ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具

語言生成模型來了,學校的作業會不會從此變得形同虛設?近日,紐約市教育官員宣布禁止學生在公立學校使用 ChatGPT 的事件引發了爭論。

語言模型自動生成的內容會「參考」現有作品,產出的速度又幾乎無限,人們對其的擔憂已經蔓延到了AI 學界自身,全球知名機器學習會議之一的ICML 最近也宣布禁止發表包含由ChatGPT 和其他類似系統產生內容的論文,以免出現「意外後果」。

對於這樣的情況,ChatGPT 的提出者 OpenAI 已宣布正在努力開發「緩解措施」,幫助人們檢測由 AI 自動產生的文字。

ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具

「我們將ChatGPT 作為新研究的預覽技術,希望能從現實世界的應用中學習。我們認為這是開發和部署功能強大、安全的AI 系統的關鍵部分。我們會不斷吸取反饋和經驗教訓,」該公司發言人表示。 「OpenAI 一直呼籲在使用AI 生成的文本時要保持透明。我們的使用條款要求用戶在使用我們的API 和創意工具時,首先對其面向的人群負責……我們期待與教育工作者合作制定有效的解決方案,幫助教師和學生等人群尋找從AI 中受益的方法。」

#如果出現了能夠區分人類和機器產生內容的演算法,生成模型在學術界的使用方式或許會出現改變。學校將能夠更有效地限制人工智慧產生的論文,如果人們的態度發生轉變,轉而期待這些工具能夠幫助學生,或許我們也可以逐漸接受使用 AI 進行輔助的方式,提高工作學習的效率。

現在看起來,眼前還有很長的一段路要走。儘管 AI 產生的文字內容在學術會議和學校禁止機器寫論文作弊的新聞中看起來令人印象深刻,但你需要知道,與真正的人類寫作相比,它們時常缺乏真正的理解與邏輯。

當像GPT-3 或ChatGPT 這樣的工具透過給出令人震驚的詳細答案而讓人感到驚訝時,也有冷靜的專家表示這證明了模型能夠編碼知識,但當它們無法正確處理事情時,給出的答案往往很離譜。波莫納學院 (Pomona College) 經濟學教授 Gary Smith 提醒我們,不要上當。

在一篇專欄文章中,Gary Smith 展示了幾個GPT-3 無法有效推理和回答問題的例子,「如果你嘗試使用GPT-3,你最初的反應可能是驚訝——似乎是在與一個非常聰明的人進行真正的對話。然而深入探究後,你很快就會發現雖然GPT-3 可以用令人信服的方式將單字串在一起,但它並不知道單字的意思。」

「預測down 這個字有可能跟在fell 這個字後面,並不要求對這兩個字的意思有任何理解。只是透過統計層面的計算,AI 就能認為這些字經常在一起。因此,GPT-3 很容易做出完全錯誤,但又武斷的聲明。」

OpenAI 在2022 年11月發布了ChatGPT,這是一個較新的模型,基於GPT-3 進行了改進。儘管如此,它仍然存在著這些相同的問題,就像所有現有的語言模型一樣。

如何用 AI 偵測 AI 產生的文字?

曾幾何時,AI 產生的文字內容還是「一眼假」,但自從 ChatGPT 橫空出世以來,這種分辨工作是越來越難做了。

在教育領域,ChatGPT 的爭論主要圍繞著作弊的可能性。在Google上搜尋「ChatGPT 寫論文」,你能發現大量教育工作者、記者和學生透過使用 ChatGPT 完成家庭作業和標準化論文測驗來試水的例子。

《華爾街日報》的專欄作家曾使用 ChatGPT 撰寫了一篇能拿及格分的 AP 英語論文,而《福布斯》記者則利用它在 20 分鐘內完成了兩篇大學論文。亞利桑那州立大學教授 Dan Gillmor 在接受《衛報》採訪時回憶說,他嘗試給 ChatGPT 佈置一道給學生的作業,結果發現 AI 生成的論文也可以獲得好成績。

目前,已經有開發者製作了針對ChatGPT 產生內容的偵測工具-「GPTZero」,只需要將內容貼在輸入框,就能在幾秒鐘之內得到分析結果,快速檢測出一篇文章是ChatGPT 還是人工撰寫的。

ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具網友評:世界各地的學生看到後都哭了。

作者是普林斯頓大學的學生 Edward Tian,他利用假期的一部分時間編寫了 GPTZero。

ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具

讓我們來看看偵測過程,先以一段《New Yorker》的報導內容為例(百分之百確定由人類寫作):

ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具

再看一段由ChatGPT 產生的內容接受偵測:

ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具

# #GPTZero 應用程式的原理是藉助一些文字屬性進行分析。首先是困惑度(perplexity),即文本對模型的隨機性,或語言模型對文本的「喜愛」程度;然後是突發度(burstiness),即機器寫作的文本在一段時間內表現出的困惑度更均勻和恆定,而人類書寫的文本則不會這樣。

ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具GPTZero:「同學們,對不起!教導們,不客氣!」

根據《衛報》報導,OpenAI 目前正在開發一項功能,用於統計ChatGPT 輸出結果的「浮水印」,以便閱讀器可以在AI 文字選擇中發現隱藏模式。

在德州大學的演講中,OpenAI 客座研究員 Scott Aaronson 表示,該公司正在研究一種透過「對輸出進行統計浮水印」來打擊作弊的系統。 Aaronson 說,這項技術將透過微妙地調整ChatGPT 選擇的特定單字選擇來發揮作用,讀者不會注意到這種方式,但對於任何尋找機器生成文字跡象的人來說,這在統計上都是可預測的。

「我們實際上有一個浮水印方案的工作原型了,」Aaronson 補充道。 「它似乎表現得很好——根據經驗,幾百個字似乎足以得到一個信號:是的,這段文本來自GPT。」

雖然面臨人們的擔憂,但有關ChatGPT 的應用也在快速鋪開。在許多場景中,人們不想與無法理解簡單查詢的聊天機器人對話,什麼都可以說上兩句話的 ChatGPT 可以解決這個問題。總部位於多倫多的 Ada 已與 OpenAI 合作把 GPT-3.5,ChatGPT 背後的大模型應用在了客服聊天機器人上,完成了 45 億次客戶服務互動。

根據 The Information 報導,微軟也與 OpenAI 簽訂了獨家授權協議,並計劃將該技術整合到 Bing 搜尋引擎中。

ChatGPT 正在模擬真人的道路上加速前進,這場打假的戰役還會繼續下去。

以上是ChatGPT作弊成風引擔憂,OpenAI:正在自研審核工具的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
烹飪創新:人工智能如何改變食品服務烹飪創新:人工智能如何改變食品服務Apr 12, 2025 pm 12:09 PM

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

Python名稱空間和可變範圍的綜合指南Python名稱空間和可變範圍的綜合指南Apr 12, 2025 pm 12:00 PM

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

視覺語言模型(VLMS)的綜合指南視覺語言模型(VLMS)的綜合指南Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容Apr 12, 2025 am 11:52 AM

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

生成的AI遇到心理摩托車生成的AI遇到心理摩托車Apr 12, 2025 am 11:50 AM

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

原型:科學家將紙變成塑料原型:科學家將紙變成塑料Apr 12, 2025 am 11:49 AM

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

AI分析師的崛起:為什麼這可能是AI革命中最重要的工作AI分析師的崛起:為什麼這可能是AI革命中最重要的工作Apr 12, 2025 am 11:41 AM

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能