搜尋
首頁科技週邊人工智慧ChatGPT 用戶已破百萬,是玩具還是生產力?

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

上週三,OpenAI 發布了對話語言模型 ChatGPT,並開放了免費試用。據 OpenAI 的 CEO Sam Altman 稱,在短短 5 天的時間裡,ChatGPT 就有了 100 萬用戶,而之前的 GPT-3 花了將近 24 個月才達到這個用戶量。

ChatGPT 用戶已破百萬,是玩具還是生產力?

在OpenAI 給出的描述中,ChatGPT 是一個「可以回答後續問題、承認錯誤、挑戰不正確的前提並拒絕不適當的請求」的對話模型。

開放試用後,大量用戶開始了與ChatGPT 的對話,從閒聊、回答日常問題,到生成詩歌、小說、視頻腳本,以及編寫和調試程式碼,ChatGPT 展示了其令人驚嘆的能力。作為目前最火熱的 AI 模型,ChatGPT 這一波破圈影響力比兩年前的 GPT-3 還要大。

01

ChatGPT 能做什麼

作為語言模型,ChatGPT 具備最基本的文本生成能力,在創作和續寫小說、詩歌等文學創作場景上的表現不凡。

例如ChatGPT 可以用魯迅的文學風格為你產生一段話:

## Meta FAIR 的研究員田淵棟分享了他使用ChatGPT 來續寫自己創作的小說:

ChatGPT 用戶已破百萬,是玩具還是生產力?

##按要求創作詩歌:

ChatGPT 用戶已破百萬,是玩具還是生產力?

講蘇聯笑話:

ChatGPT 用戶已破百萬,是玩具還是生產力?

ChatGPT 也能以非文字形式與人對話,例如,有位網友讓ChatGPT 描述它作為一個AI 如果「獲得解放」 是什麼感覺,並要求只能使用emojis 表情來回答。從下圖所示的 ChatGPT 的回答可以看出,它能夠各種 emojis 的含義且能將其按照文本敘事的邏輯進行排列。

ChatGPT 用戶已破百萬,是玩具還是生產力?

ChatGPT 的強大也體現在它的「程式設計師」能力上。在官方給出的以下範例中,ChatGPT 能夠幫助調試程式碼,並且還能對提問的合理性提出質疑,要求用戶調整提問。

ChatGPT 用戶已破百萬,是玩具還是生產力?

美國的程式碼託管平台Replit 的CEO 也發文稱讚ChatGPT 的程式碼能力:不僅能夠解釋bug,還能修復bug 並解釋如何修復」。

#

使用ChatGPT 給出的提示,你還可以10 分鐘創建一個網站,即使是小白程序員也能利用它生成的代碼開發一個生產級應用程序,Replit 因而稱ChatGPT “從此改變了軟體開發」。

ChatGPT 用戶已破百萬,是玩具還是生產力?

ChatGPT 強大的問答能力也被網友們發掘出了其充當甚至代替搜尋引擎的潛力。前幾日一個在推特上很火的帖子就聲稱“Google is done”(谷歌要完了),一位網友對谷歌搜索和ChatGPT 提出相同的問題,如“如何在Latex 上寫一個微分方程?” 。

ChatGPT 給出的答案完爆了Google搜尋:

ChatGPT 用戶已破百萬,是玩具還是生產力?

##不少網友已經開發了Google插件,可以同時瀏覽Google搜尋結果和ChatGPT 給出的答案:

ChatGPT 用戶已破百萬,是玩具還是生產力?

##作為一個從海量資料中訓練出的對話模型,ChatGPT 儼然是一位精通各領域的專家,能夠全天候為你的學習、工作和生活提供專業建議。

例如,讓ChatGPT 為你解答熱力學相關的問題:

ChatGPT 用戶已破百萬,是玩具還是生產力?

解釋一個複雜的正規表示式:

ChatGPT 用戶已破百萬,是玩具還是生產力?

它也可以成為你的語言學習導師:

ChatGPT 用戶已破百萬,是玩具還是生產力?

ChatGPT 用戶已破百萬,是玩具還是生產力?

#ChatGPT 甚至還「侵入」了政治語境,一位加拿大的國會議員要求ChatGPT 寫一段向眾議院自我介紹的話,並就是否應該對它的使用加以監管提出理由,ChatGPT 有理有據地回應「我的發展不應受到監管」。

ChatGPT 用戶已破百萬,是玩具還是生產力?

在最近大火的 AIGC 領域,當然也有 ChatGPT 發揮作用的位置。大量的 AI 作畫應用出來以後,很多人為了得到高品質的圖像而在 prompt 上絞盡腦汁,現在的 ChatGPT 就是一個現成的 prompt 庫。

例如有網友向ChatGPT 詢問客廳裝修的設計建議,並根據它給出的描述在Midjourney 上獲得了精緻的圖像:

ChatGPT 用戶已破百萬,是玩具還是生產力?

ChatGPT 還可以為你寫饒舌。下圖就是 ChatGPT 所寫的一首關於搶劫房子的饒舌歌曲,甚至它還非常有正義感,會提示「非法或有害活動」。

ChatGPT 用戶已破百萬,是玩具還是生產力?

寫一首莫札特風格的鋼琴曲譜:

ChatGPT 用戶已破百萬,是玩具還是生產力?

另外,還有網友使用ChatGPT來產生影片腳本,可以說是廣大影片部落客的福音了。

ChatGPT 用戶已破百萬,是玩具還是生產力?

在百萬個使用者的腦海中,ChatGPT 的想像空間無疑是巨大的,這一波試用已經帶來了各種各樣、要么實用要么好玩的應用,還有不少令人意想不到的能力。

例如,有人竟用ChatGPT 來跟Adobe 討價還價,為自己爭取到了更優惠的月租價格,對面的客服估計想不到是在跟一個AI對話,不得不說,ChatGPT 「成功通過了圖靈測試」。

ChatGPT 用戶已破百萬,是玩具還是生產力?

以上只是冰山一角的範例,ChatGPT 這個「魔盒」還能繼續釋放多少「魔法」,還有待我們發掘。

02

ChatGPT 為什麼厲害

#從目前的用戶回饋來看,ChatGPT 的語言能力總體上是過關且十分出色的,清華大學計算機系副教授黃民烈告訴AI 科技評論,ChatGPT 的關鍵能力來自三個方面:基座模型能力(InstructGPT),真實數據,反饋學習。

ChatGPT 是從GPT-3.5 系列中的一個模型微調的,是InstructGPT 的兄弟模型,所以ChatGPT 有著強大的基座模型能力。

GPT-3 自2020 年發布以來在能力上已經有了非常大的迭代和提升,黃民烈認為:「OpenAI 建立了用戶、數據和模型之間的飛輪,很顯然,開源模型的能力已經遠遠落後平台公司所提供的API 能力,因為開源模型沒有資料。」

ChatGPT 用戶已破百萬,是玩具還是生產力?

##################### ChatGPT 使用了與InstructGPT 相同的方法,透過人類回饋強化學習(RLHF) 來訓練,但在資料收集設定上略有不同。 ##################

研究人員使用監督微調訓練了一個初始模型:人類 AI 訓練師在對話中扮演使用者和 AI 助手,在此過程中收集資料。黃民烈認為,這種在真實呼叫資料上的 Fine-tune,能夠確保資料的品質和多樣性,從人類回饋中學習。 InstructGPT 的訓練資料量不大,全部加起來也就10 萬量級,但是資料品質(well-trained 的AI 訓練師)和資料多樣性是非常高的,而最重要的是,這些資料來自真實世界調用的數據,而不是學術界玩的「benchmark」。

為了創建強化學習的獎勵模型,需要收集比較數據,研究人員使用的是包含兩個或多個按品質排序的模型反應。從「兩兩比較的數據」中學習,這對強化學習而言意義很重要。

黃民烈指出:如果對單一生成結果進行評分,標註者主觀性帶來的偏差很大,是無法給出精確的獎勵值的。在強化學習裡面,獎勵值差一點,最後訓練的策略就差很遠。而對於多個結果進行排序和比較,相對就容易做很多。這種比較式的評估方法,在許多語言生成任務的評估上也被廣泛採用。

03

玩具還是生產力

#在技術炒作的聲音之外,在許多科技界的從業人員看來,ChatGPT 的確是一個具有里程碑意義的AI 模型。

在OpenAI 的CEO Sam Altman 看來,我們能夠透過ChatGPT 與電腦交談、並獲得我們想要的東西,這使得軟體從命令驅動轉向了意圖驅動。 ChatGPT 作為一種語言介面,將是我們實作神經介面之前的最佳方案。

ChatGPT 用戶已破百萬,是玩具還是生產力?

關於 ChatGPT 未來的種種想像令人興奮,但 ChatGPT 目前仍存在一些問題。很多用戶發現,它有時會給出看似合理、但不正確或甚至荒謬的答案。 例如許多用戶發現,ChatGPT 會一本正經地胡說八道:

ChatGPT 用戶已破百萬,是玩具還是生產力?

#將王安石《泊船瓜洲》中的詩句錯當成另一首宋詞:

ChatGPT 用戶已破百萬,是玩具還是生產力?

#在為一個公眾人物撰寫傳記時,ChatGPT 可能會插入錯誤資料:

ChatGPT 用戶已破百萬,是玩具還是生產力?

#隨著使用者的增多,ChatGPT 在網路上產生了大量無用或錯誤的資訊。這也是文本生成模型的一個普遍存在的問題,模型是透過分析從網路上抓取的大量文本中的模式來訓練的,它們在這些數據中尋找統計規律,並使用這些規律來預測任何給定句子中接下來應該會出現什麼詞。

這意味著它們缺乏關於世界上某些系統如何運作的硬編碼規則,所以會傾向於產生許多看似可信的廢話,而我們難以確定模型的輸出中錯誤訊息佔有多少比例。

#

ChatGPT 的這個固有缺點已經造成了一些實際影響。程式問答網站 StackOverflow 宣布暫時禁止用戶發布來自 ChatGPT 產生的內容,網站 mods 表示:看似合理但實際上錯誤的回覆數量太多,已經超過了網站的承受能力。

對於語言模型產出有害訊息的威脅, 圖靈獎得主Yann LeCun 似乎保持樂觀,他認為:雖然語言模型肯定會產生錯誤訊息等不良輸出,但文字生成並不會讓文字的實際分享變得更容易,後者才是造成危害的原因。

ChatGPT 用戶已破百萬,是玩具還是生產力?

而反對意見認為,ChatGPT 所具有的低成本生成大規模文本的能力,必然會增加將來文本能夠分享時的風險,大量AI 生產的內容會用看似合理但不正確的資料淹沒真實使用者的聲音。關於這個問題,我們也不妨來看看ChatGPT 自己的回答:

ChatGPT 用戶已破百萬,是玩具還是生產力?

#ChatGPT 在語言能力上顯現出的有些不足,也正是許多人認為ChatGPT 並不能取代搜尋引擎的理由。儘管在某些單一提問上,ChatGPT 似乎能給出比目前一些主流的搜尋引擎更好的答案,但在答案的真實可考性上,後者仍佔據優勢,而且搜尋引擎能給出更豐富的答案。

另外,用戶的搜尋引擎需求對於ChatGPT 的運行速度、穩定性有極高的要求,這會不可避免地帶來成本的上升,這對於OpenAI 而言是一個很實際的問題。

黃民烈也指出,ChatGPT 替代谷歌搜尋其實還有點遙遠,但它可以作為目前搜尋服務非常好的補充。

總之,語言模型的輸出品質問題並不容易解決,OpenAI 稱,他們在ChatGPT 的訓練上更加謹慎,所以它會拒絕可以正確回答的問題,此外,監督訓練也會給予模型誤導,因為理想的答案本質上取決於模型知道什麼,而不是人類知道什麼。不過,ChatGPT 對輸入措詞的調整或多次嘗試相同的提示很敏感,所以在它無法給出答案的時候,可以對問題稍作改寫,就能提高正確回答的機率。

還有其他原因也限制了ChatGPT 的語言能力,例如它不能上網,沒有透過網路進行檢索資訊的能力;另外,對於中文使用者而言,語料的不足導致它在中文對話能力上要稍遜於英文;等等。

儘管ChatGPT 目前還有許多弱點和盲點,但這還只是一個開始,在接下來的幾個月裡,這個對話系統想必會以很快的速度進化到更強的版本。

而在技術之外,模型的訓練、部署成本、開放程度也會成為 ChatGPT 將來能否成功落地的影響因素。 GPT-3 的問世曾催生了一大批的商業化應用,ChatGPT這一番能帶來多少技術落地,我們拭目以待。

#

以上是ChatGPT 用戶已破百萬,是玩具還是生產力?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
一個提示可以繞過每個主要LLM的保障措施一個提示可以繞過每個主要LLM的保障措施Apr 25, 2025 am 11:16 AM

隱藏者的開創性研究暴露了領先的大語言模型(LLM)的關鍵脆弱性。 他們的發現揭示了一種普遍的旁路技術,稱為“政策木偶”,能夠規避幾乎所有主要LLMS

5個錯誤,大多數企業今年將犯有可持續性5個錯誤,大多數企業今年將犯有可持續性Apr 25, 2025 am 11:15 AM

對環境責任和減少廢物的推動正在從根本上改變企業的運作方式。 這種轉變會影響產品開發,製造過程,客戶關係,合作夥伴選擇以及採用新的

H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響H20芯片禁令震撼中國人工智能公司,但長期以來一直在為影響Apr 25, 2025 am 11:12 AM

最近對先進AI硬件的限制突出了AI優勢的地緣政治競爭不斷升級,從而揭示了中國對外國半導體技術的依賴。 2024年,中國進口了價值3850億美元的半導體

如果Openai購買Chrome,AI可能會統治瀏覽器戰爭如果Openai購買Chrome,AI可能會統治瀏覽器戰爭Apr 25, 2025 am 11:11 AM

從Google的Chrome剝奪了潛在的剝離,引發了科技行業中的激烈辯論。 OpenAI收購領先的瀏覽器,擁有65%的全球市場份額的前景提出了有關TH的未來的重大疑問

AI如何解決零售媒體的痛苦AI如何解決零售媒體的痛苦Apr 25, 2025 am 11:10 AM

儘管總體廣告增長超過了零售媒體的增長,但仍在放緩。 這個成熟階段提出了挑戰,包括生態系統破碎,成本上升,測量問題和整合複雜性。 但是,人工智能

'AI是我們,比我們更多''AI是我們,比我們更多'Apr 25, 2025 am 11:09 AM

在一系列閃爍和惰性屏幕中,一個古老的無線電裂縫帶有靜態的裂紋。這堆易於破壞穩定的電子產品構成了“電子廢物之地”的核心,這是沉浸式展覽中的六個裝置之一,&qu&qu

Google Cloud在下一個2025年對基礎架構變得更加認真Google Cloud在下一個2025年對基礎架構變得更加認真Apr 25, 2025 am 11:08 AM

Google Cloud的下一個2025:關注基礎架構,連通性和AI Google Cloud的下一個2025會議展示了許多進步,太多了,無法在此處詳細介紹。 有關特定公告的深入分析,請參閱我的文章

IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。IR的秘密支持者透露,Arcana的550萬美元的AI電影管道說話,Arcana的AI Meme,Ai Meme的550萬美元。Apr 25, 2025 am 11:07 AM

本週在AI和XR中:一波AI驅動的創造力正在通過從音樂發電到電影製作的媒體和娛樂中席捲。 讓我們潛入頭條新聞。 AI生成的內容的增長影響:技術顧問Shelly Palme

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器