搜尋
首頁科技週邊人工智慧2023年第一天,請查收ChatGPT的年終總結!

ChatGPT的橫空出世,可能是2022年下半年最引人注目的AI突破,雖然可能不是技術含量最高的。

前不久,在新奧爾良舉行的2022 NeurIPS上,關於GPT-4的傳言不絕於耳,與此同時,OpenAI也成為全場新聞媒體的焦點。

OpenAI宣布了GPT-3系列AI大型語言模型中的一個新模型:text-davinci-003,這是其「GPT-3.5系列」的一部分,可以透過處理更複雜的指令和產生更高品質、更長形式的內容來改善效能。

2023年第一天,請查收ChatGPT的年終總結!

新模型建立在InstructGPT的基礎上,使用具有人類回饋的強化學習,使語言模型與人類指令更好地保持一致。

達文西-003是一個真正的帶有人類回饋的強化學習(RLHF)模型,它在人類的演示和高分的模型樣本上使用監督微調來提高生成品質。 "

而作為「GPT-3.5系列」的另一部分,OpenAI發布了ChatGPT的早期演示,該公司宣稱,這個互動式的對話模型,不僅可以回答大量的後續問題,還會承認錯誤,對不正確的提問前提提出質疑,拒絕不適當的提問請求。

2023年第一天,請查收ChatGPT的年終總結!

OpenAI在部落格中表示,ChatGPT的研究發布是「OpenAI迭代部署越來越安全和有用的AI系統的最新步驟。它吸取了從GPT-3和Codex等早期模型部署中的許多經驗教訓,在利用人類反饋的強化學習(RLHF)時,有害和不真實的輸出結果大幅減少。

另外,ChatGPT在訓練中強調,它是一個機器學習模型,這可能是出於避免前不久谷歌的聊天機器人LaMDA引發的「AI是否有意識」的爭議。

當然,ChatGPT也有限制。

在部落格文章中,OpenAI詳細介紹了它的局限性,包括有時答案聽起來似乎很有道理,但實際上是不正確或無意義的事實。

「解決這個問題是很有挑戰性的,因為(1) 在強化學習訓練期間,目前沒有保證一定有可靠的來源;(2 ) 訓練模型更加謹慎,會拒絕可能正確回答的問題;(3) 監督訓練可能誤導模型,因為理想的答案取決於模型知道什麼,而不是人類演示者知道什麼。」

Open AI表示,ChatGPT 「有時會對有害的指令做出反應或表現出有偏見的行為。我們正在使用API​​來警告或阻止某些類型的不安全內容,但預計目前會有一些錯誤的否定和肯定。我們非常願意收集用戶的回饋,幫助我們正在進行的工作,改善這個模型」。

雖然ChatGPT可能還有很多亟待改進的問題,但我們不可否認,在GPT-4登場前,ChatGPT仍然是目前大型語言模型的頂流。

不過,在最近的社群中,又有一個新的模式點燃了大家的討論熱情。最關鍵的是,它還是開源的。

本週, 負責對包括Meta的Make-A-Video在內的閉源AI系統進行逆向工程的開發人員Philip Wang發布了PaLM RLHF,這是一種文字生成模型,其行為類似於ChatGPT。

#

2023年第一天,請查收ChatGPT的年終總結!

程式碼位址:https://github.com/lucidrains/PaLM-rlhf-pytorch

該系統結合了Google的大型語言模型PaLM和強化學習與人類回饋(RLHF)技術,創建了一個幾乎可以完成ChatGPT任何任務的系統,包括起草電子郵件和建議電腦程式碼。

PaLm RLHF的力量

#自發布以來,ChatGPT因能夠產生高清晰度的類人文本,並能以對話方式對使用者問題做出回應,因此在科技界掀起了一場風暴。

這雖然是聊天機器人發展初期的重大進步,但人工智慧領域的許多擁躉對ChatGPT的封閉性表示擔憂。

時至今日,ChatGPT模型仍然是專有的,這意味著公眾無法查看其底層程式碼。只有OpenAI真正知道它的工作原理以及它處理的數據。這種缺乏透明度可能會產生深遠的影響,並可能長期影響使用者的信任。

許多開發人員一直渴望建立一個開源替代方案,現在,它終於到來了。 PaLM RLHF是專門為Python語言建構的,可以為PyTorch實作。

開發人員可以像訓練自回歸transformer一樣輕鬆訓練 PaLM,然後使用人類回饋訓練獎勵模型。

和ChatGPT一樣,PaLM RLHF本質上是一種預測單字的統計工具。當從訓練資料中輸入大量範例時——例如來自Reddit的貼文、新聞文章和電子書——PaLM RLHF會根據諸如周圍文字的語義上下文等模式,學習單字出現的可能性。

真有這麼完美?

當然,理想和現實之間還存在著不小的差距。 PaLM RLHF看似完美,卻也有各種問題。其中最大的問題就是,人們現在還不能使用它。

要啟動PaLM RLHF,使用者需要編譯從部落格、社群媒體、新聞文章、電子書等各種來源取得的千兆位元組文字。

這些資料被提供給經過微調的PaLm模型,該模型將產生幾個回應。例如,如果詢問模型「經濟學的基礎知識是什麼」,PaLm會給出諸如「經濟學是研究…的社會科學」之類的答案。在

之後,開發者會請人對模型產生的答案從好到差進行排名,並建立一個獎勵模型。最後,排名用於訓練「獎勵模型」,該模型採用原始模型的回應並按偏好順序對它們進行排序,過濾出給定提示的最佳答案。

然而,這是一個昂貴的過程。收集訓練資料和訓練模型本身並不便宜。 PaLM有5400億個參數,也就是語言模型從訓練資料中學習到的部分。 2020年的一項研究表明,開發一個只有15億個參數的文本生成模型的費用高達160萬美元。

今年7月,為了訓練擁有1760億個參數的開源模型Bloom,Hugging Face的研究人員耗時三個月,使用了384個英偉達A100 GPU。每個A100的價格高達數千美元,這不是任何普通用戶所能負擔的成本。

此外,即使完成了模型的訓練,運行PaLM RLHF大小的模型也不是件易事。 Bloom配備了八個A100 GPU的專用PC,而OpenAI的文字產生GPT-3(約 1,750 億個參數)的運作成本約為每年87,000美元。

#

AI研究人員Sebastian Raschka在一篇關於PaLM RLHF的文章中指出,擴大必要的開發工作流程也可能是一個挑戰。

「即使有人為你提供500個GPU來訓練這個模型,你仍然需要處理基礎設施並擁有可以處理的軟體框架,」他說。 「這雖然可行,但目前來看,需要付出很大的努力。」

下一個開源ChatGPT

高昂的費用和龐大的規模都表明,如果沒有資金雄厚的企業或個人不厭其煩地訓練模型,PaLM RLHF目前還沒有取代ChatGPT的能力。

到目前為止,沒有任何關於PaLM RLHF確切的發布日期。作為參照,Hugging Face訓練Bloom花了三個月的時間。相較之下,擁有5,400億參數的PaLM RLHF可能需要等待6-8 個月的時間才能誕生一個有意義的版本。

好消息是,到目前為止,我們有三個已知的玩家在開發這個開源版ChatGPT的替代方案:

  • #CarperAI
  • #LAION
  • Yannic Kilcher

CarperAI計畫與EleutherAI和新創公司Scale AI和Hugging Face合作,發布第一個可立即運行的、類似ChatGPT的AI模型,該模型經過人類回饋訓練。

2023年第一天,請查收ChatGPT的年終總結!

程式碼位址:https://github.com/CarperAI/trlx

LAION是為Stable Diffusion提供初始資料集的非營利組織,它也率先開展了一個使用最新機器學習技術複製ChatGPT的專案。

2023年第一天,請查收ChatGPT的年終總結!

程式碼位址:https://github.com/LAION-AI/Open-Assistant

LAION旨在打造一個「未來助理」,不僅能寫電子郵件和求職信,還能「做有意義的工作、使用API​​、動態研究資訊等」。它處於早期階段,但是幾週前,一個包含相關資源的專案已在GitHub上線。

而由油管網紅、AI研究人員Yannic Kilcher創建的GPT-4chan,更像是「出淤泥而全染」的嘴臭達人。

該模型中的「4chan」是一個美國線上匿名論壇,因網友身分皆為匿名,許多人便無所畏懼,發表各種政治不正確的言論。而Kilcher正式用4chan上的貼文對模型進行訓練,其結果可想而知。

與論壇總基調類似,GPT-4chan的回答充斥著種族歧視、性別歧視和反猶太主義。不僅如此,Kilcher還將其底層模型發佈到Hugging Face供他人下載。不過在許多AI研究人員的聲討下,官方很快就限制了網友對此模型的存取。

在我們期待更多開源語言模型出現的同時,現在我們能做的只有等待。當然,繼續免費使用ChatGPT 也是個好主意。

值得注意的是,在任何開源版本正式登場之前,OpenAI在開發方面仍遙遙領先。而2023年,GPT-4無疑是全世界AI愛好者翹首以盼的對象。

#

無數AI大佬都對其做出了自己的預測,這些預測或好或壞,但就像OpenAI首席營運長Sam Altman所言:「通用人工智慧的建成會比大多數人想像得更快,並且它會改變大多數人想像中的一切。」

以上是2023年第一天,請查收ChatGPT的年終總結!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
您必須在無知的面紗後面建立工作場所您必須在無知的面紗後面建立工作場所Apr 29, 2025 am 11:15 AM

在約翰·羅爾斯1971年具有開創性的著作《正義論》中,他提出了一種思想實驗,我們應該將其作為當今人工智能設計和使用決策的核心:無知的面紗。這一理念為理解公平提供了一個簡單的工具,也為領導者如何利用這種理解來公平地設計和實施人工智能提供了一個藍圖。 設想一下,您正在為一個新的社會制定規則。但有一個前提:您事先不知道自己在這個社會中將扮演什麼角色。您最終可能富有或貧窮,健康或殘疾,屬於多數派或邊緣少數群體。在這種“無知的面紗”下運作,可以防止規則制定者做出有利於自身的決策。相反,人們會更有動力製定公

決策,決策……實用應用AI的下一步決策,決策……實用應用AI的下一步Apr 29, 2025 am 11:14 AM

許多公司專門從事機器人流程自動化(RPA),提供機器人以使重複的任務自動化 - UIPATH,在任何地方自動化,藍色棱鏡等。 同時,過程採礦,編排和智能文檔處理專業

代理人來了 - 更多關於我們將在AI合作夥伴旁邊做什麼代理人來了 - 更多關於我們將在AI合作夥伴旁邊做什麼Apr 29, 2025 am 11:13 AM

AI的未來超越了簡單的單詞預測和對話模擬。 AI代理人正在出現,能夠獨立行動和任務完成。 這種轉變已經在諸如Anthropic的Claude之類的工具中很明顯。 AI代理:研究

為什麼同情在AI驅動的未來中比控制者更重要為什麼同情在AI驅動的未來中比控制者更重要Apr 29, 2025 am 11:12 AM

快速的技術進步需要對工作未來的前瞻性觀點。 當AI超越生產力並開始塑造我們的社會結構時,會發生什麼? Topher McDougal即將出版的書Gaia Wakes:

用於產品分類的AI:機器可以總稅法嗎?用於產品分類的AI:機器可以總稅法嗎?Apr 29, 2025 am 11:11 AM

產品分類通常涉及復雜的代碼,例如諸如統一系統(HS)等系統的“ HS 8471.30”,對於國際貿易和國內銷售至關重要。 這些代碼確保正確的稅收申請,影響每個INV

數據中心的需求會引發氣候技術反彈嗎?數據中心的需求會引發氣候技術反彈嗎?Apr 29, 2025 am 11:10 AM

數據中心能源消耗與氣候科技投資的未來 本文探討了人工智能驅動的數據中心能源消耗激增及其對氣候變化的影響,並分析了應對這一挑戰的創新解決方案和政策建議。 能源需求的挑戰: 大型超大規模數據中心耗電量巨大,堪比數十萬個普通北美家庭的總和,而新興的AI超大規模中心耗電量更是數十倍於此。 2024年前八個月,微軟、Meta、谷歌和亞馬遜在AI數據中心建設和運營方面的投資已達約1250億美元(摩根大通,2024)(表1)。 不斷增長的能源需求既是挑戰也是機遇。據Canary Media報導,迫在眉睫的電

AI和好萊塢的下一個黃金時代AI和好萊塢的下一個黃金時代Apr 29, 2025 am 11:09 AM

生成式AI正在徹底改變影視製作。 Luma的Ray 2模型,以及Runway的Gen-4、OpenAI的Sora、Google的Veo等眾多新模型,正在以前所未有的速度提升生成視頻的質量。這些模型能夠輕鬆製作出複雜的特效和逼真的場景,甚至連短視頻剪輯和具有攝像機感知的運動效果也已實現。雖然這些工具的操控性和一致性仍有待提高,但其進步速度令人驚嘆。 生成式視頻正在成為一種獨立的媒介形式。一些模型擅長動畫製作,另一些則擅長真人影像。值得注意的是,Adobe的Firefly和Moonvalley的Ma

Chatgpt是否會慢慢成為AI最大的Yes-Man?Chatgpt是否會慢慢成為AI最大的Yes-Man?Apr 29, 2025 am 11:08 AM

ChatGPT用户体验下降:是模型退化还是用户期望? 近期,大量ChatGPT付费用户抱怨其性能下降,引发广泛关注。 用户报告称模型响应速度变慢,答案更简短、缺乏帮助,甚至出现更多幻觉。一些用户在社交媒体上表达了不满,指出ChatGPT变得“过于讨好”,倾向于验证用户观点而非提供批判性反馈。 这不仅影响用户体验,也给企业客户带来实际损失,例如生产力下降和计算资源浪费。 性能下降的证据 许多用户报告了ChatGPT性能的显著退化,尤其是在GPT-4(即将于本月底停止服务)等旧版模型中。 这

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具