在 GitHub 上,AutoGPT 的 star 量已經破 10 萬。這是一種新型人機互動方式:你不用告訴 AI 先做什麼,再做什麼,而是給它設定一個目標就好,即使像「創造世界上最好的冰淇淋」這樣簡單。類似的項目還有 BabyAGI 等等。這股自主智能體浪潮意味著什麼?它們是怎麼運作的?它們在未來會是什麼樣子?現階段如何嘗試這項新技術?在這篇文章中,Octane AI 執行長、聯合創始人 Matt Schlicht 進行了詳細介紹。
人工智慧可以用來完成非常具體的任務,例如推薦內容、撰寫文案、回答問題,甚至產生與現實生活無異的照片。你告訴 AI 要完成哪一項任務,它就完成哪一項, 十分簡單。
但是,如果你不想幫 AI 把所有這些任務都列出來該怎麼辦?如果你更想要一個隊友而不僅僅是一個工具怎麼辦?如果你想讓人工智慧自主思考怎麼辦?
想像一下,你創造了一個人工智慧工具,可以為其設定目標,即使是像「創造世界上最好的冰淇淋」這樣模糊的目標,它也會擬出待辦事項列表,執行待辦事項,並根據進度來添加新的待辦事項。隨後它會繼續重複這個過程,直至完成目標。
這正是「自主智能體」所做的事。在 AI 開發人員的圈子中,它們的成長趨勢是最快的,但迄今為止,大多數人並不了解它們。 (在寫這篇文章的時候,尚無主流出版物寫過關於自主智能體的文章。而且自它面世以來,僅有很少數人報道過它,因此,如果你正在讀這篇文章.. .... 那麼你就是最早了解到它的人之一了。)
何為自主智能體?為何它們背後隱藏著巨大的機會?它們是如何運作的?它們在未來會是什麼樣子的?我怎樣才能創造或使用它?
這正是我將為你解答的問題。
“[智能] 自主智能體通常是自動化的自然終點。原則上,智能體可被用於自動化任何其他過程。不難想像,一旦這些智能體變得高度精密、可靠,各領域和行業的自動化程度將呈指數級增長。” —— 英偉達機器學習專家Bojan Tunguz
何為自主智能體?
自主智能體是由 AI 賦能的程式。當給定一個目標時,它們能夠自行建立任務、完成任務、建立新的任務、重新確定任務清單的優先順序、完成新的首要任務,並不斷重複這個過程,直到完成目標。
請再多讀一遍上面的描述,它雖然簡單,但卻很瘋狂。
「從自主智能體的發展趨勢來看,每個人都有望成為經理。」—BabyAGI 創始人中島洋平(Yohei Nakajima)
#自主智能體可以被設計用於做任何事情,從管理社交媒體帳戶、投資市場到製作最好的兒童讀物。
「這些是真的嗎?現在就能實現嗎」
#是的,我知道這聽起來像科幻小說,但這些都是真實存在的。如果會編碼,你可以在幾分鐘內設計出一個。而這僅僅只是開始。
「人們常常會浪費過多的時間來做繁瑣乏味的手工工作,而當電腦可以完成這些工作時,人們便可以被解放出來去實現更具創造性的追求,或者去做目前只有人類才能做的事情。自主智能體將使人們能夠在更短的時間內完成更多的工作,並且,隨著時間的推移,人們盯著屏幕工作的時間也有望縮短!」 — —Redpoint 常務董事Erica Brescia
實現自主智能體所需的程式設計技術和AI 是非常現實且極為新穎的。許多開源項目,諸如 AutoGPT、BabyAGI 和 Microsoft 的 Jarvis,在 AI 社群、Github 上都很受歡迎。
在創建開源自主智能體程式碼庫的前兩周里,有將近十萬名開發人員都在建立自主智能體、優化它們、並尋找它們的能力上限,而這些工作也只是在這些概念在發明的前幾週所做的。現今,使用該技術的開發人員數量正以越來越快的速度飆升。
「AI 智能體將無所不在。價值數十億美元的公司會將從會一個部署AI 智能體的小團隊發展而來。」 -Ben's Bites AI Newsletter 創辦人Ben Tossell
AI 智能體的成長規模已經超過了長期流行的程式庫,如laravel、bitcoin、django 和pytorch 等。
Auto-GPT Github 受歡迎程度呈指數成長,比歷史上任何程式碼庫都快。
這不是科幻小說。許多人認為這些自主智能體才是真正的通用人工智慧的開端,又或被稱作「AGI」—— 這個術語用於描述已經獲得知覺並變得「有生命」的人工智慧。
「自主智能體最終可能會將事實性知識的所有應用商品化。如果事實性知識的獲取也變得普遍可用,那麼創造力、情感和策略眼光等人類特質將變得更加珍貴、獨特。但是,知識也有可能變得越來越專有化,因為個人和公司試圖在事實知識的應用商品化、人類集體知識開始停滯的世界中獲得經濟利益優勢。 」 ——前美國聯邦調查局新興技術代理主管、Bondoo AI 聯合創始人Tony Hu
請看一下這個剛剛從HyperWrite 發布的自主智能體,你可以看到它被安裝在了瀏覽器中,可幫助人們訂購比薩。
你只需說「點一份從 Dominos 配送到 One Vanderbilt 的無餡料大披薩」,然後它就可以自己訂了。
HyperWrite's 的自主智能體控制瀏覽器來訂購披薩。
或者,看看史丹佛大學和Google合作完成的這個實驗,他們創建了一個由25 個自主智能體組成的虛擬城鎮,並告訴其中的一個來舉辦情人節派對。這個例子也許更令人印象深刻。
這些自主智能體模擬的人們過著它們的日子,互相交談,形成新的記憶,最終它們中的大多數都聽說了情人節派對,並且最終出席了。
原始碼:《Generative Agents: Interactive Simulacra of Human Behavior》
##所以自主智能體是真的… 這就引出一個疑問:只要告訴智能體目標是什麼,然後它就會永遠自行管理自己嗎?
答案是肯定的。
你只要給它定一個目標,剩下的就會由自主智能體自己完成。它就像一個非常好的員工或隊友。不過,如果你願意,也可以自行設計自主智能體,使其在某些關鍵決策時刻與你聯繫,以便你可以即時協作指導它們工作。
「這是原始AGI(primitive AGI)。值得注意的是,只需將一個LLM 包裝在一個循環中,就可以獲得一個自主智能體,它可以自己推理、計劃、思考、記憶和學習。如果包裝和prompts 正確,LLM 可以被激發出無盡的潛能和靈活性。雖然整個概念誕生還不到一個月時間,但我已迫不及待地想看看由LLM 構建的複雜智能體將如何影響世界。」 ——Runway 創辦人兼CEO 陳思琪
自主智能體除了能分析目標並分配任務之外,它們還擁有一系列能力,例如:
- 瀏覽互聯網、會使用應用程式;
- #長期和短期記憶;
- 控制你的電腦;
- 運用GPT 等大語言模型(LLM) 進行分析、總結,提出意見並給予答案。
此外,這些自主智能體將具有各種形狀和大小。有些將在用戶不知道他們在做什麼的情況下在幕後運行,而有些則是可見的,如上例所示,用戶可以追蹤人工智慧的每一個 「想法」。
「自主智能體會讓每個人都像國家元首一樣生活!你只管提出要求,自主智能體就會處理其餘的事情。你無需在例行公事或平凡的事情上浪費腦力。」 -《Blitzscaling 》作者之一Chris Yeh
接下來我們用一個簡單易懂的例子來說明:假設有一個自主智能體可以幫助研究,我們想要關於某個主題的最新新聞總結,比如說關於Twitter 的新聞:
- 我們告訴智能體「你的目標是找出有關Twitter 的最新消息,然後向我發送摘要」;
- 因此,智能體在看到目標任務後,借助OpenAI 的GPT-4 等AI,從而理解正在閱讀的內容,並提出第一個任務,即「任務:在Google上搜尋與Twitter 相關的新聞」;
- 然後智能體在Google上搜尋Twitter 新聞,找到熱門文章,並傳回連結清單。第一個任務完成;
- 繼而智能體回顧它的主要目標(找到關於Twitter 的最新消息,然後發送摘要)以及它剛剛完成的事情(得到一堆關於Twitter的新聞連結)並決定它的下一個任務需要是什麼;
- 之後,它提出了兩個新任務:1)寫新聞摘要。 2) 閱讀透過Google找到的新聞連結的內容;
- 現在智能體在繼續工作之前停頓了一會兒,它需要確保這些任務的順序是正確的。確定應該先寫摘要嗎?智能體否定了,它決定首要任務是優先閱讀透過Google找到的新聞連結的內容;
- 智能體從文章中讀取內容,然後再次返回待辦事項清單。它想添加一個新任務來總結內容,但該任務已經在待辦事項列表中,所以自主智能體並沒有添加;
- 智能體檢查待辦事項列表,唯一剩下的一項就是總結它閱讀的內容,所以它這樣做了。此時它就會按照使用者要求發送摘要。
下圖表展示了自主智能體是如何運作的:
圖源:Yojei Nkajima 的BabyAGI
這個新範式剛開始,但它並不完美,還未風靡全球,但這個概念非常強大,並且隨著不斷的發展和實驗,它將很快融入我們的日常生活。
「這很快就會改變許多產業。透過使用自主智能體,人們同時可以更輕鬆地做很多事情。只要給它一個任務,它就會去完成。到目前為止,這是一個非常強大的概念… 」—The AI Valley Newsletter 創辦人Barsee
#在更高程度上理解了什麼是自主智能體之後,接下來討論為什麼自主智能體能夠帶來如此大的機會?
讓我們深入探討。
「如果我們能夠更快地獲得我們需要的信息,這是否會讓我們騰出時間來專注於思考和做事?由於這個AI 智能體可以執行更多任務,人們可以投入更少的時間在那些繁瑣的工作上,那麼人們是否會出現更好、更有創意的想法?」— Octane AI 客戶管理總監 Marina Pérez
#為何自主智能體能帶來如此大的機會
很明顯,很快你不僅可以選擇僱用人類作為員工,而且還可以以自主智能體的形式僱用AI。「過不了多久,我相信你會看到結合使用AutoGPT 和ChatGPT 等工具的1 至2 人的新創公司數量會大幅增加。它們將能夠取得你之前對100人們規模的新創公司所期望的那種進步。從長期來看,我相信大多數工作可以且將被AutoGPT 取代。」 ——Lore 創辦人Nathan Lands
而且它們不會像僱用人類一樣昂貴,它們不會睡覺、不會辭職,而且會非常有效率地工作。「我在2013 年創立Product Hunt 時的部分觀點是相信建立軟體產品的障礙將繼續降低,能夠使較小的團隊(或單一人)比之前任何時候都更快地創立軟體。在人工智慧和自主智能體的推動下,這種事情沒有任何時候會比今天更為真實。這給一些人帶來了焦慮,也給其他人帶來了機會,他們利用這項科技以更少的人員和資金來擴展實現他們的想法。最終,消費者將透過企業間不斷激烈的競爭和新解決方案的不斷提出而受益。」 ——Weekend Fund 和ProductHunt 創辦人Ryan Hoover
這些自主智能體將存在於每個產業並可運用在每項可以想像的任務中。下圖展示的只是少數幾個例子:#該清單可以不斷加長。 人可以做的事情,自主智能體將(最終,但很快,而且在某些情況下已經)能夠做得更好。
「音樂產業在藝術家和成功之間強加了太多不必要的事務。這些事務花費了藝術家近35% 的淨收入。自主智能體將能夠制定和執行行銷策略、與粉絲互動、建立社群、預訂場地和談判合約等。為藝術家節省金錢和時間。」 ——Venice Music 聯合創始人、Lady Gaga 前經理人Troy Carter
#該如何抓住機會呢?有兩個非常現實的機會。
自己創建自主智能體並讓它們可供其他人僱用;
聘請自主智能體,現在可以協助提高你的個人生活品質或業務工作效率。
「自主智能體是下一波浪潮—— 不僅在科技領域,而且在整個商業領域。我預測在10 年內,將有多家價值數十億美元的公司完全由自主智能體經營。這是不可避免的。 」—Octane AI 聯合創始人兼總裁Ben Parr
#想像這樣一個世界,其中一個人建立了一家公司,其團隊中只有自主智能體。在你的一生中,你很可能會看到一個人的團隊能夠做到這一點並實現超過 10 億美元的市值,而這通常需要非常多的人一起工作才能完成。
「大規模個人化將成為一個非常有趣的用例。你將能夠獨立操控人類今天執行的自動駕駛多步驟流程,包括產生個人化圖像、影片、網站、甚至電子郵件甚至大規模通話。其中一個能夠引起很大興趣的用例是銷售開拓。」 —Meta 人工智慧產品負責人Omar Pera
######現在,在早期階段,先行者們無論是製造自主智能體還是使用它們,都將在與尚未利用這些系統的競爭者中取得巨大優勢。
「在不久的將來,我希望看到午餐會議、電話和訪談出現在我的日曆上,而無需我參與製定。我的智能體和他們的智能體都能做到這一點,處理好所有細節。我只需要出席即可。」— 紐約時報暢銷書《WOOL》作者Hugh Howey
透過閱讀這篇文章,你將早已領先世界99% 的人。讓我們深入探索更多關於這些自主智能體如何運作的細節。
「自主智能體有潛力增強較小的內容創作者和社群成員的產出,尤其是那些具有創造性想像力的人。這將是許多Web3 計畫的福音。(「 Web3.0” 是對現在的互聯網的底層協議“萬維網” 的一個衍生。它意味著機器能讀懂任何信息,網站可以根據信息提供智能刪选和提供更好的信息(人工智能),互聯網無處不在(物聯網),更重要的是,網路的資料的所有權將是去中心化的。) 」— Axie Infinity 共同創辦人Jeffrey Zirlin
- ##自主智能體是如何運作的
- 你已經大致了解了自主智能體的工作原理,但我認為給你提供一個整體框架版本並逐步分解幾個自主智能體範例會很有幫助。
- 「我現在將AI 視為一個整體,我們正處於將其演變成人工智慧助理的建構階段,就像我們在電影中看到的那樣—— 例如《鋼鐵人》中的賈維斯或《星際效應》中的TARS。
- 現在是建造框架的時候了。因為AI 本身仍在改進,給出的答案可能不是很完美,還可能有錯誤。但回顧過去6 個月人工智慧的進步有多大,我想我們幾乎無法想像未來1-2 年的AI 的進展。所以這是關於儘早、快速地進行試驗,放眼未來未雨綢繆的舉措。 」 ——微軟消費者洞察員Jenny Reece
- 以下是一個自主智能體的通用框架:
###################################################################################################################################################### ########初始化目標:定義AI 的目標;############任務創建:AI 檢查其記憶中最近完成的X 個任務(如果有),然後使用它的目標和最近完成的任務的環境來產生新任務清單;############任務執行:AI 自主執行任務;############記憶體儲存:任務和執行結果儲存在向量資料庫中;############回饋收集:AI 以外部資料或AI 內部對話的形式收集對已完成任務的回饋。此回饋結果將用於通知自適應過程循環的下一個迭代;############新任務生成:人工智慧根據收集到的回饋和內部對話產生新任務;#### ########任務優先順序:人工智慧透過審查目標並查看最後完成的任務來重新確定任務清單的優先順序;############任務選擇:AI 從優先清單中選擇最靠前的任務,然後按照步驟3 中的描述繼續執行它們;#############迭代:AI 在連續循環中重複步驟4 到8,使系統能夠根據新資訊、回饋和不斷變化的需求進行調整。 ###############Octane AI 工程總監Gabriel Menezes 表示:「自主智能體真的讓我著迷,因為它們體現了終極生產力助推器的屬性。作為一個高度重視單調工作或重複性任務自動化的人,我發現這些智能體有可能徹底改變我們的工作方式,使我們能夠將我們的精神能量轉向更有意義的追求。」#########範例展示############範例1:社群媒體管理器自主智能體##########
假設你不想聘請社群媒體經理來管理你的社群媒體帳戶,而是希望自主智慧體以極低的成本和全天候的智慧為你做所有事情。
「這不僅僅是虛擬助理。這是一場加速所有線上工作、研究甚至娛樂的革命。以前需要花費數小時、數天、數月才能在網路上完成的事情,現在可以在幾分鐘內在後台完成。」 ——史丹佛大學CS 教員和Google 前機器學習產品經理 Sharon Zhou
以下是自主智能體框架可能的樣子:
- #初始化目標:設定初始參數,例如目標受眾、社群媒體平台、內容類別和發布頻率;
- 資料收集:收集有關過去社群媒體貼文、用戶互動和平台特定趨勢的數據。這可能包括按讚、分享、評論和其他參與度指標;
- 內容分析:分析收集到的數據,以確定與目標受眾相關的模式、熱門話題、主題標籤和影響者。此步驟可能涉及自然語言處理和機器學習技術,以理解內容及其上下文;
- 內容創建:根據分析,產生內容創意並創建適合平台和受眾偏好的社交媒體貼文。這可能涉及使用AI 生成文本、圖像或視頻,以及合併用戶生成的內容或來自其他來源的精選內容;
- 日程規劃:根據平台具體的趨勢、受眾活動和所需頻率決定發布每個內容的最佳時間。相應地安排貼文;
- 效能監控:根據參與度指標(例如按讚、分享、留言和點擊率)追蹤每個貼文的表現。如果可能,收集使用者回饋以進一步完善對受眾偏好的理解;
- 迭代和改進:分析效能數據和使用者回饋以確定需要改進的地方。更新內容策略、創建和規劃流程以納入這些見解。重複執行步驟 2-7 以持續改善社群媒體管理系統並隨著時間的推移提高其有效性。
「人們將擁有個人智能體從而與其他人以及企業擁有的智能體進行通信。大多數計算設備將主要用作與智能體交談的通信設備。” — —Stability AI 資深軟體工程師Conner Ruhl
透過將這個循環型系統納入社群媒體管理,你可以創造一個動態的自適應策略,隨著受眾的偏好和不斷變化的社群媒體環境而演進。這將有助於提高社交媒體工作的參與度、影響力和整體有效性。
「另一個讓我興奮的自主智能體用例是它在音樂創作領域的應用。透過利用AI 驅動演算法的能力,這些智能體可以分析我的個人喜好、最喜歡的流派,甚至是與我產生共鳴的特定音樂元素。然後它們可以產生原創的旋律、和聲和節奏,與我一起有效地共同創作音樂。這種創造性的合作有可能拓寬我的音樂視野,使我能夠探索以前可能沒有考慮過的新風格和流派。此外,自主智能體可以對我的作品提供有價值的反饋並提供改進建議,培養我成長為音樂家。人工智慧與人類創造力在音樂創作過程中的融合可以帶來創新和獨特的結果,擴大藝術表達的界限。」— Octane AI 產品總監Katya Sapozhnina
範例2:能夠競選職位的自主智能體
如果你正在競選一個職位並且想利用AI 助理來獲得幫助。
我希望智能體做的工作不必很難,但這些工作需要花費一些時間和精力。例如預訂航班之類的事情,我很高興意外包給智能體。 」 ——Gumroad 創辦人兼執行長 Sahil Lavingia
- 初始目標:透過確保大多數選票贏得選舉;
- 資料收集:收集有關選民、人口統計、關鍵議題、競選資訊和其他相關資訊的數據;
- 背景分析:分析收集的數據以確定趨勢、機會和挑戰。根據此分析將初始目標細化為特定的子目標,例如針對未定的選民、增加關鍵領域的選民投票率或改善針對特定議題的競選訊息;
- 任務生成:產生與細化子目標相關的任務,例如規劃選民外展活動、創建有針對性的廣告或製定政策建議;
- 任務執行:執行最高優先順序的任務,根據需要分配資源和分配團隊成員;
- 績效監測:透過追蹤選民參與、公眾輿論和籌款指標等關鍵績效指標來評估已完成任務的有效性。評估單一任務的成功和整個活動在實現子目標和初始目標方面的進展;
- #迭代和改進:分析性能數據以確定需要改進的地方,並結合這些洞察結果來更新活動策略。重複步驟 2-8 以持續改善競選管理系統,並隨著時間的推移不斷提高其成效。
「我對遞歸自我克隆能力感到非常興奮。AI 智能體可以創建自己的副本,傳遞任務指令,並開始與自己的兄弟姐妹交談以完成工作。這是非常了不起但又奇異的湧現能力。」 -NVIDIA 人工智慧科學家Jim Fan
起初,有一個競選者可能會使用一個自主智能體,他會比其他人擁有巨大D 優勢,但想像一下,一旦每個競選者都有一個… 或多個智能體,那會是什麼樣子。
「我不認為每個人都會使用自主智能體。儘管它們無所不在,但隨著人工智慧的發展,人類參與的工作將會復興。許多人會重新想到筆和紙,想要人類製造的藝術品… 我們會看到許多產品和創作標榜「完全由人類自己製造」。它應該很快就會成為一個非常受歡迎的標籤。技術發展得越快,我就越享受長時間完全離線的時間,很快也會享受「脫離AI」的時間。 」 -PAWA 創辦人兼執行長Loic Le Meur | Loic
##範例3:教導數學的自主智能體
#這裡還會有設計用來教導孩子們數學的自主智能體。
「這是一個具有很大探索空間的突破性範式。儘管早期實驗限制了智能體搜尋查詢,但我們將看到大範圍的研究和輔助項目為自主智能體配備新的工具。而每套工具都將顯著地擴展其潛在用例。」 ——Pete Huang,The Neuron Daily AI 時事通訊創始人
- 初始目標:確定孩子目前的數學技能等級並設定個人化的學習路徑以幫助他們提升;
- ##資料收集:透過評估、互動和回饋收集有關孩子的學習方式、學習過程和學習表現的資訊;
- 情境分析:分析收集到的數據,以確定孩子的優勢、劣勢、學習偏好,以及影響孩子進步的所有外在因素;
- 任務生成:根據孩子的需求和學習路徑產生輔導任務,例如選擇合適的練習題,提供講解,或提供現實生活中的例子與應用;
- 任務優先:根據輔導任務對孩子學習和技能發展的潛在影響對輔導任務進行排序,找到挑戰性與參與感之間的平衡;
- 任務執行:執行最高優先順序的任務,根據需要調整輔導方法和內容傳遞,以最大限度地提高孩子的學習掌握度和參與度;
- #績效監測:透過追蹤關鍵績效指標(KPI) 評估輔導的有效性,例如學習目標的進展、數學技能的提高以及孩子的參與度和滿意度;
- 回饋循環:持續監控孩子的表現,並根據新數據和見解更新情境分析、任務產生和任務優先排序步驟。根據需要調整初始目標和學習路徑,以更好地支持孩子的數學技能發展;
- 迭代和改進:分析孩子的表現並根據新數據和見解更新上下文分析、任務生成和任務優先排序步驟。根據需要調整初始目標和學習路徑,以便更好地支持孩子的數學技能發展。重複執行步驟2-9,以不斷完善教育管理系統並隨著時間的推移提高其有效性;
這種自主智能體循環類型系統概述了教學中數學導師自適應幫助和指導孩子學習體驗的過程,重點是根據孩子的需求和進步不斷改善並提供個人化指導方案。
現在人類正處於開發自主智能體的最初階段。我們四處探索、打破一些事物、進行試驗、創造或好或壞的事物。
「透過請求自主智能體的幫助,它們將會把你的想法變成現實。這些智能體可以充當朋友、同事和合作者,為你提供充裕的休閒時間。我很想知道,你會選擇如何度過這種新尋得的自由時間?」 -Glasp 聯合創辦人兼執行長Kazuki Nakayashiki
######################################################### ###現在,幾乎沒有任何商業化的自主智慧體產品發布,這類產品仍處於開發階段。但很快,這種情況就會改變。自主智能體將開始出現在各個地方。 #########「與其專注於取代人們的工作,不如專注於增強它們的能力。使某物『智慧』在過去意味著透過API 來使其資料可用。而下一代的智慧化將是詢問該產品如何更好地幫助你。例如,『智慧』電子郵件地址可能能夠根據你的偏好以有趣的方式採取行動。如果你是購物迷,也許它會監控電子郵件,了解你感興趣的商品何時開始銷售、進行價格比較,甚至代表你協商價格,私下了解你對商品的估價以及你樂意為其花費的價錢。」 ——Factorial Capital 管理合夥人、HuggingFace 投資人 Matt### ######人們將透過各種自主智能體來增強他們的活動、決策和行動。如果在未來某個時候我們有神經植入物,那麼這一切都會自然地發生,就像今天在你自己的頭腦中思考一樣。 #########「每個人都可以免費或花很少的錢接觸到虛擬研究員、助理、作家或工作人員。這種接觸是普惠化的。」 -Jeremiah Owyang,人工智慧投資人#########以下是我對自主智能體未來的預測:######
- 2023 年出現用於遊戲、個人使用、行銷和銷售的多個商業化自主智能體;
- 2024 年出現各個類別的商業化自主智能體,但並未得到主流採用;
- 2025 年在每個類別可以想像到的事情中普遍採用自主智能體;
- 2026 年第一世界國家的大多數人每天都在大量自主智能體的協助下過著日常生活;
- 在接下來的2-5 年內,大多數人將為自主智能體工作而非人類。
「我看到使用擴增實境的Holodeck(全像甲板),幾乎完全由AI 驅動,其中很多事情都在自動和手動提示下發生。是的,人們將為AI 工作。每個人都會使用它們,但只有少數人知道它們是什麼或如何製作它們。由於大型語言模型(LLM)和即將到來的自主智能體和系統不斷出現,世界即將發生深刻變化。
LLM 是人類發明的最普惠化的力量。為什麼?LLM 現在可以在廉價電腦上運行,而無需連接到中央伺服器。那個小引擎基本上包含了所有人類知識。令人難以置信的是,你可以在未連接到互聯網的設備上運行它。自主智能體只是讓這個全息甲板近乎自動運行。從天氣到披薩外賣,一切基本上都是自動發生的,幾乎不需要人類輸入的干預。」 — —Infinite Retina AI-First 首席策略長Robert Scoble
未來將是瘋狂的。那麼如何建構和使用自主智能體呢?
「在這個未來,每個人都可能會以某種身分使用自主智能體,無論是為了個人生產力、業務運作還是創作活動。在大多數情況下,人們將充當這些AI 智能體的『大師』,為它們設定目標並推動它們前進。我們也將『為AI 智能體工作』,就像我們必須在公司、流程和其他系統的約束下工作一樣。然而,我認為AI 智能體在許多情況下會比當今社會上的公司和系統做得更好,並且會創造讓所有人受益的機會。」 ——Crowd Cow 聯合創始人Joe Heitzeberg
如何建構和使用自主智能體
你現在已經準備好一頭栽進自主智能體的世界。我將為你列出開始建立或使用自主智能體代理所需的資源。
「找到一個包含大量重複性任務的特定B2B 用例。如銷售營運、廣告營運、專案營運、會計服務等。現在可供選擇的任務很多。」 —— Hustlefund 共同創辦人Elizabeth Yin
「首先,盡可能縮小你的使用範圍。然後,設計一個包含人機回環( human-in-the-loop)的產品,以及評估過程成功與否的方法,並逐步增加自動化程度,最後擴展到相鄰的用例。」 ——Codium AI 聯合創始人兼首席執行官Itamar Friedman
建構自主智能體
建構自主智能體有幾個不同的選擇。
- 自己建立:看看我之前提供的框架,然後從頭開始建立一切的旅程吧!這並不像聽起來那麼可怕。建議使用的軟體解決方案有 OpenAI 的 GPT-4、Pinecone 向量資料庫和 LangChain 的框架。
- Auto-GPT:這是一個流行的開源選項,由 Toran Richards 創建。它包括連接到互聯網、使用應用程式、長期和短期記憶等選項。
- BabyAGI:另一個流行的開源選項,由 Yohei Nakajima 創建。雖然這個還沒有連接到互聯網,但它的程式碼不到 200 行,非常簡練。
- Microsoft 的 Jarvis:與 Auto-GPT 和 BabyAGI 非常相似,但更強大,由 Microsoft 和 HuggingFace 提供。
「我認為我們最初將擁有垂直領域的自主智能體。這些智能體針對一組特定數據進行微調,使它們能夠在該領域發揮作用。到目前為止,我們看到大量運用大型語言模型(LLM)的(僅有的?)兩個領域是文案寫作和程式設計。進一步推斷,我們認為這兩個領域採用的AI 將開始變得更加自主是有道理的。一種可能在不久的將來逐漸出現的方式是,人工智慧將代替人們給出prompt 來觸發文案寫作或程式碼編寫,它們將每天自動給你新的建議供你考慮,而不需要你先啟動它們或給它們prompt。」 ——godmode.space 的創建者Lonis Hamaili
使用自主智能體
準備好擁有自己的智能體了嗎?這裡有一些選項。
你可以透過選擇任一選項來創造如上所述的自己的智能體!
- AgentGPT:從網站建立並執行自主智慧體 (AutoGPT),無需登入。
- HyperWrite Assistant:新增一個 chrome 擴充程序,讓你可以向瀏覽器發出命令,然後瀏覽器執行。
「各行各業的人們都可以從先前專為社會菁英階層保留的專業知識和高效方法中受益。這種個人助理的普惠化可以帶來更高的生產力和更平衡的工作與生活體驗,使人們能夠更專注於他們的興趣、創造力和個人成長,而他們的人工智慧助理則負責處理他們日常生活中更單調的部分。」 -HyperWrite 創辦人兼執行長Matt Shumer
無論你會不會編程,我都鼓勵你花幾個小時來嘗試這些東西。它並不像看起來那麼複雜或困難,而且你越快動手,你就會越快地了解自主智能體。
「身為投資者,使用自主智能體來完成分析師和助理的工作,或至少極大地幫助他們的工作,這讓我非常興奮。它們可以在特定條件下透過程式設計尋找交易,針對特定因素進行分析,然後幫我發送自訂電子郵件以開始對話。」 -Boost VC 共同創辦人Brayton Williams
################################################################## ####自主智能體如今可被進行開放式的詮釋與創新。 99% 的用例尚未創建或嘗試,擁有無窮無盡的可能性,而機會就在你的手中。 ############「對於為實現更大的終極目標而對較小的編程任務進行編排和模組化,我非常感興趣。我們知道大型語言模型擅長基於問題進行編程,但我們還未看到證據表明它們可以將整個程式碼庫從Android 移植到iOS,甚至可以從頭開始創建應用程式。我認為具有正確編排方案和記憶體結構的智能體或可實現這一目標。」 —— Curai 聯合創辦人兼執行長Neal Khosla######
以上是AutoGPT star量破10萬,是首篇系統介紹自主智能體的文章的詳細內容。更多資訊請關注PHP中文網其他相關文章!

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Dreamweaver Mac版
視覺化網頁開發工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中