
AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
論文標題:Tell Me More! Towards Implicit User Intention Understanding of Language Model Driven Agents 論文連結:https://arxiv.org/ab/ ://github.com/HBX-hbx/Mistral-Interact 開源模型:https://huggingface.co/hbx/Mistral-Interact 開源資料集:https://faceugging.co/ - 開源資料集:https://faceugging.co/
datasets/hbx/IN3
如上圖所示,基於人類編寫的種子任務為Step 1,模型迭代產生新任務以增強資料集,同時從資料集中採樣以作為下一輪生成的新範例(Step 2)。在這種 Self-Instruct 的生成方式後,再對每個任務的模糊度、缺失細節以及每個細節的重要性和潛在的選項進行人工標註(Step 3)。
由於大語言模型處於智能體設計的核心位置,該工作首先進行了初步研究,評估當前開源和閉源模型在交互過程中的隱源模型在交互過程中的隱源模型式意圖理解能力。
由結果可見,Mistral 在一定程度上表現更好,但仍然存在對人類意圖理解不足的問題。相較之下,GPT-4 在任務模糊度和重要缺失細節方面與人類意圖最為接近。同時,初步探索也表明,為了進一步提升智能體在互動中的隱式意圖理解能力,單純的提示工程(prompt engineering)是不夠的,有必要以當前開源模型為基礎,進一步訓練,以達到可以在智能體落地應用的程度。
因此,為了全面評估可交互智能體設計,文章將實驗分為兩個部分:i)
結果表明,Mistral-Interact 能夠更好地理解使用者的意圖,在判斷任務模糊度以及缺失細節的覆蓋率等指標上表現最佳,而且能夠基於詳細的使用者意圖進行明確而全面的總結。相較於其他開源模型,Mistral-Interact 在詢問模糊任務中的缺失細節方面能提供更合理的選項,詢問方式更加友好,並與 GPT-4 的表現不相上下。
結語
以上是開閉源模型「大亂鬥」:看看哪個智能體最能窺見人類真實意圖的詳細內容。更多資訊請關注PHP中文網其他相關文章!

對於那些可能是我專欄新手的人,我廣泛探討了AI的最新進展,包括體現AI,AI推理,AI中的高科技突破,及時的工程,AI培訓,AI,AI RE RE等主題

歐洲雄心勃勃的AI大陸行動計劃旨在將歐盟確立為人工智能的全球領導者。 一個關鍵要素是建立了AI Gigafactories網絡,每個網絡都有大約100,000個高級AI芯片 - 2倍的自動化合物的四倍

微軟對AI代理申請的統一方法:企業的明顯勝利 微軟最近公告的新AI代理能力清晰而統一的演講給人留下了深刻的印象。 與許多技術公告陷入困境不同

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

IBM的Z17大型機:集成AI用於增強業務運營 上個月,在IBM的紐約總部,我收到了Z17功能的預覽。 以Z16的成功為基礎(於2022年推出並證明持續的收入增長

解鎖不可動搖的信心,消除了對外部驗證的需求! 這五個CHATGPT提示將指導您完全自力更生和自我感知的變革轉變。 只需複制,粘貼和自定義包圍

人工智能安全與研究公司 Anthropic 最近的一項[研究]開始揭示這些複雜過程的真相,展現出一種令人不安地與我們自身認知領域相似的複雜性。自然智能和人工智能可能比我們想像的更相似。 窺探內部:Anthropic 可解釋性研究 Anthropic 進行的研究的新發現代表了機制可解釋性領域的重大進展,該領域旨在反向工程 AI 的內部計算——不僅僅觀察 AI 做了什麼,而是理解它在人工神經元層面如何做到這一點。 想像一下,試圖通過繪製當有人看到特定物體或思考特定想法時哪些神經元會放電來理解大腦。 A

高通的龍翼:企業和基礎設施的戰略飛躍 高通公司通過其新的Dragonwing品牌在全球範圍內積極擴展其範圍,以全球為目標。 這不僅僅是雷布蘭


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

記事本++7.3.1
好用且免費的程式碼編輯器

Dreamweaver CS6
視覺化網頁開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SublimeText3漢化版
中文版,非常好用