首頁 >科技週邊 >人工智慧 >一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

PHPz
PHPz轉載
2023-05-16 12:49:141217瀏覽

最近一段時間,OpenAI 憑藉 GPT 系列模型以及 ChatGPT,一直是最受關注的研究機構。但最近兩年,一家 AI 新創公司正走進大家的視野,這家公司名為 Anthropic,成立於 2021 年,專注於開發通用 AI 系統和語言模型,並秉持負責任的 AI 使用理念。

不知大家是否還記得 2020 年末,OpenAI 核心員工集體離職事件,當時這件事在 AI 圈還引起了不小的轟動。 Anthropic 是由這些離職的人員創建的,其中包括 OpenAI 前研究副總裁 Dario Amodei、GPT-3 論文一作 Tom Brown 等人。

今年一月,Anthropic 已籌集了超過 7 億美元的資金,最新一輪的估值達到了 50 億美元。同時,在 ChatGPT 發布兩個月後,這家公司就迅速開發了一種對標老東家 ChatGPT 的人工智慧系統 Claude。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

Claude 申請訪問網址:https://www.anthropic.com/earlyaccess

Claude 使用了Anthropic 自行開發的一種被稱為「constitutional AI」的機制,其旨在提供一種「基於原則」的方法使AI 系統與人類意圖保持一致。

Claude 可以完成摘要總結、搜尋、協助創作、問答、編碼等任務。根據使用者回饋,Claude 產生有害輸出的可能性較小,更容易進行對話,並且更易於控制。除此之外,Claude 還可以根據指示來設定個性、語氣和行為。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

不過Anthropic 並沒有提供太多關於Claude 的技術細節,但在論文《Constitutional AI: Harmlessness from AI Feedback》中描述了Claude背後技術,有興趣的讀者可以前去查看。

論文網址:https://arxiv.org/pdf/2212.08073.pdf

提早在一月,就有研究者對Claude 一次性可以處理的最大文本量進行了測試,顯示Claude 可以回憶起8k 個token 中的信息。

時隔沒多久,本週四,Anthropic 推出了100K Context Windows,它將Claude 的上下文視窗從9k token 擴展到了100k#,這相當於75,000 個單字。這意味著企業可以提交數百頁資料讓 Claude 消化和解釋,並且與它的對話可以持續數小時甚至數天。現在可以透過 Anthropic API 存取 100K context windows。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

我們知道,大模型越先進,能夠同時處理的文字就越長,7.5 萬字是個什麼概念呢?大概相當於一鍵總結《哈利波特》第一部。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

看起來絕大多數論文、新聞報導和中短篇小說都不在話下了。

Claude 再進化:真「AI 量子速讀」

#根據科學研究,一般人可以在5 小時左右的時間裡閱讀100,000 個token,並可能需要更長的時間來消化、記憶和分析這些資訊。 現在 Claude 可以在不到 1 分鐘的時間內完成這些。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

#上下文視窗的一般計算。

Anthropic 首先將《了不起的蓋茨比》的整個文本加載到了Claude-Instant(72 K tokens,Claude 兩個版本Claude 和Claude Instant,Claude 是最先進的高性能模型,而Claude Instant是更輕、更便宜、更快的選擇。)中,並修改了一行「Carraway 先生是一位在Anthropic 從事機器學習工作的軟體工程師」。 當 Anthropic 要求模型找出與原文的不同之處時,它會在 22 秒內給出正確答案。

除了閱讀長文本之外,Claude 還有助於從文件中檢索訊息,從而對業務運營產生助益。使用者可以將多個文件甚至一本書放入 prompt 中,然後向 Claude 提出問題(需要對文本的許多部分進行綜合知識分析)。對於複雜的問題,這可能比基於向量搜尋的方法有效得多。 Claude 可以按照使用者的指示返回他們正在搜尋的訊息,就像人類助手一樣。

Anthropic 接著將大語言整合工具LangChain API 開發者文件(240 頁)放入模型中,然後針對所提問題給出了使用Anthropic 語言模型的LangChain demo。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

同時,100k token 可以轉換為約 6 小時的音訊。 AssemblyAI 對此做了很好的演示,他們將一個長播客轉錄為了近 58k 個單詞,然後使用 Claude 進行摘要總結和問答。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

圖源:AssemblyAI

總之,使用100k context windows,使用者可以做到如下:

  • #消化、總結和解釋財務報表或研究論文等密集文件;
  • 基於公司年度報告分析策略風險和機會;
  • 評估一項立法的利弊;
  • 識別法律文件中的風險、主題和不同形式的爭論;
  • 閱讀數百頁的開發者文檔,並給出技術問題的答案;
  • ##透過將整個程式碼庫放入上下文並智慧地建立或修改以快速製作原型。

有網友用以下梗圖形像地描述了 Context Windows 與 Claude 100k、GPT-4 32K 的關係。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

圖表來源:推特@nathanwchan

#至於價格,Anthropic 技術人員Ben Mann 表示,100K Context Windows 的百萬token 售價與以往車型一樣。

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時

一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時


####

以上是一口氣看完《哈利波特》:AI大模型「量子速讀」,一分鐘抵人類五小時的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除