譯者| 崔皓
#審校| 孫淑娟
人工智慧(AI)雖然處於早期發展階段,但它有可能徹底改變人類與科技互動的方式。
談到人工智慧,目前有兩種主要觀點。有些人認為,人工智慧最終會超越人類的智慧,而有些人則認為,人工智慧將永遠為人類服務。有一件事雙方都能達成共識:人工智慧的發展速度越來越快。
人工智慧(AI)仍處於早期發展階段,但它有可能徹底改變人類與科技互動的方式。
一個簡單、籠統的描述是,人工智慧是一個對電腦進行程式設計以使其自己做出決定的過程。這可以透過多種方式實現,但最常見的是透過使用演算法。演算法是一套規則或指令,可以依照這些規則或指令來解決一個問題。在人工智慧的情況下,演算法被用來教導電腦如何做決定。
在過去,人工智慧主要用於簡單的任務,如下棋或解決數學問題。現在,人工智慧正被用於更複雜的任務,如臉部識別,自然語言處理,甚至是自動駕駛。隨著人工智慧的不斷發展,不知道它在未來會有什麼能力。隨著人工智慧能力的迅速擴張,了解它是什麼,它如何運作,以及它的潛在影響是很重要的。
人工智慧帶來的好處是巨大的。由於具備自我決策的能力,人工智慧有可能提高無數行業的效率,並為所有類型的人提供機會。在這篇文章中,我們將談一談GPT-3。
GPT-3是由OpenAI創建的,這是一家位於舊金山的先鋒AI研究公司。他們將自己的目標定義為 "確保人工智慧惠及全人類"。他們創造人工智慧的願景很明確:一種不限於專門任務的人工智慧,而是像人類一樣,執行各種各樣的任務。
幾個月前,OpenAI公司向所有用戶發布了其名為GPT-3的新語言模型。 GPT-3是Generative Pretrained Transformer 3的縮寫,其包括可以透過一個稱為Prompt(提示)的前提下產生文字的能力。簡單地說,它具備高水準 "自動完成"的能力。例如,你只需就給定的主題提供兩到三個句子,GPT-3將完成其餘的工作。你也可以產生對話,GPT-3給出的答案將基於先前問題和答案的背景。
需要強調的是,GPT-3提供的每個答案只是一種可能性,因此它不會是唯一可能的答案。此外,如果你多次測試同一個前提,它可能會提供一個不同的甚至是矛盾的答案。因此,它是一個根據先前所說的內容返回答案的模型,並將其與你所知道的一切聯繫起來,以獲得最合理的答案。這意味著它沒有義務用真實的數據給出答案,這是我們必須考慮的問題。這並不意味著使用者不能透露相關的工作數據,但GPT-3需要將這些數據和上下文資訊進行比較。上下文的背景越全面,你得到的答案就越合理,反之亦然。
OpenAI的GPT-3語言模式是預先訓練好的,訓練包括研究網路上大量的資訊。 GPT-3被輸入了所有公開的書籍、維基百科的全部內容,以及網路上數以百萬計的網頁和科學論文。簡而言之,它吸收了我們在整個歷史中在網路上發表的最重要的人類知識。
在閱讀和分析這些資訊後,語言模型在位於48個16GB的GPU上的700GB模型中創建了連接。為了讓我們理解這個維度,之前的OpenAI模型,GPT-2模型規模為40GB,分析了4500萬個網頁。差異是巨大的,因為,GPT-2有15億個參數,而GPT-3有1750億個參數。
我們來做個測試吧?我問GPT-3如何定義自己,結果如下:
#為了能夠使用GPT-3並進行測試,我們唯一要做的是去他們的網站,註冊,並添加個人資訊。過程中會被詢問:你會把人工智慧用於什麼事情,對於這些例子,我選擇了「個人使用」選項。
我想指出的是,根據我的經驗,在英語情境中的效果會更好。這並不意味著它在其他語言中工作得不好;事實上,在西班牙語中它做得非常好,但我更喜歡它在英語中提供的結果,這就是為什麼從現在開始我所展示的測驗和結果都用的是英文。
當我們進入時,GPT-3給了我們一個免費的禮物。一旦你用你的電子郵件和電話號碼註冊,你將有18美元可以完全免費使用,不需要輸入付款方式。雖然看起來不多,但事實上,18美元是相當多的。為了給你一個概念,我已經用人工智慧測試了五個小時,我只花了1美元。稍後,我將解釋價格,以便我們更好地理解這一點。
一旦我們進入網站,我們將不得不去遊樂場(Playground)部分。這是所有奇蹟要發生的地方。
##首先,在網路上最引人注目的是大文字方塊。這就是我們可以開始向人工智慧輸入提示(記住,這些是我們的要求和/或指示)的地方。這就像輸入一些內容一樣簡單,在這種情況下是一個問題,然後點擊下面的提交按鈕,讓GPT-3回答我們並寫出我們所要求的內容。
預設#預設是針對不同任務隨時執行的功能。它們可以在文字框的右上方找到。如果我們點擊其中的幾個,"更多的例子 "將打開一個新的螢幕,在那裡我們將有整個列表可用。當選擇了一個預設,文字區的內容就會用預設文字更新。右側邊欄的設定也會被更新。例如,如果我們要使用 "語法修正 "預設,我們應該遵循以下結構以獲得最佳效果。
模型#用來訓練GPT-3的大量資料集,它是GPT-3如此強大的主要原因。然而,更大並不總是意味著更好。由於這些原因,OpenAI提供了四個主要模型。當然還有其他模型,但我們會被建議使用最新的版本,也就是我們現在使用的。
可用的模型被稱為Davinci, Babbage, Curie, and Ada。在這四個模型中,Davinci是最大且能力最強的,因為它可以涵蓋其他引擎所執行的任何任務。
我們將對模型和模型所匹配的任務類型進行概述。請記住,雖然較小的引擎可能沒有經過那麼多的資料訓練,但它們仍然是通用的模型,對於某些任務來說,是非常可行和便利的。
Davinci如上所述,它是能力最強的模型,可以做任何其他模型能做的所有事情,通常只需較少的指令。達文西能夠解決邏輯問題,確定因果關係,理解文本意圖,製作創意內容,解釋人物動機,並處理複雜的總結任務。
Curie這個模型試圖平衡算力和速度。它能做Ada或Babbage能做的任何事情,但它也能處理更複雜的分類任務和更細微的任務,如總結、情緒分析、聊天機器人應用和問答。 #
它的能力比Ada略強,但效率不高。它可以執行與Ada相同的所有任務,但也可以處理稍微複雜的分類任務,是對文件與搜尋查詢的匹配程度進行分類的語義搜尋任務的理想選擇。
最後,這通常是最快、最便宜的模型。它最適合於不太細微的任務,例如,解析文字、重新格式化文字和更簡單的分類任務。你提供給Ada的上下文越多,它的表現就越好。
我們可以調整的其他參數,以獲得對我們的提示的最佳回應,這就是模型。
控制GPT-3引擎輸出的最重要設定之一是Temperature。這個設定控制產生的文字的隨機性。當數值為0時,引擎是決定性的,這意味著對於給定的文字輸入,它將總是產生相同的輸出。數值為1時,引擎會冒最大的風險,並使用大量的創造力。
你可能注意到,在一些你自己能夠運行的測試中,GPT-3會在一個句子的中間停止。為了控制我們將允許產生的最大文字量,你可以使用以token指定的 "最大長度 "設定。我們將在後面解釋這個token是什麼。
"Top P"參數可以控制GPT-3文本的隨機性和創造性,但在這種情況下,與機率範圍內的token(單字)有關,取決於我們放置它的位置(0.1將是10%)。 OpenAI文件建議在Temperature和Top P之間只使用一個函數,所以當使用其中一個時,請確保另一個被設定為1。
另一方面,我們有兩個參數來懲罰GPT-3給出的答案。其中一個是 "頻率懲罰",它控制模型重複預測的傾向。它也減少了已經生成詞的機率,並取決於一個詞在預測中已經出現了多少次。
第二個懲罰是存在懲罰。存在懲罰參數鼓勵模型進行新的預測。如果一個字已經在預測文本中出現過,存在懲罰就會降低該字的機率。與頻率懲罰不同,存在懲罰並不取決於單字在過去預測中出現的頻率。
最後,我們有一個 "最佳 "參數,它為一個查詢產生了幾個答案。 Playground會選擇最好的一個來回應我們。 GPT-3會提出警告,針對提示會產生幾個完整的答案,這會導致花費更多的token。
為了完成這個部分,"提交"按鈕旁邊的第三個圖標,將顯示我們對GPT-3的所有的歷史請求。從中可以找到效果最好的回應所對應的提示。
一旦免費的18美元額度耗盡,GPT-3還提供了一個繼續使用其平台的方法,並不是每月訂閱或類似的東西。價格會與使用直接相關。換句話說,就是按照代幣收費。這是一個用於人工智慧的術語,代幣與產出的成本有關。一個代幣可以是任何東西,從一個字母到一個句子。因此,很難確切知道給人工智慧的每一次使用的價格。但鑑於它們通常是美分,只要稍加嘗試,很快就能看到每件事情的成本是多少了。
雖然OpenAI只向我們展示了十幾個GPT-3使用的例子,但我們可以看到每一個例子所花費的代幣,從而更了解它是如何運作的。
這些是版本和它們各自的價格。
為了讓我們了解一定數量的字可能要花費多少錢,或是給我們一個關於標記如何運作的例子,我們有以下工具,叫做Tokenizer。
#它告訴我們,GPT系列模型使用標記來處理文本,這些標記是文本中發現的常見字元序列。模型了解Token之間的統計關係,並在生產序列中使用下一個Token時被選中。
最後,這是一個低的水平的例子,看看同樣的例子將花費我們多少錢。
#從我的觀點來看,GPT-3是使用者必須知道如何正確使用的工具,GPT-3不一定給出正確數據。這意味著,如果你想用它來做工作,回答問題或做家庭作業,你必須提供很好的背景提示,它給你的答案才能接近你想要的結果。
有些人擔心,GPT-3是否會改變教育,或者今天存在的某些與寫作有關的工作是否會因為它而消失。依我愚見,這將會發生。遲早有一天,我們都會被人工智慧取代。這個例子是關於與寫作有關的人工智慧,但它們存在於程式設計、繪畫、音訊等方面。
另一方面,它為許多許多工作和專案開闢了更多的可能性,包括個人和職業。例如,你是否曾經想寫一個恐怖故事?在語法檢查器的範例清單中,就可以專門實現這個功能。
說了這麼多,我想說的是,我們處於人工智慧的早期版本,這個世界仍然有很多產品需要成長和完善,但並不意味著沒有落地。只要我們學習和使用人工智慧,就需要不斷訓練它讓它給出最好的回應。
崔皓,51CTO社群編輯,資深架構師,擁有18年的軟體開發與架構經驗,10年分散式架構經驗。
原文標題:#GPT-3 Playground: The AI That Can Write for You##,作者:Isaac Alvarez##
以上是GPT-3:能寫作的人工智慧的詳細內容。更多資訊請關注PHP中文網其他相關文章!