由於OpenAI的ChatGPT火爆發布以及隨後谷歌和微軟之間的搜尋引擎大戰,大型語言模型(LLM)及其應用程式突然成為熱門話題。 ChatGPT和類似的系統正在重新啟動我們對搜尋的新體驗和新概念。現在使用者可以使用人類語言與搜尋引擎進行自然交互,而不是依賴特定的關鍵字或複雜的搜尋查詢語法。
問答(QA)系統是自然語言處理(NLP)的一種能力,是LLM所能實現的一組語言能力,但QA系統並不總是一個流行的用例。 NLP搜尋公司Kyndi的的執行長Ryan Welsh回憶說,他在解釋公司對NLP搜尋時遇到了困難:「我記得三年前籌集了資金,每個人都說,『嘿,很酷,你是NLP ,但這個搜尋不是一個好的應用案例。'”
Welsh表示,因為ChatGPT的興起,越來越多人意識到自然語言能力的價值,這種反應已經完全改變:「我覺得ChatGPT在90-120天內達成了十年的宣傳效果。」
現在,數十億美元正在投資下一代搜尋技術。突然之間,市場對QA系統產生了真正的需求,該系統可以快速準確地回答利害關係人或訪問公司網站或知識入口網站的外部客戶提出的問題,以及搜尋公司文件的內部員工提出的問題。
然而,Welsh表示,目前的這些聊天機器人技術無法滿足企業的需求,作為最終用戶信任的關鍵的可解釋性往往缺乏。企業對大型語言模型系統的要求是產生的答案準確可靠,而不是充滿了來自網絡內容的訓練數據的“錯亂”,這是像ChatGPT這樣的大型主流模型面臨的問題(延展閱讀:)。由於其底層技術的統計性質,聊天機器人可能會產生錯誤訊息的混亂,因為他們實際上並不理解語言,只是在預測下一個最好的單字。通常,訓練資料非常廣泛,幾乎不可能解釋聊天機器人是如何得出它給出的答案的。
這種缺乏可解釋性的人工智慧「黑盒子」方法根本不適用於許多企業。 Welsh舉了一個製藥公司的例子,該公司正在向醫療保健提供者或訪問其藥品網站的患者提供答案。該公司被要求知道並解釋每一個可以提供給提問者的搜尋結果。因此,儘管最近對ChatGPT等系統的需求激增,但根據Welsh的說法,使其適應這些嚴格的企業要求並不是一項容易的任務,而且這種需求往往得不到滿足。
Welsh表示,多年來,他的公司一直專注於這些企業需求,從經驗中學習,並與客戶直接互動。 Kyndi由威爾斯人工智慧專家Arun Majumbar和電腦科學家John Sowa於2014年創立,John Sowa是知識圖譜譜專家,1976年在IBM引入了一種稱為概念圖的特定類型。
Kyndi的自然語言搜尋應用程式建立在知識圖譜和LLM突破的基礎上,採用了神經符號人工智慧,這是一種補充統計機器學習技術的語義方法。這個系統不只是預測文本中下一個最有可能的單詞,也是創建語言的符號表示,利用向量和知識圖譜技術來映射資料之間的關係。這使系統能夠理解最終用戶問題背後的真實意圖,有助於找到特定於上下文的答案,同時區分常見的同義詞、語義等效的單字、縮寫和拼寫錯誤。
這項技術幾乎不需要訓練資料就能發揮作用,這可以緩解缺乏標記資料和人工智慧專業知識所造成的瓶頸。與資料標籤相關的高成本使得訓練和微調LLM對許多企業來說過於昂貴。這種調整的容易性是Kyndi神經符號方法的另一個區別因素。 Welsh表示,許多企業客戶已經被緩慢的人工智慧部署折磨。一家大型製藥公司在與Kyndi合作之前,已經使用六名機器學習工程師和資料科學家對LLM進行了六個多月的調整。 Welsh說,Kyndi只需要一名商業分析師的幫助,就可以在一天內訓練和調整他們的模型。在其他幾個案例中,Kyndi能夠在兩週內透過演示、沙箱驗證和部署來完成人工智慧專案。
「我認為,在未來10年的某個時候,世界上每一家企業的每一個搜尋欄和每一個聊天介面都會有一個答案引擎。這將是我們在企業軟體中看到的最大的轉變。」Welsh說,並將這一時刻與從預處理到雲的轉變進行了比較。 「我認為目前沒有任何供應商能夠主導這個市場。」
Welsh預測,在這個企業搜尋領域的新時代,獲勝的公司是那些有遠見將產品投放市場的公司。儘管競爭目前正在升溫,但其中一些新公司已經落後了。他估計在獲得成功前,他們還有大約2-3年和價值3000萬美元的建設工作要做。
以上是企業自然語言搜尋新時代到來的詳細內容。更多資訊請關注PHP中文網其他相關文章!