ChatGPT如今已成為一款風靡全球的聊天機器人,幾乎所有企業都在考慮如何使用它來提高業務效率。在去年11月上線營運5天後,就擁有了100萬個用戶,在隨後的兩個月,這款人工智慧聊天機器人擁有了2億多個用戶。
總部位於舊金山的人工智慧開發商OpenAI公司開發的這款機器學習語言程式可以提供類似人類的文字回答,它可以總結長篇文章或文字對話,提供寫作建議,策劃行銷活動,制定商業計劃,甚至創建或修改電腦程式碼,這一切都可以用有限的投資來實現。
擁有OpenAI公司49%股份的微軟公司已經向該公司投資了數十億美元,微軟公司也推出了一個基於OpenAI最新版本的GPT-4大型語言模型的必應(Bing)搜索引擎,ChatGPT也是基於此模型開發的。谷歌公司也不甘示弱,最近發布了自己的實驗性人工智慧聊天機器人。
Intercom公司是一家客戶支援軟體供應商,其產品被全球25,000家企業使用,包括Atlassian、亞馬遜和Lyft Business等公司,目前處於ChatGPT使用的最前線。該公司的軟體只是使用ChatGPT的大型語言模型(GPT3.5)的特性在其平台上添加了支援人工智慧的功能。
Intercom公司的機器學習主管Fergal Reid表示,在該公司的人工智慧客服軟體中加入ChatGPT的功能有不可否認的優勢。 Intercom的軟體用於幫助客戶服務代表回答客戶問題。 Intercom還銷售一款名為「Resolution Bot」的支援聊天機器人,企業可以將其嵌入網站上,自動回答終端用戶的問題。
但Reid警告說,ChatGPT也存在一些不容忽視的問題。由於定價問題,目前已有數百名Intercom公司的客戶使用新的客服軟體仍處於測試階段。
不過,測試過Intercom公司軟體的客戶對更新後的軟體(基於OpenAI的GPT-3.5語言模型) 表示讚賞,並聲稱這將使他們的工作變得更容易。
在接受業界媒體採訪時,Reid闡述了為Intercom公司的商業用途定制ChatGPT軟體的過程,如何提供商業價值,以及他和他的機器學習團隊曾經並仍然面臨的挑戰。
以下是訪談節錄:
Reid:我們的業務基本上就是客戶服務。我們開發了一個信使,如果有人詢問客戶支援或服務問題,他們就會進入一個商務網站,在信使中輸入所問的問題,就像WhatsApp聊天一樣。
Intercom公司是客戶支援產業的領導者之一,也是最早推出這種商務信差服務的公司之一。所以我們開發了這個信使,然後為客戶支援人員建立了一個完整的客戶支援平台(我們稱它們為隊友),該平台的工作是日復一日地反覆回答客戶支援問題。
我們發現ChatGPT跨越了處理隨機對話的另一個層次。當人們在提問時,可能會用令人驚訝的方式提出問題。在對話過程中,人們可能會提到談話前幾回合所說的話。這對於傳統的機器學習系統來說很難處理,但OpenAI的新技術似乎在這方面做得更好。
我們嘗試了ChatGPT和GPT3。我們當時就想,「這是一件大事。這將為我們的聊天機器人和隊友釋放更強大的功能。
Reid:在去年12月初開始開發產品之後,我們在1月上旬演示了第一個原型。這是一個非常快速的開發週期。大約在1月中旬,我們的產品已經有108個客戶使用它進行測試,然後在1月底發布了另一個測試版本。我們的產品現在正處於公測階段,所以有數百個內容客戶正在使用它。我們仍然稱它為測試版,儘管人們每天都在生產中使用它。
這是一個引人注目的演示原型,目前還不能提供真正的價值。所以,我們還有很多工作要做,以了解這個原型具有多少真正的價值。
與人們可能使用的任何API相比,OpenAI擁有的這些開放API的成本非常高昂。用戶只要讓它總結所做的事情,就會花費一些費用,雖然這比自己做要便宜得多,但這是企業必須解決的問題。那麼怎麼定價呢?
這也是我們仍處於測試階段的另一個原因。我們和其他人一樣,仍在了解這項技術的成本。就電腦處理成本來說,它為人們節省了更多的時間,但如何實現經濟性還需要探索。
Reid:我認為ChatGPT更像是GPT 3.5模型的前端。但是,任何在ChatGPT上建構的人都是在同一個底層模型上建構的,OpenAI稱之為GPT 3.5。它們基本上是一樣的,不同之處在於使用者介面。
訓練ChatGPT有更多的護欄,所以如果讓它做一些它不想做的事情,它就會說,「我只是一個大型語言模型,我不能做這些。」而底層語言模型沒有這些護欄。他們沒有接受過在網路上與終端使用者交談的訓練。因此,任何建構產品的開發人員都在使用底層模型,而不是ChatGPT介面。不過,就理解的複雜性和底層模型的功能而言,這基本上是一樣的。
我們正在使用的模型是Text-Davinci-003,基本上每個人都在使用它。
你們可以選擇建造什麼嗎?是否有其他來自第三方的大型語言模型可以用來建立新的服務代表特性?
Reid:目前ChatGPT還不是OpenAI託管的這些模型的應用程式。除了OpenAI,沒有人能真正使用ChatGPT。從技術上講,我認為ChatGPT是OpenAI為公眾提供的服務,任何人都可以在他們的網站上建立ChatGPT的東西。更準確地說,他們使用相同的OpenAI模型來支援ChatGPT。
#Reid:我們最初發布的功能是面向客戶支援人員的,而不是終端用戶。我們開發了面向最終用戶的聊天機器人,然後具有面向客戶支援人員的基於機器學習的生產力特性。我們最初發布的Resolution Bot產品具有使客戶支援人員更好的特性,它不是為最終用戶設計的。
我們這樣做的原因是因為OpenAI目前的許多機器學習模型都受到了所謂的幻覺的影響。如果問它們一個問題,而沒有給出正確的答案,它們通常會編造一些答案。
這種情況超出了我們的預期。有一些功能(例如總結)顯然是有價值的,然後是其他功能,例如重新措辭文本或使文本更友好。
可以想像它們的工作並不是為了確保提供真實的訊息,因此只能虛構訊息。我們最初不願意讓用戶使用它們並回答問題。我們很擔心,我們的客戶會因為聊天機器人會編造一些錯誤答案而影響體驗。我們早期的測試確實表明,讓客戶使用由ChatGPT驅動的並不成熟的聊天機器人是一個非常糟糕的主意。我們將繼續努力,我們認為未來會有更好的解決方案。
Reid:雖然我們正在這個領域開展工作,當然也有內部的研發原型,但目前我們還沒有命名或承諾發布任何產品或工具。
我們最初發布聊天機器人只是為了幫助客戶支援人員,因為他們通常會知道正確的答案是什麼,而且聊天機器人仍然可以讓他們更快、更有效率地提供服務,因為他們在90%的時間裡不必自己輸入答案。然後在10%的時間中,當出現一些錯誤時,客戶支援人員可以直接解決。
所以,它變得更像一個介面。如果使用Google文件或任何可以給出建議的預測文本,有時建議是錯誤的也沒關係,但當它們提供正確的建議時,將會提高用戶效率。這就是我們最初發布測試版本的原因,到今年1月底,這個版本已經有數百名客戶進行了測試,我們在新功能上獲得了許多正面的回饋。它使客戶支援人員更有效率,並且提高了銷售量。
它可以幫助銷售代表重新措辭文本,它不僅僅是將文字自動發送給最終用戶,其設計是為了讓客戶支援人員更快地完成任務。
Reid:我們建構的ChatGPT另一個功能是摘要。這種大型語言模型在處理現有文本和生成大型文章或文本對話的摘要方面非常出色。同樣,我們有許多客戶支援人員,當客戶提出的問題對ChatGPT來說太複雜時,不得不把對話交給客戶支援人員,通常它們會被要求寫一份與最終用戶對話的摘要。有一些客戶支援人員表示,有時寫總結和回覆客戶對話很耗時,但是他們必須這麼做。
所以,這項技術在總結和歸納文本內容方面非常出色。我們最引以為傲的功能之一就是這個總結功能,只要按一個按鈕,就能得到對話的摘要,然後可以編輯將摘要發送給客戶。
設計這些功能都是為了讓客戶參與進來,並持續增強ChatGPT的能力。客戶支援人員不需要花費更多的時間通讀整個對話,然後找出主要內容。與其相反,ChatGPT會提取出相關摘要,然後客戶支援人員只需要確認即可。
這些模型比我們以前開發的模型好得多,但它們仍然不完美。它們偶爾還是會忽略一些細節,不能理解熟練的客戶支援人員所能理解的事情。
Reid:OpenAI為我們提供了一個API,我們可以將文字發送給它,並從它的模型中獲取文本。與過去不同的是,人們真正使用這項技術的方式是「告訴它」想讓它做什麼,並向它發送了一些文本,例如總結下面的對話:
#客戶:「嗨,我有個問題。」
客戶代表:「你好,有什麼我能幫助你的嗎?」」
客戶可能直接向它發送文本,包括想讓它做什麼,它就會發送回文字——在這種情況下,它現在包含了摘要版本。然後處理它,並把它提交給客戶支援人員,所以他們可以選擇使用或不使用。
#客戶可以用它來總結電子郵件。一封電子郵件通常會在下麵包含以前的電子郵件歷史記錄,可以用它來獲得電子郵件的線索。這種功能是過去的程式語言所沒有的,但是必須花很多精力讓它做想讓它做的事情。當要求它做某事時,必須非常具體以避免出錯。
Reid:Intercom公司有一個強大的研發團隊,就像任何軟體和服務科技公司一樣。我領導機器學習團隊,所以團隊中的大多數人都是機器學習領域的專家,包括我自己在內。所以,我們具有訓練機器學習模型並與之合作的豐富經驗。
我們有一個內部的(客戶成功)團隊,將它們當作alpha客戶。Intercom公司大概有100個(客戶成功)代表。所以,我們會很快把原型交付給它們,並得到它們對模型的反饋,但我們不是用它們來訓練模型,我們只是將它們作為alpha測試人員來幫助識別問題,並確定哪裡出了問題。
我們有很多工作要做,製作一個用於演示的聊天機器人很容易,但要讓它在生產環境中發揮作用,還有很多工作要做。
Reid:我們目前正在調查這一點,而且現在還沒有準備好,但是我們認為這種類型的技術很快就會給客戶使用。谷歌公司最近發布了一款產品,他們的人工智慧模型在發布會上的展示出現了一些錯誤,這讓很多人失望。
所以,每個人都必須弄清楚如何處理這種偶爾出現的問題,我們正在努力解決這些問題。
Reid:可能沒那麼高。我沒有確切的數字,因為這種技術太新了。雖然我們已經有了遙測技術,但可能還得再過幾週才能得到數據。這是一件很難衡量的事情。
我想說,像文字摘要這樣的方法可以讓10到15分鐘的談話節省大約1到2分鐘的時間。這是我們所得到的一些回饋,也是我們所看到的令人興奮的地方。自從進行了公測之後,就可以在Twitter上找到Intercom公司的客戶發布的如何節省時間的貼文。
我也認為這個領域的每個人都面臨著必須誠實的挑戰。這項技術是如此令人興奮,很難讓人保持清醒而不過度誇大。我們發布的是用於演示的人工智慧機器人,目前還不能提供真正的價值,所以還有很多工作要做,以了解這裡傳遞了多少真正的價值。我們將深入了解這一點,並希望儘早發布,並了解客戶的想法。
我們收到的客戶回饋超出了我的預期,有一些功能(例如摘要)顯然是有價值的,還有其他的功能,例如重新表述文本或使文本更友好的能力,或者我們提供的另一個功能是能夠編寫資訊的簡寫版本,並將其展開,客戶對這些功能的回饋良好。
Reid:事實上,我們需要在一兩個月內了解我們的遙測技術,並確定是否每次都在使用它。我們需要核實,我認為這一領域仍在開發殺手級應用程式。
我們採用ChatGPT進行了一個很好的演示,它引起了所有人的注意。但是,有一些像Intercom這樣的公司正在決定如何把它從玩具變成具有真正商業價值的東西。即使在Intercom公司,我們也會說,「我們已經推出了這些功能,它們很酷,看起來很有價值,但還不足以改變遊戲規則。」
我認為這將是我們正在開發的下一波技術,並且開發週期更長。這些都不像快速整合那麼簡單。我們必須非常深入地了解用戶的問題和所有不同方面,以及它失敗的地方。我們的許多競爭對手和業內人士也在解決同樣的問題,並創造出更有價值的功能。
我們的開發週期非常快,很快就推出了聊天機器人,並獲得了客戶的良好回饋,這有助於我們決定下一步的發展方向,這是我對現狀的現實看法。
現在有很多關於ChatGPT的炒作。在試圖降低客戶對產品的期望時,你如何應對這種情況?
Reid:我們在這裡的實際策略是盡量誠實地對待我們的期望。我們覺得我們可以透過誠實來區別於炒作浪潮。
Reid:Intercom公司有2.5萬多家客戶。我們會對客戶說,『我們有一些測試版的產品。你願意參加嗎?有些客戶選擇了加入並表示他們願意使用早期的軟體,但有些客戶不會。有些客戶是致力於規避風險的企業(例如銀行),他們不想成為測試項目的一部分。
當我們開發出新的軟體時,我們會給他們發訊息,讓他們為測試版招募人員。我們的專案經理開始推廣活動,這就是我們所做的一切。我們在1月中旬邀請了幾百位客戶進行測試。客戶加入之後使用API來處理數據,我們為他們開放了這些功能。
然後我們第二天開始觀察遙測技術,看看客戶在哪裡使用它,它對他們有用嗎?然後,這就是我們通常在Intercom公司運行測試的方式,我們在聯繫他們時說,「我們能從中得到你的回饋嗎?我們想知道你的報價。」一些客戶在幾週後就給了我們真實的報價,後來我們在博客上發布了這些報價。
我們希望從所有的炒作中脫穎而出。很多新創公司通常披著ChapGPT的外衣,只是創造了一個登陸頁面。而我們真的有ChapGPT這樣的產品,並且在我們網站上發布實際的客戶報價,它確實是真實的。
以上是當客戶支援公司將某些功能升級到ChatGPT時會發生什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!