資料現在是最有價值的企業商品之一。根據CIO.com的《2022年CIO現況》報告顯示,有35%的IT領導者表示,數據和業務分析將在今年其組織IT投資中佔最多,58%的受訪者表示,未來一年他們將增加對數據分析的投入。
雖然數據有很多種形式,但是最大的、尚未被開發的數據池可能是文本,不管是專利、產品規格、學術出版物、市場研究、新聞,還是社交信息流,都以文本為主的,而且文本的數量也在不斷增長。根據Foundry 2022年資料和分析研究,有36%的IT領導者認為,管理這些非結構化資料是他們面臨的最大挑戰之一。這也是為什麼研究公司Lux Research指出,自然語言處理(NLP)技術特——別是主題建模——正在成為釋放資料價值的關鍵工具。
自然語言處理是人工智慧(AI)的一個分支,用於訓練電腦理解、處理和語言生成。搜尋引擎、機器翻譯服務和語音助理都由自然語言處理提供支援的。主題建模是一種自然語言處理技術,可以將一個想法分解為由詞組定義的、常見概念的子類別。據Lux Research稱,主題建模讓企業組織能夠將文件與特定主題進行關聯,然後提取數據,例如某個主題隨時間推移出現的成長趨勢。主題建模也可以用於為給定文件建立“指紋”,然後發現具有相似指紋的其他文件。
隨著企業對AI的興趣越來越濃厚,他們開始轉向利用自然語言處理來釋放文本文檔中的非結構化資料蘊含的價值。研究公司MarketsandMarkets預測,自然語言處理市場規模將從2022年的157億美元成長到2027年的494億美元,在此期間的複合年增長率(CAGR)為25.7%。
下面就讓我們來看看企業組織是如何使用自然語言處理來創造業務成果的五個實例吧。
跨國製藥公司禮來(Eli Lilly)正在使用自然語言處理幫助全球三萬多名員工在公司內部和外部共享準確的、及時的資訊。禮來公司開發了一套名為Lilly Translate的本土IT解決方案,使用自然語言處理和深度學習,透過經過驗證的API層產生內容翻譯。
先前的多年,禮來公司是依靠第三方人工翻譯供應商來翻譯各種內容的,從內部培訓材料一直到與監管機構的正式技術交流內容。現在,Lilly Translate服務為使用者和系統提供了Word、Excel、PowerPoint和文字的即時翻譯,並且保持文件格式不變。禮來公司使用生命科學和禮來內容訓練的深度學習語言模型,幫助提高翻譯的準確性,打造能夠識別禮來特定術語和行業特定技術語言的精煉語言模型,同時保持受監管文件的格式。
禮來公司副總裁、資訊和數位化解決方案資訊長Timothy F. Coleman表示:「Lilly Translate涉及公司的各個領域,從人力資源到企業審計服務,再到道德和合規熱線、財務、銷售和行銷、監管事務以及許多其他領域。這節約了大量的時間,現在翻譯工作只需要幾秒鐘,而不是幾週的時間,讓關鍵資源有時間可以集中用於其他重要的業務活動上。」
Coleman給出的建議:支持那些熱情驅使的項目。 Lilly Translate最初是由一位好奇的軟體工程師發起的一個充滿熱情的項目,他的想法是解決Lilly Regulatory Affairs系統組合的一個痛點:業務合作夥伴在翻譯服務方面不斷遇到延遲和摩擦。 Coleman與其他高階主管和經理們分享了這個想法和技術願景,立即獲得了禮來全球監管事務國際領導層的專案支持,後者主張對該工具進行投入。
「[這個想法]很好地結合了探索和學習新興技術的機會,最初這是一個很好的學習機會,現在這變成了禮來軟體工程師抓住並運行起來的一個很好的專案機會。」
埃森哲正在利用自然語言處理做法律分析。埃森哲的法律智慧合約探索(Accenture Legal Intelligent Contract Exploration,ALICE)專案幫助這家有2800名專業人士的全球服務企業在其數百萬份合約中進行文字搜索,包括搜尋合約條款等。
ALICE使用了“詞嵌入”,一種自然語言處理方法,也就是可以根據語義相似性輔助詞與詞之間的對比。該模型會逐段檢查合約文件,尋找關鍵字以確定該段落是否與特定的合約條款類型相關。例如,「洪水」、「地震」或「災難」等字詞通常與「不可抗力」子句一起出現。
埃森哲數位業務轉型、營運和企業分析全球常務董事Mike Maresca表示:「隨著我們持續利用這項能力並且不斷對其進行增強,它的用途不斷擴大,我們看到了額外的價值機會,而且我們正在尋找從現有數據中獲取價值的新方法。」
埃森哲表示,該項目大大縮短了律師手動閱讀文件以獲取特定資訊的時間。
Maresca給的建議:不要害怕深入探索自然語言處理。 「如果創新是企業文化的一部分,你就不能害怕失敗,讓我們放手去實驗和和迭代吧。」
Verizon的業務服務保障部門正在使用自然語言處理和深度學習來自動處理客戶的請求評論。該部門每個月會收到10萬多個入站請求,以前,他們必須閱讀這些請求並採取措施,直到Verizon的IT部門——Global Technology Solutions (GTS)——打造了支援AI-Enabled Digital Worker for Service Assurance。
這個Digital Worker將基於網路的深度學習技術與自然語言處理相結合,以讀取主要透過電子郵件和Verizon入口網站發送的維修單,它會自動回應最常見的請求,例如報告當前工單狀態或修復進度更新,更複雜的問題則提交給人類工程師。
「透過自動回應這些請求,我們可以在電子郵件發送後的幾分鐘內而不是幾小時內做出回應,」Verizon業務集團全球技術解決方案(GTS)系統工程執行總監Stefan Toth說。
2020年2月Verizon曾對外表示,自去年第二季以來Digital Worker每月節省了近10,000個工時。
Toth給予的建議:尋求開源。 「環顧四周,和你的業務夥伴建立聯繫,我相信你一定會找到機會。在做出大量財務承諾之前,先考慮一下開源和實驗,我們發現現在有很多可用的開源軟體。」
醫院和娛樂連鎖商Great Wolf Lodge開發的Artificial Intelligence Lexicographer(GAIL)會對月度研究中的評論進行篩選,確定作者是否可能是網路水軍、批評者或中立方。
這個AI工具利用自然語言處理,對67000多條評論進行了專門針對服務業的訓練。 GAIL運行在雲端,使用內部開發的演算法,可發現顯示受訪者對Great Wolf Lodge看法的關鍵要素。 Great Wolf Lodge方面表示,截至2019年9月,GAIL的準確率可以達到95%,對於GAIL無法理解的一小部分信息,Great Wolf Lodge會使用傳統的文本分析進行處理。
Great Wolf Lodge資訊長Edward Malinowski表示:「我們希望在各方面都能更好地與客人互動。」
Great Wolf Lodge的業務營運團隊使用GAIL產生的洞察來調整他們的服務,目前該公司正在開發聊天機器人,用於回答客人關於Great Wolf Lodge服務的常見問題。
Malinowski給予的建議:避免為了技術而技術。要選擇那些可以在技術和實用性之間取得適當平衡、並與業務目標保持一致的工具。 「你必須小心什麼是噱頭,什麼是真正解決問題的解決方案。」
健康保險公司Aetna開發了Auto-adjudication of Complex Provider Contracts應用,用於自動閱讀每份合約中有關付款、免賠額和無關費用說明的註釋,然後計算定價並更新索賠。
該應用程式融合了自然語言處理和特殊資料庫軟體,以識別支付屬性,建立可由系統自動讀取的附加資料。因此,許多索賠申請一夜之間就可以解決。
該應用程式讓Aetna的50多位索賠裁決人員把精力重新集中到需要更高層次思維的合約和索賠,以及不同醫療保險公司之間的協調工作。
「這要歸結於為最終用戶提供更好的體驗,」Aetna首席技術官Claus Jensen說,該軟體將幫助Aetna成為醫療保健生態系統中供應商和患者的一個更好的合作夥伴。 「我們要做的不僅僅是支付帳單和透過電話回答各種問題。」
Aetna預計,截至2019年7月,這款應用程式幫助他們每年節省了600萬美元的加工和返工成本。
Jensen給的建議:縮小關注範圍,慢慢來。在理想的世界中,企業會是實施能夠解決很細分問題的AI。 Jensen說,基礎廣泛的解決方案是模糊的,最終的結果是失敗的,如果Aetna把通用AI應用到他們的業務中,肯定不會奏效的。此外,Aetna花了幾個月的時間來檢測這個過程,編寫規則,測試應用。 Jensen說,很多人沒有耐心放慢腳步、用正確的方式做事。
以上是五個成功案例探討自然語言處理的商業價值的詳細內容。更多資訊請關注PHP中文網其他相關文章!