9月7日,在2023外灘大會「新一代資料底座-探索圖智能的應用與發展」分論壇上,螞蟻集團帶來了融合研究—「大圖模型」(Large Graph Model ,簡稱LGM)。本研究將圖計算與圖學習及大語言模型結合,利用大語言模型的生成能力和圖計算的關聯關係分析能力,提供更直觀、更全面的信息呈現和更精準的洞察,從而更好地解決海量複雜的數位化應用難題。目前螞蟻已完成第一階段「生成式異質圖增強」的研究工作,相關成果論文被世界電腦頂會(WWW 2023)收錄。
圖運算是一種強大的資料處理技術,可以解決複雜關係網絡中的關聯性難題,在金融反詐欺、天氣預報、藥物開發,甚至類腦研究領域都有應用,被譽為人工智慧「牛鼻子」。大模型是最有可能走向通用人工智慧的技術,在某些領域的任務達到了與人類相當甚至更好的表現。
為什麼要用尖端技術驅動尖端技術?大語言模型不能獨立完成資料分析和挖掘任務嗎?螞蟻集團高級技術專家劉永超表示,大語言模型可以推理出隱性關聯關係,但無法繪製關係圖,而研究資料關係需要體現清晰的鏈路,使用圖結構表示更便於理解。 「將大語言模型與圖計算結合,就是先從海量資訊中邏輯推理,再利用超級計算算出關係,這就類似給人類大腦外接了一台超級計算機,能力更強了”,劉永超解釋。
(螞蟻集團劉永超分享「大圖模型」研究成果)
在這項研究中,螞蟻集團主要進行了兩項工作。第一,利用大語言模型豐富圖數據。有別於普通的上下文依賴模型,大語言模型可以根據現有資料產生新的資料點。這項工作名為 「生成式異質圖增強」工作,即透過大語言模型來擴展和豐富不同類型的圖資料。第二,透過Prompt(一種指令或提示)引導模型學習並發現特定資料特性。例如,設定一個 Prompt“一年內違約3次以上的群體的共同特徵”,模型便會產生滿足特定條件的資料樣本。這種能力可以加速資料分析和特性發現的過程。
螞蟻集團是圖運算領域的領導者,與清華大學共同研發的圖運算平台TuGraph曾三度打破圖資料庫權威評測LDBC SNB世界紀錄,2021年獲得世界網路大會「領先科技成果」獎,2023年入選IDC MarketScape中國圖資料庫市場「領導者」象限。近年來業界為圖智能走向通用人工智慧進行了多種嘗試,「大圖模型」就是螞蟻為了破解產業難題,從2022年初開始的研究。伴隨2022年底大模型爆發,這項研究得到了可行性驗證。
在本場論壇上,國內外圖智慧領域的專家和學者也分享了更多熱點進展。加拿大滑鐵盧大學級教授M. Tamer Özsu分享了在業界富有挑戰性的流式圖運算技術。浙江大學電腦學院教授陳華鈞講述了大模型時代知識處理的機會與挑戰。之江實驗室圖計算研究中心副主任陳紅陽帶來了之江朱雀圖科學計算與生物醫藥研發的最新研究。機器之心聯合創辦人、副主編李亞洲認為圖智能和大模型結合的研究可望為數據智能帶來重大提升。
關於人工智慧和圖計算的可能性,外灘圖智慧論壇匯集了不同視角的見解,為圖智能發展描繪了重要的發展脈絡。
以上是圖智能走向通用人工智慧怎麼做?外灘大會這項研究有乾貨的詳細內容。更多資訊請關注PHP中文網其他相關文章!