今年以來,伴隨著ChatGPT的持續火爆,大模型也進入高速發展期,國內外多家知名科技企業相繼推出自主研發的大模型產品。那麼大模型的技術原理是什麼呢?
5月18日,受邀參加2023中國家用電器技術大會(CHEATC2023)的中國科學技術大學機器人實驗室主任陳小平教授分享了他的研究和觀點,他同時也擔任中國人工智慧學會人工智慧倫理與治理委員會主委,在本次大會上陳小平教授發表了「人工智慧的新發展:從大模型到柔性機器人」主題演講,介紹了人工智慧大模型的技術原理,以及人工智慧在應用層面的新技術趨勢。
中國科技大學教授陳小平
「大模型的根本原理就是在做預測」陳小平介紹道,人工智慧發展到現在已經開啟了第四次浪潮的進程,資料模型也由大數據驅動轉向大訓練驅動。和先前三波不同的是,新階段的人工智慧對訓練資料的質、量和取得方式都有了全新的要求,最終形成能夠應用於大規模真實場景的實例模型。他強調,大模型是由多種技術整合而成的智慧系統,而非單一或少數技術的簡單組合。 ”
大模型的興起來自生成式人工智慧,當前,生成式人工智慧已經並不僅是簡單的進行語言和圖像等內容的生成,而是基於對人的自然語言的精準處理來完成智慧化人機互動。陳小平表示:「目前階段,我們對於機器的語言處理預期是會說人話、能聽懂人話、能回答問題,即使回答不一定正確。其中,基本的要求是說話要符合人的語言習慣。 「由於人的語言習慣沒有科學標準但是有經驗標準,那麼機器如何掌握和利用人的語言習慣呢?陳小平表示:「大模型的基本研究思路和成功秘訣是:從人類大規模的語料中提取語言痕跡,並用於人機自然語言的互動之中。」
大模型透過從人類原始語料中提取包括字、詞、標點符號等語元,再根據前後語元的關聯性進行語元回看,最終實現行為的預測。原則上,回看的語元數量越多,預測的準確度就更高。至少有4000個語元能夠被大型模型回顧,某些模型能夠回顧高達10萬個語元。 」陳小平講到。大模型技術體係以預訓練模型為基礎大模型,再透過專門訓練的專用模型配合用戶引導模型來精準理解和回答用戶的問題。三大模型相互配合,人工智慧回答的品質可以實現大幅度提升。
儘管大型模型的出現為人工智慧帶來了新的創新路向,但它並不適用於現實場景的所有方面。據陳小平所述,當前中國亟待攻克的三大人工智慧領域是智慧製造、智慧農業和普惠養老。 「攻克這三大戰役,我們全球的格局將會發生徹底的改變。」另一方面,大模型帶來巨大變化的同時也帶來了新的挑戰。當大型模型是基於對人類功能進行模仿時,很可能會被認為具有情感和意識。這是因為人們習慣性地將自己對某個概念的理解套用到涉及該概念的整體結構中,認為該結構所表達的訊息也具備同樣的意義,但實際上並非如此。 」陳小平表示,大模型的應用還可能產生公共安全、就業和長期影響。
除了大型模型,陳小平教授還取得了關於「人工智慧在物理世界」的新的科研成果。目前,我們投入應用的人工智慧物理形態主要是剛性機器人,這種機器人的重複精度高,但靈巧性和安全性較低,適用於結構化的環境中,而在非結構化的環境中需要進行精準測量、建模和計算,技術要求較高,目前還不適用於大多數的產業。針對剛性機器人的這些缺點,陳小平提出了融差原理,在智慧機器人的操作對象的精準測量不可行、工作環境和操作對象的精準建模不可行、精準決策不可行這三個基本假設之下,研發了氣動蜂巢網路軟體手臂。這種手臂在靈活度和負荷能力方面均有良好的表現,並且在有外力干擾和物體進行不規則運動時,均能實現精準化控制。預計在家庭服務、情感互動、自動駕駛等領域,這種技術有廣泛的應用前景。另一方面,陳小平團隊也將柔性手臂和剛性機器進行了結合,帶來了「剛柔合一手爪」的實驗結果,在不改程式和硬體參數、不使用力回饋感測器的情況下,實現對多形態物品的精準抓握。
以上是CHEATC2023|中科大陳小平:從大模型到柔性機器人的詳細內容。更多資訊請關注PHP中文網其他相關文章!