ChatGPT 的出現或許表明,在過去幾年被逐漸認為到達產業化瓶頸的 AI 產業仍是一片最具創新性的沃土,蘊含著巨大的機會。
基於單模態 GPT-3 的 ChatGPT 「地震」餘波未平,多模態 GPT-4「海嘯」又公頃席捲朋友圈。
「這提醒我們,對人工智慧的預測是非常困難的。」OpenAI CEO Sam Altman 曾在 DALL-E 2 發布後講過這樣一句話。事實證明他是對的。基於符號主義的專家系統的衰落,讓人們一度認為人工智慧已走到盡頭,2012 年的深度學習點燃了希望,如今它已統領 AI 領域。隨著系統規模越來越大,訓練時間和資金成本也不斷膨脹。就在大家擔心在模型上加入參數正達到邊際效益遞減時,GPT-3、GPT-4 相繼昭告世人,更大規模、更複雜的深度學習系統確實可以釋放更為驚人的能力,而ChatGPT 的誕生,更是讓人看到了「顛覆性」的應用成果(假消息甚至稱GPT4參數量100兆)。
ChatGPT 的出現或許表明,在過去幾年被逐漸認為到達產業化瓶頸的AI 行業仍是一片最具創新性的沃土,蘊含著巨大的機會。而隨著新生產力初顯雛形,以工業製造為代表的行業或許將迎來更深入的AI 變革,迎來屬於產業的“ChatGPT 時刻”,在這一過程中與技術趨勢契合的科技企業也有望率先出圈。
迄今為止,主導 AI 領域的模型仍然是針對特定任務的。 AI 企業開發的模型在特定範圍內有不錯的表現,但工程師發現其泛化能力不足以支援部署到更廣泛場景。用業內人士的話來說,已經訓練了很多模型,但仍然需要茫茫多的模型。
這一瓶頸在高度碎片化工業製造領域幾乎被 N 倍放大。因為工業製造中細分領域眾多,各領域在生產流程、製程、生產線配置、原料及產品類型上均具有較大差異性。鋰電池生產可分為十幾道工序,工藝點數以千計,一條產線至少有2500 個關鍵的品質控制點;液晶面板生產涉及上百道工序,生產過程中可能出現的面板缺陷種類多達120種;手機有數百種零件,涉及數百個供應商,每個零件可能有數十種缺陷要做檢測。
現有的深度學習模型泛化程度低,即使在同一產業,模型的可重複使用比例也比較低。例如,如果要服務一家全球領先的手機品牌的整個智慧產線,可能需要打造數十萬個演算法模型(不包括後續軟硬體的迭代升級)。
現在,這個棘手的問題成為了 ChatGPT 背後所代表的基礎模型(大模型)的典型場景。
在2022 年,一篇來自Google、史丹佛大學、北卡羅來納大學教堂山分校以及DeepMind 等機構的研究論文[1],介紹了大模型的「Emergent Ability(突現能力)」,即有些現像不存在於較小的模型中但存在於較大的模型中,他們認為模型的這種能力是突現的。雖然這種能力目前主要體現在語言模型上,但它也激發了在視覺模型、多模態模型上未來的研究。
根據史丹佛大學以人為本人工智慧中心(HAI)基礎模型研究中心(CRFM)的說法,「它(大模型)代表著構建AI 系統的一種新的成功範式,在大量數據上訓練一個模型,並使其適應多種應用”[2]。
這種通用能力正是工業製造所需要的。工業製造面對的場景五花八門,如何透過穩定的技術體系,在高度碎片化的需求中打造通用的技術能力,成為任何一家試圖在此大展身手的科技企業的最大挑戰。
思謀科技創辦人賈佳亞在公司成立之初曾提到AI 2.0 概念,其與在當下廣泛採用AI 1.0 的AI 公司有所區別的一個核心要點,就是對通用性的強調。 「我們想做新一代的AI 體系架構,把以前別人在單一場景做的事情,用統一的架構去解決它,在不同場景裡做到通用」,賈佳亞說,「從底層構建更智能的演算法,用標準化的手段解決分散的工業場景,克服可複製性和標準性等關鍵性問題。」
思謀科技最受歡迎的產品SMore ViMo 工業平台,就是通用性設計思維的典型例子,它是針對工業場景打造的首個跨產業中樞平台,具有多場景通用性。不僅滿足新能源、半導體、汽車、消費性電子等多個產業領域超過1000 種細分應用場景需求,還靈活支援多種高難度工業視覺方案設計需求,例如產線的物料追蹤、缺陷定位、工件計數、外觀瑕疵檢測等等。
SMore ViMo 智慧工業平台的系統架構。
這條路的重要特點是比較好地平衡了敏捷、個人化與低邊際成本。透過 SMore ViMo 平台,思謀科技已經可以同時支撐工業中不同產業的上百個項目,未來還有望再擴大十倍,同時支撐上千個項目,為 AI 的產業應用帶來效率上的突破。
在率先於大規模工業場景使用 Transformer 技術,極大提高智慧製造效率之後,思謀也再次第一時間擁抱大模型。思謀團隊是最早對大模型在工業領域的 Emergent Ability 進行研究和產業化的團隊,其工業大模型利用少量缺陷樣本進行 in-context learning,從而使基礎模型快速適應特定工業場景,並完成特定任務。
在一些業內人士看來,ChatGPT 及其背後更通用的技術的成功,將推動 AI 應用進入一個新的階段。在以工業製造為代表的各行各業中,過去紮根產業,擁抱這一趨勢,完成數據與技術落地閉環的企業擁有更多優勢,在未來應用大爆發的過程中亦會更受到青睞。
在工業製造領域,不同「語言」之間也有著深刻隔閡。有業內人士表示,工業製造業累積了許多數據,但製造業的工程師(如機械工程師、材料工程師)還是很少去寫程式來把這些數據利用起來,而AI 開發者也面臨理解產業問題的挑戰,這在很大程度上約束了技術的落地。
思謀科技的演算法工程師表示,ChatGPT 背後的技術,如 RLHF (Reinforcement Learning from Human Feedback,基於人類回饋的強化學習),讓他們看到可以在現有的工作上更進一步。
RLHF 是強化學習的一個擴展,它將人類的回饋納入訓練大模型的過程,為機器提供了一種自然的、人性化的互動學習過程,就像人類從另一個專業人士身上學習專業知識的方式一樣。透過在 AI 和人類之間架起一座橋樑,RLHF 讓 AI 快速掌握了人類經驗。
他們表示,工業AI 未來可以孕育出一個主動學習AIaaS(AI As a Service,人工智慧即服務)平台,透過演算法工程師和標註專家的配合,利用RLHF 技術訓練大模型,用人類知識讓AI 理解工業問題,並滿足特定工業任務的要求,讓不會編程的工業專家也能訓練AI 模型。
目前,思謀科技已經在探索 RLHF 和工業結合的應用場景。
此外,ChatGPT 這種簡單的互動模式與工業製造中落地 AI 的策略亦十分相似。工業領域場景複雜,好的產品一定是簡單易用的,例如透過簡潔的交互,一鍵化部署方案,減少交付過程中的訓練成本與學習負擔。
許多程式設計師表示,ChatGPT 相當於重新建構了一座宏偉的巴別塔,與電腦的交流,不再是程式設計師的專利,它已經可以理解部分需求,並生產簡單的程式碼方案。但現在,我們可以預見在不久的將來,製造領域的從業人員也可以在 AI 平台上實現自行編程,根據產線需求開發模型。這樣也能幫助解決製造業 AI 人才短缺的問題。
「只有當電腦系統可以突破工業落地中的幾大難題,實現自動演算法組合和部署,人類僅需參與少量客製化演算法設計時,AI 的跨領域規模產業化才具備實現的可能。」賈佳亞曾表示。
事實上,思謀科技很早開始便構想打造一個可實現技術快速迭代的開發平台,只需把圖片上傳,即可自動標註缺陷,一鍵測試得到產品級的模型或SDK,減少專案中大量投入的演算法成本。
隨著專案的迭代,思謀科技逐漸把更成熟的產業方案和實用經驗整合到產品中,進而推出了完整的產品類型,讓客戶無需在思謀科技員工的幫助下即可自行體驗與使用,從而形成了產品最早的商業化應用。
隨著科技的進步,無論是面向消費者,或是針對工業製造這樣的產業,我們已經看到了更普惠科技應用,正在帶來巨大的機會。
十年來,AI 技術的商業化受到了許多質疑。這一次,ChatGTP 背後所代表的技術突破,預示著一場革命的到來,AI 有可能真的成為普世的生產力基礎設施。
「GPT (generative pre-trained transformer)也完全可以是general - purpose technology (通用技術)的縮寫」,《經濟學人》的一篇文章中寫到,「一種翻天覆地的創新,可以像蒸汽機、電力和電腦那樣提升各行各業的生產力”[3]。
始於 20 世紀 80 年代的個人電腦革命,到 90 年代末期開始真正提升生產力,因為這些機器變得更便宜、更強大,還能連接到網路。深度學習的轉折發生在 2012 年,彼時 AlexNet 神經網路在 ImageNet 比賽中獲得冠軍,至此大量研究開始鋪開,激發人們將其應用於各個領域。十多年的時間,深度學習技術正跨越大規模賦能產業的門檻。
回顧工業製造智慧化的發展歷程,技術能力和演算法無法滿足實際應用需求、解決方案複製性較差難以落地、新科技公司與製造業企業溝通成本高等挑戰一直存在。而目前基礎模型(大模型)表現出多領域多任務的通用化能力,正在打破這些行業「障礙」,並用低成本、普惠的方式,「席捲」容錯率極低、成本敏感的產業應用。
用 AI 解決產業問題蘊含著機會,ChatGPT 是一個起點,隨著一些紮根產業的技術公司的持續深耕,越來越多的行業正在迎來 AI 應用的 “ChatGPT 時刻”。
以上是工業AI也將迎來「ChatGPT時刻」的詳細內容。更多資訊請關注PHP中文網其他相關文章!