嘉賓| 譚中意、祝世虎
整理| 徐傑承
2022年對於人工智慧而言注定是值得被銘記的一年,在這一年中,人工智慧無論在技術或產業層面都取得了巨大發展與長足的進步,大量創新技術從概念走向實踐。年初,AI加持下的冬奧為我們帶來了煥然一新的觀賽體驗;年中,AI繪畫從虛幻走向現實並斬獲多項賽事大獎;年末,ChatGPT的橫空出世將再次將這一整年的狂歡推向高潮......
無論是底層技術的一次次突破,還是各類應用的接連綻放,在過去的一年之中,人工智慧向我們展示了它的無限可能。為了能更全面地了解人工智慧領域的發展現狀與未來趨勢,51CTO內容中心特別邀請第四範式架構師譚中意;光大信託資訊技術部副總經理祝世虎兩位業內資深專家,共同探討了有關人工智慧科技與產業的5個主題,希望能從中得到更多答案。
譚中意:技術層面2022年最熱的關鍵字無疑是“AIGC”,而在產業層面我想應該是「AI 工程化」或叫MLOps。因為如今無論是國內或國外,技術媒體、產品以及創投領域對於AI工程化的關注度都非常高。 AI工程化和MLOps的核心概念就是讓機器學習在企業內部更快地實現規模化落地,這也是過去一年人工智慧相關產業所最關注的。
祝世虎:從政策角度來看,2022年政府主導了資料要素的國家戰略,提出了資料要素是重組全球資源;重塑全球經濟結構;改變競爭格局的關鍵力量。目前中國的 IT 底層的標準、架構、產品、生態,大多是由國外的科技廠商決定的,因此有許多的底層技術、資訊安全等問題。所以隨著全球的 IT 生態由過去的單一層級向未來的多層方向發展,我們需要建立自己的 IT 的底層框架。因此,在信創的背景下,我認為2022年人工智慧甚至是整個科技產業的關鍵字應該是「科技有國界」。
譚中意:應用層面,在AI工程化領域,第四範式在過去一年將大量自研技術累積進行了對外開源,其中包括線上線下一致性的生產級特徵平台OpenMLDB,能夠實現對快速開發企業內部的即時預測、風控與場景推薦,解決時序特徵、高效讀取以及線上線下一致性問題。開源一年多來,與上下游的開源技術生態形成了良好的合作,也取得了很好的成果。
在技術層面,第四範式始終堅持AI方向的深耕,現階段主要專注於企業內部兩種AI的落地。其一是感知類AI落地,例如CV、NLP。另一種則是決策類AI的落地,針對企業進行策略制定,例如風控、推薦、預測等此類與企業經營密切相關的場景。這一過程中比較重要的兩個關鍵點,其一是將模型以較高的質量進行快速上線;其二則是對模型進行持續的訓練、反饋與調整,使模型始終保持其前沿性與高效性。
對於AI場景較多的企業而言,在這種情況下,一家企業中就能夠產生規模化的效益,實現從量變到質變的躍遷,使企業從傳統的數據公司進化成AI公司,達到透過AI提升核心競爭力的目的。
祝世虎:近年來金融業對於人工智慧技術的應用已經比較成熟了,過去一年包括未來幾年主要做的事情就是利用金融業務去引領金融科技的發展。例如在消費金融領域,銀行在做消費金融的准入模型時,第一代是規則驅動的模型、第二代是規則 數據驅動的模型,第三代則是大數據驅動的模型。
而在現階段,智慧演算法要解決的核心問題就是樣本不足。在實際做智慧風控的過程中,我總結一套手冊。例如當資料的維度不足時,第一種方式,可以使用新型特徵組合方法AutoCross升維。第二種方式則是當樣本不足時,可以使用遷移學習。當樣本的標註成本較高的時候,許多樣本標註沒有,可以使用Active learning的方法。當樣本標註錯誤率偏高的時候,例如存在外來的一些數據,它標註的數據標籤錯誤率比較高,我們要用Confident Learning的演算法。而在當樣本的標籤非常少時,例如在用於交易反詐騙時,這個時候可以選擇用半監督學習的演算法。這也是在過去一兩年內總結出的相對成熟的應對方案。
#譚中意:未來從事AI應用的技術企業,可能會分為三種。第一種是有資源做大模型,例如擁有大量數據、海量算力;擁有業界頂尖科學家的企業,他們能做出精度很高且普適性較好的大模型,就像AutoAI,他們可能會以API的方式對外提供服務。
第二類則是具備豐富場景的企業,針對各個場景,例如AIGC可以用在各種需要內容的地方,來做出各種的應用。
第三類則是介於兩者之間,更多的是提供工具,能夠幫助兩者做更好的連接,例如保證數據的準確性、保證線上服務的穩定和監控、做模型的版本和Beta這類的企業。
從產業角度講,國內目前AI落地主要集中在企業智慧轉型的相關產業,目前最熱門的產業是金融業,有場景、有錢。幾乎是每個AI科技企業必爭的行業。
第二種有前景的是新消費、新零售。新消費和新零售在目前的狀態下,許多企業、許多產業不斷推出新品,新品的爆發速度是相當快的,而且它們透過現在很多新媒體和新管道的方式來做,對於行銷、物流、供應鏈方面有很多很多AI的需求。
第三種則是一些製造業,目前重點都還在一些安全檢查、安全生產、故障檢測這種傳統的CV領域,CV領域也能夠提升一定的效率,但是還到不了能夠徹底改變產業工作模式的時候,徹底顛覆可能還需要幾年時間。
祝世虎:從一個AI從業者的職業變化中,我們就很容易了解到人工智慧產業的變化趨勢。以個人為例,我最初從事的人工智慧演算法產業,而後從演算法轉做科技,再從科技轉到了做數據,現在又從做數據變成了做業務,這實際上是有很深刻的邏輯的。
起初在做模型時,我發現如果沒有科技去承載的話,模型只能嵌入到企業的風險管理中,它只能嵌入管理流程,並不能嵌入到具體的業務中,必須把模型嵌到科技系統中,才能下沉到具體的業務中,所以我從做模型到了做科技。
到了做科技之後,發現了第二個問題,就是對模型和演算法而言,資料對模型的貢獻度遠大於演算法對模型的貢獻度,意識到數據的重要性後,又轉而用科技去做數據去了。做完數據之後,又轉去做業務,這其中有兩個邏輯在裡面。第一,模型是基於數據的,數據是基於統計的,統計是基於口徑的,口徑是業務部門定的。但是業務部門在製定業務口徑的時候,往往出於業務的需要,對業務口徑進行策略性的模糊處理。其次,多數產業的數位轉型,本質還是業務去引領的,在產業發展這方面其實也是如此。
#譚中意:生成式AI近期得到了業界的廣泛關注,這的確是一件好事。 AI領域這兩年來,大模型的新場景其實是比較匱乏的。而如今ChatGPT之所以讓大家耳目一新是在於,真的讓用戶感覺它解決了很多之前多輪對話解決不了的問題,而且也用大模型的方式生成出了一些比較切實的答案,給大家更多的信心。市場永遠是需要技術熱點的,技術熱點的存在才能保持資本家的信心,而資本家的信心才能夠推動他們掏錢把這些技術更快的落下去。
對於生成式AI的商業化落地,可能分為三種。第一種,OpenAI這種有錢、有人、有演算法,透過API就可以足夠的生成Revenue了。例如AutoCAD這家公司,它的Photoshop現在已經整合了AIGC的部分功能,而另外幾家做AIGC的公司也產生了上千萬的Revenue。這是少數幾家做大模型的公司能做出的事。
第二類就是將AIGC的能力跟業務場景結合,業務整合商需要尋找很多業務的具體場景,然後再去思考成本、效率等問題,需要很多的設計,如果在剛需、利潤、推廣三方面都能夠實現進步,才能形成很好的模式。
第三類模式也是OpenAI的CEO最近提到的,在這兩者之間還有第三類公司,能對普通的、普適的大模型做Finetune的技術供應商,它能針對一個具體的商業場景,然後對大模型進行針對這種具體商業場景的Finetune,也能夠實現商業落地。
回到根本,都還是需要解決商業或解決使用者的實際問題,而這是需要不斷地去摸索和嘗試的。我很高興看到AIGC的火,讓大家對AI的事業有更多的信心,也能讓更多的創投把錢投進來。我覺得這都是好事。
祝世虎:同樣以OpenAI的ChatGPT為例,它最吸引人的地方在於,每次和它溝通,所收穫的內容都不一樣,這也是它最有意思的地方。但從應用的角度來看,這裡存在著一個很嚴重的問題,當使用者對這個系統每次輸入相同的變數時,它回傳的變數是不可控的,這意味著這個AI很難承擔責任。
以前包含現在,我們所使用的智慧客服都讓使用者感到非常傻,其語料都是事先設定好的。但正是這種“傻”,才使得許多行業敢去使用智能客服,因為其反饋給用戶的每一條信息都是受控的,它的每一句話都是公司能夠負責的。但是當智慧客服不可控時,在實用上就會產生許多問題。比如說當一個聯邦學習的公司來推薦聯邦學習演算法時,他會介紹這個演算法能幹什麼,但對於很多產業而言,恰恰關注的是我把我的資料聯邦給你了,我的資料使用範圍一定要受控,它一定不能做某件事,我關注的是它不能做什麼,而不是它能做什麼。
同樣,對ChatGPT來說,我關注的是你的說法一定要在我們能承受的範圍內,你的說法一定要受我們的控制,你不能異想天開的做一些你自己的發散的想法。但作為技術上來講,很遺憾我們目前還無法實現這一點,太過於靈活、太聰明的AI能幹出我們很多想不到且難以承擔後果的事,這是做技術和做產業不同的地方。
總的來說,科技的風景和商業模式之間更多的是間接的關係,生成式AI現階段的確能夠幫我我們做一些創造性的工作,但這裡的商業模式,目前我們還沒有完全跑通。而在需要更高精準度的工作中,生成式AI需要走的路還很遙遠。
譚中意:AI是一個演算法,它與各個企業的結合是必然的,尤其是隨著各個企業做數位化、做智慧轉型的展開,AI 各種企業各種場景,也就是AI everything,已經呈現出越來越快的趨勢了。
未來幾年內的killer app個人認為會是自動駕駛,自動駕駛是AI集大成的應用,它是能在極大程度方便人們出行的應用,當它和車、和路很好的結合,各種演算法都能發揮很好的作用,同時又把這種規章制度完善起來,未來五年內能大批落地的、能讓大家耳目一新的killer app很可能會是L4甚至L5級的自動駕駛。
祝世虎:未來五年之內,證券、股票的自動化交易將變得更加成熟,甚至取代人類。在這個領域中機器取代人是一個非常明顯的趨勢。而且值得關注的一點是,先前基於股價因子庫的演算法正被逐漸拋棄。 AI未來在自動化交易領域中面臨的最大的問題不會再是股價的變化,而是AI1要和AI2成為交易對手,兩者之間將會是模型的對抗。
也就是學習你的對手會怎麼處理這隻股票,當AI模擬得差不多時,使用者就可以賺錢了。所以說AI演算法未來會在自動化交易的領域90%甚至99%取代人類,而未來自動化交易的演算法將不再是現在常用的基於因子庫的模型,而會是藉鏡博弈論模型對抗的一套理論。而人們要做的,只是選取目標與策略,剩下的全權交給AI就夠了。
以上是年終訪談:人工智慧技術與產業的發展變革的詳細內容。更多資訊請關注PHP中文網其他相關文章!