首頁  >  文章  >  科技週邊  >  人工智慧十問:越來越捲的AI,未來路在何方

人工智慧十問:越來越捲的AI,未來路在何方

WBOY
WBOY轉載
2023-04-08 16:21:031044瀏覽

最近幾年,人工智慧經歷了爆紅、發展、再到最近的熱度逐漸下降,似乎人工智慧已經變成了大廠才能玩的遊戲。

究其原因,就是人工智慧的「門檻」越來越高了。

前不久,GoogleAI的代表人物Jeff Dean發表了一個新的工作,但在業界卻引發了一陣不小的風波。究其原因,並不是工作本身有多好。這項研究只比最新結果提升了0.03%,但卻花了價值57,000多美元的TPU算力,這一下就炸鍋了。

很多人說,現在的AI研究變成了拼算力、拼資源的代表,普通學者卷不動了。

還有很多人有這樣的疑惑:人工智慧究竟為我們帶來了哪些改變?它除了下圍棋之外還會做什麼,它的未來還會如何發展?

帶著這些問題,我們和馮霽博士進行了深入溝通。他是創新工場南京AI研究院的執行院長、倍漾量化創始人,在AI領域有著多年的研究經驗。透過這次對談,讓我們對AI未來的發展和落地有了新的體會。

人工智慧創新,遇到天花板?

#Google最近這個問題的確受到了挺多關注,我覺得有三個問題值得思考:

第一,大廠開始逐漸地走向「暴力美學」,也就是用「超大規模的數據」 「超大規模的算力」,暴力探索深度神經網路的天花板。不過,這種方法的邊界和極限在哪?

第二,從學術和科研的角度,這個方法是否是AI唯一的出路? 事實上,目前已經有大量研究在探索其他的技術路線,例如怎麼做到從感知智能到認知智能去做轉變、怎樣利用比較小的數據量解決人工智慧遇到的問題,等等。

第三,對於工業界的實際應用,是否真的需要這麼大的算力? 工業界有大量任務是非語音圖像文字相關的,這也是在倒逼著學術界去做一些比較高效的演算法。

人工智慧演算法,只有深度神經網路?

90年代之前,「人工智慧」的代表技術還是以「符號主義」為主,也就是基於邏輯推理,去做Planning、Searching這樣的技術。

2010年後,迎來了人工智慧的一次重要的轉變,那就是用神經網路技術去更好地表示這些感知類別的任務。但是,目前還有大量的人工智慧的「聖杯」問題沒有解決,例如怎樣做邏輯推理、怎樣做常識、怎樣更好地對記憶進行建模等等。

為了解決這些問題,是不是用深度神經網路就夠?這可能是目前學術界和工業界更關心的下一個重要的方向。

人工智慧的未來:知覺 vs 認知?

所謂的「感知人工智慧」,其實就是近年來人工智慧成功落地的代表性例子,例如圖像辨識、語音轉文字,以及一些文字生成的任務等。

但更重要的是,怎麼從這種感知類別的任務,轉向具有認知能力的任務,尤其是怎麼用人工智慧的方式來實現邏輯推理、實現常識,從而真正實現通用人工智慧?

針對這個問題,據我所知,學術界主要有三條技術路線。

第一,仍然沿著神經網路這條路,透過不斷地堆資料和算力嘗試解決問題。

第二,嘗試導入符號主義的技術,也就是連結主義 符號主義的結合。

第三,繼續提升傳統的邏輯推理技術,而這條路線也是最難的。

資料:數位時代的石油怎麼採?

資料對於人工智慧工程來說,重要性已經越來越高了。 工業界提出了一個新的概念,叫做「以資料為中心」的開發模式。 相較之下,之前叫做「以模型為中心」。

傳統情況下,工程師更多的時間會花在如何建立一個模型、如何透過調參來讓這個系統的效能更好。但現如今,大家80%的注意力都放在如何讓資料集變得更好、如何讓訓練集變得更好、如何讓訓練集更平衡,然後讓這個模型在好的資料集上訓練,並得到比較好的結果。

隨著我們對資料隱私需求的逐漸增長,資料帶來的一些負作用以及非技術要求也越來越多了。例如當幾家機構做聯合建模的時候,出於對資料隱私的保護,資料不能夠在機構之間分享。 所以像聯邦學習這樣的技術,就是為了在保護資料隱私的前提下,實現聯合建模。

現在大家已經逐漸意識到,在具體的工業開發中每家機構不一樣的地方就是他們的數據。 現在有了非常便利的軟體開源框架,也有了非常高效的硬體實現,工程師就都轉而去關注數據了——這是一個Paradigm Shift,也就是範式級別的轉變。

我自己孵化的倍漾量化,是以AI技術為核心的對沖基金。在公司內部,每天需要儲存的資料量大概有25-30TB。因此我們就遭遇到了「內存牆」的問題。

為了回應海量資料對記憶體帶來的壓力,我們把資料分成了冷資料、溫資料和熱資料。 「冷數據」指的是,資料存取的頻率不是很高,落庫就好。 「熱數據」是指,我們要做大量的讀寫任務,而數據一般都比較散,每次讀寫的量又非常得大。那麼如何把熱數據很好的進行分散式儲存?

人工智慧十問:越來越捲的AI,未來路在何方

和純SSD方案相比,現在會有更好的解決方案,例如傲騰持久記憶體:它介於記憶體跟SSD之間,可以將熱數據做分散式存儲,就能一定程度地減緩「內存牆」的問題。

5「AI-原生」的IT基礎設施,是否會出現?

現在有個很火紅的概念叫做「雲端原生」,它促進了雲端運算基礎設施的重構。而針對人工智慧而生的「AI-原生」,也已經實實在在地發生了。 尤其在過去的10年,電腦的硬體創新其實都是在圍繞著人工智慧應用而發展出來的。

舉個例子,目前我們對於雲端可信任運算的需求越來越多了。例如AI模型的運算過程是一個公司的核心智慧財產權,如果把它放到雲端或是公有平台上,自然會擔心運算過程有被竊取的風險。

在這種情況下,有沒有基於硬體的解決方案?答案是肯定的,例如我們正在使用英特爾晶片上的SGX隱私沙盒,它能夠以硬體的方式來保障我們的運算,這個其實是跨機構之間合作的一個非常重要的基礎。 

這是一個非常典型的例子,也就是從需求出發,推動晶片或硬體廠商提供對應的解決方案。

人工智慧硬件,就等於GPU?

這個觀點確實就比較片面了。以倍漾量化每天的工作來舉例,當我們在做量化交易的時候,如果把資料從CPU拷貝到GPU,再拷貝回來,對於很多量化交易的任務就已經來不及了。也就是說,我們需要有一個非常高效能的、CPU版本的人工智慧模型的實作。

再比如,我們有很多任務需要在網卡上直接對資料做分析和處理,而網卡上一般帶的是FPGA晶片,它處理的資料如果要傳到GPU上就更來不及了。對於這種低時延、又需要人工智慧技術幫助的場景,我們需要一個異質的架構。

人工智慧十問:越來越捲的AI,未來路在何方

也就是說,不管是FPGA、ASIC,還是CPU、GPU,在不同的場景下,它們都有不同的用武之地。   

關於異質平台的編程,我看到工業界已經有了一些嘗試。例如英特爾的oneAPI,我覺得是蠻重要的一個工具。也就是說,oneAPI能讓同樣一套程式碼能夠自動地適配CPU、FPGA或其他類型的晶片。這樣將會大幅減少工程師的程式設計難度,也能夠讓他們專注在演算法創新上。

我覺得,這對推動異質應用非常重要。

人工智慧十問:越來越捲的AI,未來路在何方

未來人工智慧發展的方向,還有哪些?

我覺得,可能需要一個更好的端到端的解決方案。現在其實已經從「軟體1.0」升級到「軟體2.0」時代。也就是說,從傳統規則驅動的複雜軟體工程的構建,變成了數據驅動的軟體工程構建方法。在

之前,我們要靠很高的聰明才智寫一系列精妙的系統,才能讓整個程式能夠跑起來。這就類似於機械手錶,最好的程式設計師都把精力放在建構「齒輪」的運作、以及如何讓這個「手錶」能夠跑起來。

現在,如果這套運行的規則我不知道該怎麼定,那就直接把它撂給大量的資料或機器學習演算法,這個演算法會產生一個新的演算法,而這個新的演算法是我們想要去得到的。這種方式,有點像是去造一個造機器人的機器人。

在軟體2.0時代,整個軟體工程的開發範式將有一個很大的轉變,我們很希望得到一套端到端的解決方案,核心就是怎樣更方便地實現「以數據為中心」的軟體工程開發。

人工智慧,未來如何落地?

我覺得大概有兩面。第一,從工業界來看,還是要從第一原理出發,也就是基於自己的需求,並且綜合考慮到許多的非技術因素。例如我看到有一個公司想做小區安防的人臉辨識系統,但每個出入口後面要配4個非常昂貴的GPU,這就是典型的沒有從需求和成本出發。

第二,學術研究未必要跟風。就像我們在剛開始時說到的那樣,對於模型的規模,並不需要相互攀比:你有一個千億的,我就要搞個萬億的,你有個萬億的我就要搞一個十萬億的。

其實有大量的任務都需要小規模的參數,或是因為成本等限制,只能提供少量的樣本。在這種條件下,怎麼做創新、突破?這個是學術界應該主動擔起的責任。

人工智慧創業,還是風口嗎?

我們可以想想看,90年代末期,建個網站都要花2-3萬元,因為當時會網路程式設計技術的人鳳毛麟角。但在今天,可能任何一個高中生,滑鼠點一點就能蓋站。

也就是說,網路知識已經在每一個普通程式設計師的工具包裡了。

其實,人工智慧技術也是一樣。在2015年左右時,搭一套深度學習框架、還要在GPU上能跑起來,全球可能不超過1000個人。而現在經歷了指數級的成長,很多人都會了。我們有理由相信,大概在五年後,隨便一個程式設計師的工具包裡就有更豐富的人工智慧解決方案,它的實現的門檻肯定是在不斷降低的。也只有這樣,人工智慧技術才能更為普遍地應用在每一個公司。

所以,大廠裡的AI Lab是必然會消失的。 就像2000年前後,很多公司都有一個Internet Lab,就是把公司所有跟網路有關的事情專門搞一個實驗室,由這個實驗室向其他的業務部門做技術輸出。這是因為會這項技術的人特別少,他們才會做這件事。

#

AI Lab也是一樣的,當AI技術落地的門檻逐漸降低時,大量業務部門的人也擁有類似的技術,那這種AI Lab就必然會消失。我覺得這就是在技術發展過程中一個臨時產品,這是個好事情。 當大廠沒有AI Lab的時候,大概就是人工智慧真正遍地開花的年代。

10 人工智慧,如何普惠大眾?

第一,我們還需要摩爾定律的加持。 現在還有大量的任務對算力的要求很大,我們必須不斷進行硬體的迭代和演算法的更新。只有當需要在集群上跑的事情能在手機上跑,AI才可能有大量的落地。

第二,人工智慧創新的重點,要從網路的業務轉向一些傳統的產業。 之前大家的精力都在怎樣用人工智慧做更好的視覺解決方案,或是更好的推薦系統,或更好的P圖軟體。但在實體經濟中,其實也有大量產生數據的部門和業務。當這些實體經濟數據能夠更好地資訊化之後,它們所帶來的價值可能遠超於目前的虛擬經濟。

以上是人工智慧十問:越來越捲的AI,未來路在何方的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除