搜尋
首頁科技週邊人工智慧人工智慧十問:越來越捲的AI,未來路在何方

最近幾年,人工智慧經歷了爆紅、發展、再到最近的熱度逐漸下降,似乎人工智慧已經變成了大廠才能玩的遊戲。

究其原因,就是人工智慧的「門檻」越來越高了。

前不久,GoogleAI的代表人物Jeff Dean發表了一個新的工作,但在業界卻引發了一陣不小的風波。究其原因,並不是工作本身有多好。這項研究只比最新結果提升了0.03%,但卻花了價值57,000多美元的TPU算力,這一下就炸鍋了。

很多人說,現在的AI研究變成了拼算力、拼資源的代表,普通學者卷不動了。

還有很多人有這樣的疑惑:人工智慧究竟為我們帶來了哪些改變?它除了下圍棋之外還會做什麼,它的未來還會如何發展?

帶著這些問題,我們和馮霽博士進行了深入溝通。他是創新工場南京AI研究院的執行院長、倍漾量化創始人,在AI領域有著多年的研究經驗。透過這次對談,讓我們對AI未來的發展和落地有了新的體會。

人工智慧創新,遇到天花板?

#Google最近這個問題的確受到了挺多關注,我覺得有三個問題值得思考:

第一,大廠開始逐漸地走向「暴力美學」,也就是用「超大規模的數據」 「超大規模的算力」,暴力探索深度神經網路的天花板。不過,這種方法的邊界和極限在哪?

第二,從學術和科研的角度,這個方法是否是AI唯一的出路? 事實上,目前已經有大量研究在探索其他的技術路線,例如怎麼做到從感知智能到認知智能去做轉變、怎樣利用比較小的數據量解決人工智慧遇到的問題,等等。

第三,對於工業界的實際應用,是否真的需要這麼大的算力? 工業界有大量任務是非語音圖像文字相關的,這也是在倒逼著學術界去做一些比較高效的演算法。

人工智慧演算法,只有深度神經網路?

90年代之前,「人工智慧」的代表技術還是以「符號主義」為主,也就是基於邏輯推理,去做Planning、Searching這樣的技術。

2010年後,迎來了人工智慧的一次重要的轉變,那就是用神經網路技術去更好地表示這些感知類別的任務。但是,目前還有大量的人工智慧的「聖杯」問題沒有解決,例如怎樣做邏輯推理、怎樣做常識、怎樣更好地對記憶進行建模等等。

為了解決這些問題,是不是用深度神經網路就夠?這可能是目前學術界和工業界更關心的下一個重要的方向。

人工智慧的未來:知覺 vs 認知?

所謂的「感知人工智慧」,其實就是近年來人工智慧成功落地的代表性例子,例如圖像辨識、語音轉文字,以及一些文字生成的任務等。

但更重要的是,怎麼從這種感知類別的任務,轉向具有認知能力的任務,尤其是怎麼用人工智慧的方式來實現邏輯推理、實現常識,從而真正實現通用人工智慧?

針對這個問題,據我所知,學術界主要有三條技術路線。

第一,仍然沿著神經網路這條路,透過不斷地堆資料和算力嘗試解決問題。

第二,嘗試導入符號主義的技術,也就是連結主義 符號主義的結合。

第三,繼續提升傳統的邏輯推理技術,而這條路線也是最難的。

資料:數位時代的石油怎麼採?

資料對於人工智慧工程來說,重要性已經越來越高了。 工業界提出了一個新的概念,叫做「以資料為中心」的開發模式。 相較之下,之前叫做「以模型為中心」。

傳統情況下,工程師更多的時間會花在如何建立一個模型、如何透過調參來讓這個系統的效能更好。但現如今,大家80%的注意力都放在如何讓資料集變得更好、如何讓訓練集變得更好、如何讓訓練集更平衡,然後讓這個模型在好的資料集上訓練,並得到比較好的結果。

隨著我們對資料隱私需求的逐漸增長,資料帶來的一些負作用以及非技術要求也越來越多了。例如當幾家機構做聯合建模的時候,出於對資料隱私的保護,資料不能夠在機構之間分享。 所以像聯邦學習這樣的技術,就是為了在保護資料隱私的前提下,實現聯合建模。

現在大家已經逐漸意識到,在具體的工業開發中每家機構不一樣的地方就是他們的數據。 現在有了非常便利的軟體開源框架,也有了非常高效的硬體實現,工程師就都轉而去關注數據了——這是一個Paradigm Shift,也就是範式級別的轉變。

我自己孵化的倍漾量化,是以AI技術為核心的對沖基金。在公司內部,每天需要儲存的資料量大概有25-30TB。因此我們就遭遇到了「內存牆」的問題。

為了回應海量資料對記憶體帶來的壓力,我們把資料分成了冷資料、溫資料和熱資料。 「冷數據」指的是,資料存取的頻率不是很高,落庫就好。 「熱數據」是指,我們要做大量的讀寫任務,而數據一般都比較散,每次讀寫的量又非常得大。那麼如何把熱數據很好的進行分散式儲存?

人工智慧十問:越來越捲的AI,未來路在何方

和純SSD方案相比,現在會有更好的解決方案,例如傲騰持久記憶體:它介於記憶體跟SSD之間,可以將熱數據做分散式存儲,就能一定程度地減緩「內存牆」的問題。

5「AI-原生」的IT基礎設施,是否會出現?

現在有個很火紅的概念叫做「雲端原生」,它促進了雲端運算基礎設施的重構。而針對人工智慧而生的「AI-原生」,也已經實實在在地發生了。 尤其在過去的10年,電腦的硬體創新其實都是在圍繞著人工智慧應用而發展出來的。

舉個例子,目前我們對於雲端可信任運算的需求越來越多了。例如AI模型的運算過程是一個公司的核心智慧財產權,如果把它放到雲端或是公有平台上,自然會擔心運算過程有被竊取的風險。

在這種情況下,有沒有基於硬體的解決方案?答案是肯定的,例如我們正在使用英特爾晶片上的SGX隱私沙盒,它能夠以硬體的方式來保障我們的運算,這個其實是跨機構之間合作的一個非常重要的基礎。 

這是一個非常典型的例子,也就是從需求出發,推動晶片或硬體廠商提供對應的解決方案。

人工智慧硬件,就等於GPU?

這個觀點確實就比較片面了。以倍漾量化每天的工作來舉例,當我們在做量化交易的時候,如果把資料從CPU拷貝到GPU,再拷貝回來,對於很多量化交易的任務就已經來不及了。也就是說,我們需要有一個非常高效能的、CPU版本的人工智慧模型的實作。

再比如,我們有很多任務需要在網卡上直接對資料做分析和處理,而網卡上一般帶的是FPGA晶片,它處理的資料如果要傳到GPU上就更來不及了。對於這種低時延、又需要人工智慧技術幫助的場景,我們需要一個異質的架構。

人工智慧十問:越來越捲的AI,未來路在何方

也就是說,不管是FPGA、ASIC,還是CPU、GPU,在不同的場景下,它們都有不同的用武之地。   

關於異質平台的編程,我看到工業界已經有了一些嘗試。例如英特爾的oneAPI,我覺得是蠻重要的一個工具。也就是說,oneAPI能讓同樣一套程式碼能夠自動地適配CPU、FPGA或其他類型的晶片。這樣將會大幅減少工程師的程式設計難度,也能夠讓他們專注在演算法創新上。

我覺得,這對推動異質應用非常重要。

人工智慧十問:越來越捲的AI,未來路在何方

未來人工智慧發展的方向,還有哪些?

我覺得,可能需要一個更好的端到端的解決方案。現在其實已經從「軟體1.0」升級到「軟體2.0」時代。也就是說,從傳統規則驅動的複雜軟體工程的構建,變成了數據驅動的軟體工程構建方法。在

之前,我們要靠很高的聰明才智寫一系列精妙的系統,才能讓整個程式能夠跑起來。這就類似於機械手錶,最好的程式設計師都把精力放在建構「齒輪」的運作、以及如何讓這個「手錶」能夠跑起來。

現在,如果這套運行的規則我不知道該怎麼定,那就直接把它撂給大量的資料或機器學習演算法,這個演算法會產生一個新的演算法,而這個新的演算法是我們想要去得到的。這種方式,有點像是去造一個造機器人的機器人。

在軟體2.0時代,整個軟體工程的開發範式將有一個很大的轉變,我們很希望得到一套端到端的解決方案,核心就是怎樣更方便地實現「以數據為中心」的軟體工程開發。

人工智慧,未來如何落地?

我覺得大概有兩面。第一,從工業界來看,還是要從第一原理出發,也就是基於自己的需求,並且綜合考慮到許多的非技術因素。例如我看到有一個公司想做小區安防的人臉辨識系統,但每個出入口後面要配4個非常昂貴的GPU,這就是典型的沒有從需求和成本出發。

第二,學術研究未必要跟風。就像我們在剛開始時說到的那樣,對於模型的規模,並不需要相互攀比:你有一個千億的,我就要搞個萬億的,你有個萬億的我就要搞一個十萬億的。

其實有大量的任務都需要小規模的參數,或是因為成本等限制,只能提供少量的樣本。在這種條件下,怎麼做創新、突破?這個是學術界應該主動擔起的責任。

人工智慧創業,還是風口嗎?

我們可以想想看,90年代末期,建個網站都要花2-3萬元,因為當時會網路程式設計技術的人鳳毛麟角。但在今天,可能任何一個高中生,滑鼠點一點就能蓋站。

也就是說,網路知識已經在每一個普通程式設計師的工具包裡了。

其實,人工智慧技術也是一樣。在2015年左右時,搭一套深度學習框架、還要在GPU上能跑起來,全球可能不超過1000個人。而現在經歷了指數級的成長,很多人都會了。我們有理由相信,大概在五年後,隨便一個程式設計師的工具包裡就有更豐富的人工智慧解決方案,它的實現的門檻肯定是在不斷降低的。也只有這樣,人工智慧技術才能更為普遍地應用在每一個公司。

所以,大廠裡的AI Lab是必然會消失的。 就像2000年前後,很多公司都有一個Internet Lab,就是把公司所有跟網路有關的事情專門搞一個實驗室,由這個實驗室向其他的業務部門做技術輸出。這是因為會這項技術的人特別少,他們才會做這件事。

#

AI Lab也是一樣的,當AI技術落地的門檻逐漸降低時,大量業務部門的人也擁有類似的技術,那這種AI Lab就必然會消失。我覺得這就是在技術發展過程中一個臨時產品,這是個好事情。 當大廠沒有AI Lab的時候,大概就是人工智慧真正遍地開花的年代。

10 人工智慧,如何普惠大眾?

第一,我們還需要摩爾定律的加持。 現在還有大量的任務對算力的要求很大,我們必須不斷進行硬體的迭代和演算法的更新。只有當需要在集群上跑的事情能在手機上跑,AI才可能有大量的落地。

第二,人工智慧創新的重點,要從網路的業務轉向一些傳統的產業。 之前大家的精力都在怎樣用人工智慧做更好的視覺解決方案,或是更好的推薦系統,或更好的P圖軟體。但在實體經濟中,其實也有大量產生數據的部門和業務。當這些實體經濟數據能夠更好地資訊化之後,它們所帶來的價值可能遠超於目前的虛擬經濟。

以上是人工智慧十問:越來越捲的AI,未來路在何方的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
加固芬特的指南 - 分析Vidhya加固芬特的指南 - 分析VidhyaApr 28, 2025 am 09:30 AM

增強者通過教授模型根據人類反饋進行調整來震撼AI的開發。它將監督的學習基金會與基於獎勵的更新融合在一起,使其更安全,更準確,真正地幫助

讓我們跳舞:結構化運動以微調我們的人類神經網讓我們跳舞:結構化運動以微調我們的人類神經網Apr 27, 2025 am 11:09 AM

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

新的Google洩漏揭示了雙子AI的訂閱更改新的Google洩漏揭示了雙子AI的訂閱更改Apr 27, 2025 am 11:08 AM

Google的雙子座高級:新的訂閱層即將到來 目前,訪問Gemini Advanced需要$ 19.99/月Google One AI高級計劃。 但是,Android Authority報告暗示了即將發生的變化。 最新的Google P中的代碼

數據分析加速度如何求解AI的隱藏瓶頸數據分析加速度如何求解AI的隱藏瓶頸Apr 27, 2025 am 11:07 AM

儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。首席執行官慶祝AI的進步時,工程師努力應對緩慢的查詢時間,管道超載,一個

Markitdown MCP可以將任何文檔轉換為Markdowns!Markitdown MCP可以將任何文檔轉換為Markdowns!Apr 27, 2025 am 09:47 AM

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。檢索結構化

如何使用Google ADK進行建築代理? - 分析Vidhya如何使用Google ADK進行建築代理? - 分析VidhyaApr 27, 2025 am 09:42 AM

利用Google的代理開發套件(ADK)的力量創建具有現實世界功能的智能代理!該教程通過使用ADK來構建對話代理,並支持Gemini和GPT等各種語言模型。 w

在LLM上使用SLM進行有效解決問題-Analytics Vidhya在LLM上使用SLM進行有效解決問題-Analytics VidhyaApr 27, 2025 am 09:27 AM

摘要: 小型語言模型 (SLM) 專為效率而設計。在資源匱乏、實時性和隱私敏感的環境中,它們比大型語言模型 (LLM) 更勝一籌。 最適合專注型任務,尤其是在領域特異性、控制性和可解釋性比通用知識或創造力更重要的情況下。 SLM 並非 LLMs 的替代品,但在精度、速度和成本效益至關重要時,它們是理想之選。 技術幫助我們用更少的資源取得更多成就。它一直是推動者,而非驅動者。從蒸汽機時代到互聯網泡沫時期,技術的威力在於它幫助我們解決問題的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

如何將Google Gemini模型用於計算機視覺任務? - 分析Vidhya如何將Google Gemini模型用於計算機視覺任務? - 分析VidhyaApr 27, 2025 am 09:26 AM

利用Google雙子座的力量用於計算機視覺:綜合指南 領先的AI聊天機器人Google Gemini擴展了其功能,超越了對話,以涵蓋強大的計算機視覺功能。 本指南詳細說明瞭如何利用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器