在中國科學技術協會、中國科學院、中國工程院、浙江省人民政府、杭州市人民政府、浙江省人工智慧發展專家委員會指導下,由中國人工智慧學會、杭州市餘杭區人民政府主辦,浙江杭州未來科技城管理委員會承辦的2020全球人工智慧技術大會在「數位之都」-杭州,成功舉辦。在25日舉辦的大會主題報告環節,中國人工智慧學會理事長、國務院參事、中國工程院院士、清華大學資訊學院院長戴瓊海為我們帶來了題為「人工智慧的幾點思考」的精彩演講。
戴瓊海中國人工智慧學會理事長、國務院參事中國工程院院士、清華大學資訊學院院長
我想和大家談談我對人工智慧的幾點思考,包括一些值得商榷的問題。從幾千年前的原始社會,人們依靠石器工具來勞動;到農耕時期人們所使用的工具有所升級;到工業革命出現的蒸汽機進一步提升了生產力;電氣革命更是極大提升了人類的生產效率;而今資訊時代電子計算機的誕生延伸了我們的腦力,拓寬了我們的眼界和思想。馬克思說過,「各種經濟時代的區別,不在於生產什麼,而在於怎樣生產,用什麼勞動資料生產。勞動資料更能顯示一個社會生產時代的具有決定意義的特徵。」
#資訊時代出現了互聯網、電子電腦、通訊網路、太空技術、生物工程和原子能技術等一系列代表性的發明和創造,尤其是網路和電子電腦的誕生,拓展了人類自身和人與人之間互動的邊界。
現在人工智慧時代到來了,出現了深度神經網路和許多代表性的產業英雄,例如Elon Musk,也出現了無人系統、奈米科技、量子運算、物聯網等新科技和新產品,人們的工作、生活都發生了翻天覆地的改變。
跨學科交叉是人工智慧時代的典型標誌,例如潘雲鶴院士所提及的認知視覺和認知表達,都是典型的跨學科研究。人工智慧技術海納百川,如電腦視覺、自然語言理解、機器人和邏輯推理等,且在醫療、電子、金融等產業都發揮了巨大作用。以下我將從三個層面淺析一下人工智慧時代的幾個問題:第一個是算力;第二個是演算法;第三個是人與AI 怎樣相處?
首先,是算力。 1956 年Rosenblatt 的感知機只包含了512 個計算單元就能做資料分類。但人工智慧發展過程中一直受到算力的困擾,直到GordonMoore 提出了積體電路晶片上所整合的電晶體數量每18 個月翻一番,為後來的幾十年晶片技術的發展指明了方向。 1999 年,NVIDIA 發布了GPU 進行並行的資料處理,使得人工智慧朝向更廣闊的領域發展。 2012 年,Alex 使用AlexNet 進行GPU加速,開啟了深度網路應用的先河。接下來就是眾所周知的GoogleAlphaGo,擁有5000 個GPU,訓練40 天,就可以打遍天下無敵手,說明平行運算、專用晶片對人工智慧有重要的推動作用。
我們再看看現有技術的發展。串流影音佔全球網路下行流量的58%,2019 年8 月國內網路的終端數已經突破了20 億,這些數據都需要龐大的算力支撐。現在智慧醫療、智慧製造、無人駕駛,追求的更小、更快、更有智慧。所以人工智慧蓬勃發展對算力的需求超過了別的方面,成為人工智慧一個重要支撐。
但是算力的提升速度已經不再遵循摩爾定律了。從第一台計算機出現到後來的幾十年,晶片算力基本上符合摩爾定律。但隨著時間的推移,晶片上電晶體的密度成長已經不再遵循摩爾定律,反過來說就是晶片算力的成長速度已經無法滿足人工智慧技術的發展需求。於是國際科技巨頭都開始發力,像是Google的TPU 和中國的地平線、寒武紀都是將設計神經網路專用晶片來提升算力。但這些晶片都是專用的,無法滿足通用人工智慧的發展需求。
我以前常說,理學思維,工科實踐。物理要求什麼?比如量子力學、量子計算。眾所周知,英特爾、Google在處理特定任務時,發現量子計算速度遠高於現在的電腦。隨著有效量子位元的數量不斷增加,他們希望(特別是Google)在量子運算領域成為霸主。但現實是經過物理學家們的分析,其中許多問題尚未解決,例如如何長時間保持足夠的量子比特的相干性,這是一個重要問題;同時在這個時間內做出足夠的超高精度量子的邏輯計算也是一個難題。因此,在未來的一段時間裡要完全用量子計算提升算力,是完全實現不了的。於是,人們提出了存算一體的架構,希望突破儲存牆的限制,提升它的算力。這就是為什麼我說人工智慧時代走入了交叉時代,除了向物理要算力,還要向腦科學要算力,比如類腦計劃,希望透過模擬腦科學裡的機理提升算力;不僅如此,還要向物理的邊界、光電計算要算力;同樣還有也要向存算一體、光電要算力。
以下將介紹從光電計算要算力。這位普林斯頓大學的教授做過一個理論分析,進行神經網路運算的架構,從理論上推算,它能提升三個數量級的算力,同時功耗也能降低6 個數量級。功耗現在也是提升算力要考慮的重要議題。光電計算能夠為這方面帶來龐大的福利,使得算力提升三個數量級,功耗還能下降6 個數量級。目前這方面的研究工作已經起步。光電計算並不是新東西,它和人工智慧一樣,也是20 世紀50 年代誕生的。只是計算的電腦半導體、矽基的晶片就已經滿足需求,所以研究者就漸漸減少了在這方面的研究。尤其是在1990 年貝爾實驗室用砷化鉀做了一個光學開關來控制電腦的原型,由於當時對算力的需求較小,所以晶片就可以解決。而現在隨著人工智慧對晶片的極致要求,從2017—2019 年,許多機構都對光電計算的研究做出了重要貢獻,例如三維受控的衍射的傳播時間,以及全並行的光速計算。透過研究能夠很快地識別一個文字,因為光是不需要電的,所以這種光計算不需要耗電就可以做到以可控高維的光場傳播,從而實現高速高效並行的計算。因此建構光電計算的架構,成為現在解決算力的重要研究方向。
光學作為新的運算途徑,它帶來的最重要的變革,一是範式變革;二是算力提升;三是功耗下降。正因其諸多優點使得國內外許多研究機構都進行了相關研究。目前國際上做出的貢獻有三個,麻省理工做的干涉神經網路架構非常不錯;明斯特大學和劍橋是留相片材料,做脈衝的架構;清華大學是用衍射神經網路做架構。三種不同的方案都各有優勢,也各有不足。因此,在未來算力平衡上可以做出一番成績。大家可以試想一下,光電運算的算力能提供3 個數量級,我們超小型的智慧5G、智慧機器人、微型的修理機器人,尤其是我們現在研究的自動駕駛,光電智慧駕駛會推動這個方面的發展。所以,光電計算使無人系統更快、更小、更聰明。目前這個方向也引起了國際學術界和工業界的廣泛興趣,已經有許多機構在這方面進行研究,也希望大家能注意到這個方向。
光電智慧晶片最重要的特點是什麼?是它們對龐大的計算中心小型化。我們現在的運算中心都要消耗大量的電能,如果使用光電計算就能節省許多電能。第二,奈秒目標感知與辨識。奈秒的感知目標與辨識非常快,現在使用相機拍攝,要轉成電,然後再計算。試想如若它是直接光進到相機就計算了,那麼速度就變得非常快。因此光電智慧晶片對新基建裡的工業互聯網、電腦視覺、大數據分析和光通訊都有重要的支撐作用。這是對算力的一個探討、一個思路,也請大家多多批評。
第二是演算法。因為人工智慧最重要的是演算法,所以研究學者普遍都在研究演算法。那麼這些演算法怎麼來?現有人工智慧僅實現了簡單的初級視覺感知功能。就像剛才潘院士提到,有許多無人區的工作有待解決。在初級視覺感知資訊處理與高階認知智慧過程中,表現遠不如人腦,人腦具有物理學習與資料的抽象能力。有些學者認為深度學習有極大的危機,BP 演算法有很大局限性,需要推倒重來,需要再次從大腦的認知機制模型中尋找靈感。從右圖可以看到困難的問題是易解的,往往簡單的問題是難解的。 Hinton 的demo 說明深度網路現在有危機,因此必須藉鏡神經系統的多模資料表示、變換和學習規律及回饋方式,認知運算就將推動人工智慧的變革。大家一直在探討人工智慧最重要的問題是什麼?現在如何實現高效率?現在深度網路是不可解釋的,那麼如何做可解釋的呢?現在不魯棒,如何做到魯棒?
新一代認知智能作為現在演算法上國際上最重要的結合點。眾所周知,1969 年BP 演算法的雛形是從控制裡面來的,是從最適控制理論中產生、收集的。直到1989 年卷積神經網路誕生。認知和神經科學家首次將BP 演算法引入多重神經網絡,建構了認知計算模型。再到2015 年的計算模型。由此可以看出BP 演算法是深度學習使用最為廣泛的,但它仍有許多問題。
從1958 年開始研究的啟發卷積神經網路來看,1981 年的諾貝爾獎得主發現人的視覺是分層的,有高層的視覺分層,也發現視覺系統卷積的特性。於是1980 年日本學者提到簡單複雜的細胞概念,提出了新的認知機制。 David Marr 認為,人類對視覺訊息的表徵和處理的計算研究得出了一個重要的結論,視覺和知覺效應的關係。 2007年Tomaso Poggio 提出了H-MAX 模型。 2012 年Alex 的貢獻開啟了人工智慧的黃金時代,並得到了廣泛的應用。這也是我們演算法的歷史由來。透過歷史分析,就能預測未來。
透過展示的內容大家可以看到大部分都是什麼?是關於腦科學家神經的分析,透過神經的分析就是啟發類腦計算。以上部分都是整個神經方面的分析,以下部分是希望能夠實現一種類腦的想法,從腦科學能不能到人工智慧做類腦的研究。最近幾家機構的研究都取得了突破,一是2019 年報道的施路平教授;一是2020 年報道的已經起到了重大作用的吳華強研究類腦的存儲一體的芯片。因此,中國在這方面的研究應該在國際上處於並跑的階段。上面展示的腦的結果,是我們進行了大量研究的,神經元的活化狀態,包括貓的視覺感受、腦機體的神經節。
關於人工智慧理論的推算我們做了一個對應和比較,即如何利用腦機器啟發人工智慧新理論,實際上是作為新一代人工智慧發展的一個重要途徑。我們把它們做類比、對照,說明什麼?很多人工智慧專家都藉鑒了腦科學的一些機制來回應人工智慧該怎麼往前走?這個演算法該怎麼解決?怎麼具體解決?
成年人的大腦細胞有860~1000 億神經元,而我們電訊號在發生作用時會感到整個功耗非常低,就在10~23 瓦之間。如果你在努力完成一件事情時,你的最大功耗也在25 瓦以內;如果你迷迷糊糊時,功耗最低才10 瓦左右。所以功耗都很小,但人工智慧計算機的功耗是非常大的。
剛才劉市長和我談到,在杭州還要建造一個大的計算中心,這時的功耗應該大了很多。那麼怎樣能夠提供呢?從認知科學角度來討論這個問題,於是我們畫了這樣一座大橋。如圖所示,認知計算是溝通腦科學和人工智慧的橋樑。為什麼?我們先回過頭來問,認知科學做什麼?認知科學一個是多模態的迴路觀測,要觀測腦科學裡的東西。
第二是多層次的認知模型,包括潘院士所說的視覺、聽覺、語言,還有觸覺,這些是多層次的認知模型和腦科學的信息,在這裡觀測,透過建立模型形成的是認知科學。我們認為,從腦科學透過認知科學的研究到達人工智慧,這就是走另外一條途徑,叫做從腦科學到人工智慧,也就是我們所謂的未來希望的一條道路,也是研究人工智慧新演算法的一條道路。
接下來我們回頭再來看看國際上的一些經典貢獻。左邊是腦科學整個的貢獻,這裡的貢獻主要講的是什麼?人類如何思考。右邊都是圖靈獎,最重要的結論是,貢獻都是什麼?機器如何思考?中間應該有一道橋樑,將它們建立關係並連結。所以我們希望認知科學就是這道橋樑。
2016 年美國啟動了1 億美金的阿波羅項目,其記錄並測量了10 萬個神經元的活動與連結。這裡最右邊的圖上方是計算神經元的模型,下方是計算機器學習模型。這兩個模型能否透過腦數據建立一個分析?這就是成像。透過研究大腦運算範式,建構認知運算新模型與新方法,從而建立從人的思維到機器思維的橋樑,是啟發新的人工智慧理論與演算法的重要途徑。這是清華大學建構的一個方案,但這個方案也不一定成熟,只供大家參考。
右下圖展示的是生物機制的記憶環路,我們有外在環境、腦皮質和海馬體。左下圖是物理平衡原理,所以我們期待建構一個BMP 的網路演算法,就腦科學、數學和物理結合起來的一個網路模型。上方是我們建構的新型網路模型的一個通用的框架。
在演算法問題上,我們還在進一步研究,也希望為各位專家提供一個方案。所以人工智慧演算法能不能從知識驅動到腦科學,但數據驅動那邊是什麼?是大場景、多物件的一個很大的資料庫,建構的什麼?三駕馬車能不能做認知驅動,這是我們建構的新演算法,一個框架的架構。這是演算法層面的思考,希望大家批評指正。
第三,人和AI 怎樣共處。眾所周知,AI 賦能人類,而不是成為人類,更不是取代人類。 50年前圖靈就說過,人工智慧的發展不是把人變成機器,也不是把機器變成人,而是「研究、開髮用於模擬、延伸和擴展人類智慧能力的理論、方法、技術及應用系統,從而解決複雜問題的技術科學並服務於人類」。因此,人工智慧與人類和諧發展,需要考慮人工智慧與人類之間協同安全、隱私和公平的問題。
最終實現以人為本、服務於人的目標。我們目前有個主題項目是孫富春老師和吳飛老師在負責。我們在做什麼?未來的人工智慧安全教育和它與人類的合作的研究,研究完成後準備和美國人工智慧學會、歐洲人工智慧學會討論人類命運共同體的話題。
這裡以人為本、服務人類的這4 個問題是我們最重要的、要探索也迴避不了的問題,分別是倫理、隱私、協同和安全。人和人類怎麼去合作?人和機器AI 要有交互,人和自然界也要交互。極限交互是什麼意思?在危險的場景,我們希望透過AI 和AI 交互,AI 和場景交互,人類和AI 交互,即我們看不見的、看不清的、聽不見的、觸摸不到的,我們稱之極限交互。 AI 互動實現顛覆性使用者體驗,提升人類認知和改造世界的能力。這就是說極限互動的特點。
在互動中,最重要的什麼? AI 的外在形態,是AI 專用接口,現在有很多汽車、多途機器人、人形機器人,包括微軟小冰等,還有手術機器人、空中機器人,還有手機、電腦等AI 的通用接口,包括我們現在看到的虛擬主播、自動客服,因此下面要討論的是我們和AI 怎麼交互,例如透過虛擬實境這樣的一個介面來進行交互。如圖所示,虛擬/ 擴增實境、自然互動技術,這就是未來資訊獲取與互動的一種方式,它能拓展人類的能力,改變產品形態與服務模式,也能推動認知、智慧與文化藝術的變革,促進未來人類-AI- 物融合社會的發展。這即是我們所說的一個特徵。
我們現在開會都在線上開展,很多機構都在開發線上虛擬線下,如《王牌特工》中所展示的。這時就相當於一種極限環境。我們開的線上會議就跟線下會議一樣。我想這樣的一套系統,2020年底可能有望見到。所以,這就是我們所謂的沉浸式AI 互動。我們研究了今年中小學、大學的課程基本上都是線上上課。透過上課品質對比,北京的幾個學校的教學品質都是有所下降的。我們只是採用了這種形式,但是這種形式並沒有帶來更好的教學效果。
即使如此,以後要改變這個教學效果,我想會帶來更好的使用者體驗。許多大學和企業都做了相關類型的研究,像是微軟108 台相機的立體建模、Facebook 做的立體建模,以及谷歌、清華建的。清華現在一個相機也在做深度建模的形式,建完一個人的模型後,就能把它放到任何地方,這樣虛擬線下就可以實現了。
大家可以看到,這樣就可以實現全像智慧教學。例如智慧精準的推薦、線上泛在接入、真人的全息授課、沉浸互動課件。根據今年的AI 研究發展,AR 眼鏡最輕可以達到50 克,而先前AR 眼鏡很重,所以發展不起來。但我覺得未來眼鏡也是重要趨勢,虛擬線下的重要區域。未來AI 驅動的混合現實,賦能教學、生產、設計和交流,包括工業設計都可以在此開展,這是未來AI 互動的一種重要的工具,也是人和AI 之間互動的一個重要的途徑。
未來已來,我記得好像李院士5 年前作報告,就說未來已來,即讓我們著急起來,未來實際上腦機接口、人機融合、人機“共生永存”,包括意識儲存的概念,能不能永遠存在機器人身上或儲存到一個地方。所以這都是未來發生的事,現在腦機介面發展非常快,我們常說的腦部疾病,像是阿茲海默症、癲癇。如果找到了這樣的病理特徵時,我們有兩種再生方法。如果知道神經元的種類,可以用其他的神經元修復這種生物的修復方法,把這些神經元修復好;還有一種用我們超材料代替這些神經元的活躍程度。如果能做得不錯,腦子就能夠保持高度清晰,人類壽命延長50 年是一件很正常的事。
智慧驅動未來,我們有更聰明的「大腦」、更靈敏的「手」、更明亮的「眼睛」、更靈敏的「耳朵」。智慧光電晶片、知識驅動、數據驅動、認知驅動,這是智慧驅動的一個大的未來。從這裡可以看出,人工智慧逐漸達到人類水準。從時間表2016 年開始,一直規劃到2066 年,所有人類的任務都取代了,機器AI 都能夠把它完成。當然這是我們的願景,這個願景是帶有預測性質的,也帶有一定的基礎討論。
我們說要做認知智能。什麼叫做認知智能?以前有圖靈測試,你做的演算法要測試,那測試要求有沒有?因此我們從圖靈測試開始,主要測試某機器是否能表現出與人等價或無法區分的智慧。當時是模仿遊戲,因此我在最後的部分也講一講測試。
圖靈的測試一直在不斷發展。可以看到從1950 年提出圖靈測試,1986 年早期自然語言處理計算機也在期待測試。一直到2014 年,郭院士的「Eugene Goostman」計畫首次「通過」了圖靈測試。 2015 年人工智慧終於能像人類一樣學習,並通過了圖靈測試。但是這些測試情況怎麼樣?有什麼有待改進的地方?以下這幾位專門研究圖靈測試的專家,測試機器常識推理的能力,測試神經網路抽象推理的能力,還有針對通用人工智慧(AGI)測試,例如家庭健康護理(ECW)的能力,這些都是人工智慧測試的新模式,且層出不窮。因此圖靈測試也是我們人工智慧發展的重要方向。
圖靈測驗中認知測驗是什麼?我們要去考慮這件事,也希望在座的大家能夠考慮,關注什麼?認知測驗和功能辨識、認知決策和邏輯推理這幾個面向的問題,也是目前大家要研究的重要問題。
下面又回過頭來,知識驅動、腦科學、數據驅動上面是認知驅動。那麼新一代人工智慧演算法能不能做出來?什麼叫做出來?能不能有認知測驗?這就是我們所說的一個重要的目標議題,也是我們對人工智慧發展的一些思考。
人工智慧其實產業變革的歷史進程發展非常快。資訊時代隨著現在數位經濟,也就是人工智慧時代的到來。這裡可以看到許多美國典型的人工智慧企業,當然還有中國的企業,包括位元組跳動、地平線等,還有一些歐洲的企業,所以人工智慧已經成為推動全球經濟發展的核心驅動力。人工智慧也是新基建,已上升為國家戰略非常重要。前幾年潘院士所倡導的人工智慧2.0 得到了國家的高度重視。 2020 年我國人工智慧市場的規模成長遠超全球市場規模的成長水準。這是我們整個調查的結果,已用於智慧安防、醫療、金融和教育等領域,例如我們餘杭區的智慧醫療小鎮。新基建是一項非常重要的大工作,剛才高省長、劉市長說到的都在這裡面有所體現。
2019 年發表在Nature 上的一篇文章聚焦在中國在人工智慧領域的領先發展。我們實驗室十幾位老師和學生研究了近10 年浙江省頒布了44 例人工智慧相關的政策。浙江看杭州,杭州就看餘杭。所以杭州打造AI 有無限的想像、無限的空間,也感謝杭州未來城對我們全球人工智慧技術大會的支持。
最後總結一下,其實今天跟大家分享了三個面向的話題。第一個話題就是共處,更高的工作效率、生活品質和安全保障,極限環境下交互,什麼叫極限環境?例如開現場會議,我們地理位置相隔甚遠,但我希望我們面對面交流,這就是一個極限;第二個是演算法,更逼近本源的認知計算理論與方法,這是我們所說的重要的一個議題;第三個是算力,數量級效能提升的新型運算範式與晶片架構,這是最重要的。我希望未來能發展人工智慧這三個面向的問題,包括多維度、多角度和深層的認知測驗。
以上是2021年以後人工智慧的幾點思考?的詳細內容。更多資訊請關注PHP中文網其他相關文章!