當你仰望星空時,你在想些什麼?
有執著的發問,就會有不曾想像的回音。
shen
從方寸之間到寰宇之外,創造新宇宙的人,相信永遠看不到天花板。
堅定的人,不會因為到達而停下,他們用創造的腳步測量未知。
百度CREATE 2022大會,為我們展示了人類設計師和AIGC共同創意製作的畫作。
而就像這些畫作所描述的場景,百度,也不曾停下創新的腳步。
在大會開始,李彥宏就提出了一個令人深思的觀點:第四次科技革命的標誌,就是深度學習演算法。與深度學習相關的重大創新,會像汽車、網路一樣,對我們的社會產生重大的影響。
#真正的實踐中,沒有導航地圖,只有指南針。而百度,也是摸準大致方向後,基於實踐一步步迭代,才跑出了有價值的創新。
在大會上,李彥宏展示了這樣一幅畫。這幅畫是他以「危機與希望」為關鍵字,在百度AI作畫平台一格上產生的。
這幅畫,很好地代表了人工智慧面臨的現狀——經歷起起落落,但充滿希望。
是的,李彥宏依然堅持去年的觀點──創造者們將迎來屬於人工智慧的黃金十年。
2022,AIGC全面爆發。
DALL·E2讓文字生成圖片火爆一整年,隨後的Stable Diffussion、Midjourney,更是啟發了無數人的藝術靈感,甚至讓不少畫手感到震驚。
而DALL·E2和Google發布的Imagen的模型,也吸引了許多AI學者參與研究。
ChatGPT雖然到了年末才壓軸出場,但「強化學習」賦予它的魔力,讓它在全民狂歡中再次掀起AIGC的風暴。
其實,在2022年初,百度研究院早已預測到了AIGC在這一年的火爆。
超大規模預訓練模型呈現知識增強、跨模態統一建模、多學習方式共同演進的趨勢,並逐漸實用化。
例如AIGC (AI generated content,人工智慧創造內容),借助大模型的跨模態綜合技術能力,可以激發創意,提升內容多樣性,降低製作成本,將會實現大規模應用。
而且,這已經不是百度研究院第一次做出神預測了。 2020年,它預測的NLP模型在GPT-3上得到應驗,而在2021年,它押中的數字人全面大爆。
而這次,百度對於AIGC領域的趨勢,可謂是胸有成竹。
三個天才創作者,一鍵圓你導演夢
#在Create 2022大會上,百度幾乎將AIGC深入應用到了每一個環節。歌曲、場景、演講腦圖的創作,這些環節中,全都有AI的參與。
#而李彥宏以「危機與希望」為主題生成的繪畫,背後就是文心知識增強跨模態大模型一格,它就是接下來要出場的三位天才創作者的其中一位。
這次Create大會上,百度技術委員會主席吳華為我們介紹了三位能力超群的天才創作者。
它們分別是天才編劇——文心ERNIE3.0Zeus,天才插畫家——文心ERNIE-ViLG 2.0,剪輯和動畫大師——VIMER-TCIR。
有了這三位天才創作者,再配上自己設計的虛擬人演員,你也可以當上導演,拍出自己的影視大作了!
文心ERNIE 3.0 Zeus語言大模型,陪你聊到天荒地老!
作為ERNIE 3.0系列模型的最新升級,ERNIE 3.0 Zeus除了對無標註資料和知識圖譜的學習之外,還透過持續學習對百餘種不同形式的任務資料實現了全面掌握。
在對通用知識和專門知識「雙管齊下」後,模型的泛化能力顯著提升,不管是多語言理解,還是生成任務,都能輕鬆搞定,名副其實的“通才」了屬於是。
無論是自主創作、自由回答,或是命題對話、情緒分析,100多個層次化Prompt,ERNIE 3.0 Zeus都能順利應付。
文心ERNIE-ViLG 2.0影像產生大模型,天才畫師了解一下?
如果說文心ERNIE 3.0 Zeus是語言大師,ERNIE-ViLG 2.0就是作畫大師。它能根據一句話或一段描述文本,生成一幅精美的畫作。
中文提示,想要什麼畫,直接開口說就行,只有你想不到的,沒有ta畫不出來的,看看這艘青花瓷戰艦,像不像一尊精美的藝術品?就是不知道真的打起來,會不會被一炮乾碎......
而要達成這個目標,離不開模型本身背後知識增強的擴散模型。
一句話或幾句話的提示中,哪些是核心要素,需要在畫作中突出展現,哪些是修飾要素,作用就是錦上添花,還不能喧賓奪主,這裡邊就有學問了。
為了盡可能實現精準作畫,在學習過程中,ERNIE ViLG 2.0引入了語言、視覺等多源知識,引導模型更加關注文字和圖像中的核心語意元素,實現精準的細粒度語意控制。
此外,ERNIE ViLG 2.0還可以針對不同階段,選擇不同網路(例如降噪)建模的框架,有效解決了不同階段對模型能力要求不一致的問題,減少了降噪任務的互相干擾,提升了影像產生的品質。
無論是寫實風、中國風、還是國潮、國畫風,ERNIE-ViLG 2.0都能根據簡短的中文提示生成切題、風格各異、且生動逼真的影像。
舉個例子,例如下面這段豔麗飄逸的「天宮盛宴」:
##基於ERNIE-ViLG 2.0的文心·一格,交出了可以說是面面俱到的作業,整體畫風色調明艷,不失古代情調。
現在,我們只需要在百度「文心·一格」平台上輸入幾個關鍵字,也能分分鐘得到風格獨特的畫作。
除了語言和圖像外,在影片內容生成與編輯上,也是文心大模型大展身手的地方。
在視覺內容生成方面,影片產生大模型可以根據用戶提供的一段描述文本,或者一幅圖像,自動地生成高清、流暢的影片。
在視覺編輯方面,VIMER-TCIR多任務大模型,則可以利用對超解析度、去雜訊、去模糊、去壓縮等多任務的聯合預訓練,同時實現對多種不同情況的修復和編輯。
目前,VIMER-TCIR已經在老電影修復等場景實現落地,而且大幅提升了運行效率,每天單機就可修復視頻28.5萬幀,解決了絕大部分老電影畫面的修復問題。
AIGC的浪潮已經到來,在未來,可以預見的是,AI作畫、AI創作影片等等,很快就會變得像手機拍照一樣簡單。
隨著技術的不斷突破,AIGC將很有可能顛覆現有內容生產模式,實現以十分之一的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的內容。
研發資金拉滿:10年投入超1000億為了讓大模型達到如此酷炫的效果,百度在研發方面,可謂是毫不吝嗇。
十年間累計投入了超過1000億元,其中核心研發投入佔核心收入比例連續8個季度超過了20%。
據統計,百度在2020年的研發投入強度為18.22%,位列民營企業500強第一。 2021年為20.03%,名列民營企業500強第二。
順便一提的是,如此「豪橫」的投入,也讓百度在人工智慧的底層技術方面,取得了領先優勢。
畢竟,晶片卡脖子要緊,基礎軟體卡脖子也一樣要緊。
早在2016年,百度就開始研發被稱為「人工智慧作業系統」的深度學習框架-飛槳。
目前,已經凝聚了535萬開發者,創建了67萬個模型,建構起一個繁榮的深度學習生態。
基於飛槳的大模型也可以有效整合自然語言處理、電腦視覺等多模態能力,並聯合多種行業務場景進行調優;而開發者也能像搭積木一樣建構AI應用,大大降低AI的應用門檻。
文章開頭我們已經提到,李彥宏認為,與深度學習相關的重大創新,包括自動駕駛、水力發電等領域的智慧調度系統等,會產生重大社會影響。
創新本身是從何而來呢?在李彥宏看來,創新,是由回饋驅動的。
百度在經營發展中,就有很多「回饋驅動創新」的實務經驗。例如,百度崑崙晶片之所以在AI晶片中擁有領先的效能,正是因為它已經為百度的搜尋服務優化了十年。
百度的搜尋服務,每天響應數十億次真實的用戶使用需求,每天進行1萬億次深度語義推理與匹配,能夠提供最真實、最及時的反饋,從而倒逼大模型、深度學習框架和晶片的最佳化。
現在,百度是全球為數不多的、進行全端佈局的人工智慧公司(晶片層、框架層、模型層和應用層)。
從高階晶片崑崙,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有關鍵自研技術,每一層之間都有很多回饋,透過不斷獲得回饋,實現端到端優化。
每一層的技術架構,都是越往下越通用,越往上越專用。
而人工智慧越專用,就越能深入產業,賦能實體經濟發展。
去年的Create大會上,李彥宏曾預言:「隨著科技應用門檻不斷降低,創造者們將迎來屬於人工智慧的黃金10年。」如今,他依舊這樣認為。
2020年,李彥宏剛創業時,就面臨網路泡沫破裂,全世界蒸發8萬億市值,隨後,網路又進入了黃金十年,而人工智慧,也會經歷同樣的起起落落。
而百度,將一如既往為社會、為產業培養AI人才,投入更多資源,與各位開發者們一道,為中國AI的發展盡最大的努力。
Create大會最後,虛擬人樂團成員們再次登場。
主唱/吉他:希加加,鼓手:度曉曉,貝斯:葉悠悠,鍵盤:林開開
希加加表示,自己的畫能在大會開場被展示,實在是太開心了!
而林開開過了把當製作人的癮,他開心自誇道,自己還挺有編曲天賦的~
葉悠悠說,自己的設計居然長在大家的審美點上,這讓她相當滿意。那麼,哪個環節的設計是她做的呢?
度曉曉猜對了:是「知一」與「千流」環節。
而度曉曉表示,自己早已寫好了發表會的傳播稿。
在四位成員的共同腦力激盪中,稿件的標題火熱出爐-《震驚!這是一場人與機器一場辦的大會》。
#以上是李彥宏10年花了1000多億! 500萬開發者撐起中國最大深度學習框架的詳細內容。更多資訊請關注PHP中文網其他相關文章!