當你仰望星空時,你在想些什麼?
有執著的發問,就會有不曾想像的回音。
shen
從方寸之間到寰宇之外,創造新宇宙的人,相信永遠看不到天花板。
堅定的人,不會因為到達而停下,他們用創造的腳步測量未知。
百度CREATE 2022大會,為我們展示了人類設計師和AIGC共同創意製作的畫作。
而就像這些畫作所描述的場景,百度,也不曾停下創新的腳步。
在大會開始,李彥宏就提出了一個令人深思的觀點:第四次科技革命的標誌,就是深度學習演算法。與深度學習相關的重大創新,會像汽車、網路一樣,對我們的社會產生重大的影響。
#真正的實踐中,沒有導航地圖,只有指南針。而百度,也是摸準大致方向後,基於實踐一步步迭代,才跑出了有價值的創新。
在大會上,李彥宏展示了這樣一幅畫。這幅畫是他以「危機與希望」為關鍵字,在百度AI作畫平台一格上產生的。
這幅畫,很好地代表了人工智慧面臨的現狀——經歷起起落落,但充滿希望。
是的,李彥宏依然堅持去年的觀點──創造者們將迎來屬於人工智慧的黃金十年。
AIGC元年,來了
2022,AIGC全面爆發。
DALL·E2讓文字生成圖片火爆一整年,隨後的Stable Diffussion、Midjourney,更是啟發了無數人的藝術靈感,甚至讓不少畫手感到震驚。
而DALL·E2和Google發布的Imagen的模型,也吸引了許多AI學者參與研究。
ChatGPT雖然到了年末才壓軸出場,但「強化學習」賦予它的魔力,讓它在全民狂歡中再次掀起AIGC的風暴。
其實,在2022年初,百度研究院早已預測到了AIGC在這一年的火爆。
超大規模預訓練模型呈現知識增強、跨模態統一建模、多學習方式共同演進的趨勢,並逐漸實用化。
例如AIGC (AI generated content,人工智慧創造內容),借助大模型的跨模態綜合技術能力,可以激發創意,提升內容多樣性,降低製作成本,將會實現大規模應用。
而且,這已經不是百度研究院第一次做出神預測了。 2020年,它預測的NLP模型在GPT-3上得到應驗,而在2021年,它押中的數字人全面大爆。
而這次,百度對於AIGC領域的趨勢,可謂是胸有成竹。
三個天才創作者,一鍵圓你導演夢
#在Create 2022大會上,百度幾乎將AIGC深入應用到了每一個環節。歌曲、場景、演講腦圖的創作,這些環節中,全都有AI的參與。
#而李彥宏以「危機與希望」為主題生成的繪畫,背後就是文心知識增強跨模態大模型一格,它就是接下來要出場的三位天才創作者的其中一位。
這次Create大會上,百度技術委員會主席吳華為我們介紹了三位能力超群的天才創作者。
它們分別是天才編劇——文心ERNIE3.0Zeus,天才插畫家——文心ERNIE-ViLG 2.0,剪輯和動畫大師——VIMER-TCIR。
有了這三位天才創作者,再配上自己設計的虛擬人演員,你也可以當上導演,拍出自己的影視大作了!
文心ERNIE 3.0 Zeus語言大模型,陪你聊到天荒地老!
作為ERNIE 3.0系列模型的最新升級,ERNIE 3.0 Zeus除了對無標註資料和知識圖譜的學習之外,還透過持續學習對百餘種不同形式的任務資料實現了全面掌握。
在對通用知識和專門知識「雙管齊下」後,模型的泛化能力顯著提升,不管是多語言理解,還是生成任務,都能輕鬆搞定,名副其實的“通才」了屬於是。
無論是自主創作、自由回答,或是命題對話、情緒分析,100多個層次化Prompt,ERNIE 3.0 Zeus都能順利應付。
文心ERNIE-ViLG 2.0影像產生大模型,天才畫師了解一下?
如果說文心ERNIE 3.0 Zeus是語言大師,ERNIE-ViLG 2.0就是作畫大師。它能根據一句話或一段描述文本,生成一幅精美的畫作。
中文提示,想要什麼畫,直接開口說就行,只有你想不到的,沒有ta畫不出來的,看看這艘青花瓷戰艦,像不像一尊精美的藝術品?就是不知道真的打起來,會不會被一炮乾碎......
而要達成這個目標,離不開模型本身背後知識增強的擴散模型。
一句話或幾句話的提示中,哪些是核心要素,需要在畫作中突出展現,哪些是修飾要素,作用就是錦上添花,還不能喧賓奪主,這裡邊就有學問了。
為了盡可能實現精準作畫,在學習過程中,ERNIE ViLG 2.0引入了語言、視覺等多源知識,引導模型更加關注文字和圖像中的核心語意元素,實現精準的細粒度語意控制。
此外,ERNIE ViLG 2.0還可以針對不同階段,選擇不同網路(例如降噪)建模的框架,有效解決了不同階段對模型能力要求不一致的問題,減少了降噪任務的互相干擾,提升了影像產生的品質。
無論是寫實風、中國風、還是國潮、國畫風,ERNIE-ViLG 2.0都能根據簡短的中文提示生成切題、風格各異、且生動逼真的影像。
舉個例子,例如下面這段豔麗飄逸的「天宮盛宴」:
##基於ERNIE-ViLG 2.0的文心·一格,交出了可以說是面面俱到的作業,整體畫風色調明艷,不失古代情調。
現在,我們只需要在百度「文心·一格」平台上輸入幾個關鍵字,也能分分鐘得到風格獨特的畫作。
除了語言和圖像外,在影片內容生成與編輯上,也是文心大模型大展身手的地方。
在視覺內容生成方面,影片產生大模型可以根據用戶提供的一段描述文本,或者一幅圖像,自動地生成高清、流暢的影片。
在視覺編輯方面,VIMER-TCIR多任務大模型,則可以利用對超解析度、去雜訊、去模糊、去壓縮等多任務的聯合預訓練,同時實現對多種不同情況的修復和編輯。
目前,VIMER-TCIR已經在老電影修復等場景實現落地,而且大幅提升了運行效率,每天單機就可修復視頻28.5萬幀,解決了絕大部分老電影畫面的修復問題。
AIGC的浪潮已經到來,在未來,可以預見的是,AI作畫、AI創作影片等等,很快就會變得像手機拍照一樣簡單。
隨著技術的不斷突破,AIGC將很有可能顛覆現有內容生產模式,實現以十分之一的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的內容。
研發資金拉滿:10年投入超1000億為了讓大模型達到如此酷炫的效果,百度在研發方面,可謂是毫不吝嗇。
十年間累計投入了超過1000億元,其中核心研發投入佔核心收入比例連續8個季度超過了20%。
據統計,百度在2020年的研發投入強度為18.22%,位列民營企業500強第一。 2021年為20.03%,名列民營企業500強第二。
順便一提的是,如此「豪橫」的投入,也讓百度在人工智慧的底層技術方面,取得了領先優勢。
畢竟,晶片卡脖子要緊,基礎軟體卡脖子也一樣要緊。
早在2016年,百度就開始研發被稱為「人工智慧作業系統」的深度學習框架-飛槳。
目前,已經凝聚了535萬開發者,創建了67萬個模型,建構起一個繁榮的深度學習生態。
基於飛槳的大模型也可以有效整合自然語言處理、電腦視覺等多模態能力,並聯合多種行業務場景進行調優;而開發者也能像搭積木一樣建構AI應用,大大降低AI的應用門檻。
李彥宏:人工智慧的黃金十年
文章開頭我們已經提到,李彥宏認為,與深度學習相關的重大創新,包括自動駕駛、水力發電等領域的智慧調度系統等,會產生重大社會影響。
創新本身是從何而來呢?在李彥宏看來,創新,是由回饋驅動的。
百度在經營發展中,就有很多「回饋驅動創新」的實務經驗。例如,百度崑崙晶片之所以在AI晶片中擁有領先的效能,正是因為它已經為百度的搜尋服務優化了十年。
百度的搜尋服務,每天響應數十億次真實的用戶使用需求,每天進行1萬億次深度語義推理與匹配,能夠提供最真實、最及時的反饋,從而倒逼大模型、深度學習框架和晶片的最佳化。
現在,百度是全球為數不多的、進行全端佈局的人工智慧公司(晶片層、框架層、模型層和應用層)。
從高階晶片崑崙,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有關鍵自研技術,每一層之間都有很多回饋,透過不斷獲得回饋,實現端到端優化。
每一層的技術架構,都是越往下越通用,越往上越專用。
而人工智慧越專用,就越能深入產業,賦能實體經濟發展。
去年的Create大會上,李彥宏曾預言:「隨著科技應用門檻不斷降低,創造者們將迎來屬於人工智慧的黃金10年。」如今,他依舊這樣認為。
2020年,李彥宏剛創業時,就面臨網路泡沫破裂,全世界蒸發8萬億市值,隨後,網路又進入了黃金十年,而人工智慧,也會經歷同樣的起起落落。
而百度,將一如既往為社會、為產業培養AI人才,投入更多資源,與各位開發者們一道,為中國AI的發展盡最大的努力。
彩蛋
Create大會最後,虛擬人樂團成員們再次登場。
主唱/吉他:希加加,鼓手:度曉曉,貝斯:葉悠悠,鍵盤:林開開
希加加表示,自己的畫能在大會開場被展示,實在是太開心了!
而林開開過了把當製作人的癮,他開心自誇道,自己還挺有編曲天賦的~
葉悠悠說,自己的設計居然長在大家的審美點上,這讓她相當滿意。那麼,哪個環節的設計是她做的呢?
度曉曉猜對了:是「知一」與「千流」環節。
而度曉曉表示,自己早已寫好了發表會的傳播稿。
在四位成員的共同腦力激盪中,稿件的標題火熱出爐-《震驚!這是一場人與機器一場辦的大會》。
以上是李彥宏10年花了1000多億! 500萬開發者撐起中國最大深度學習框架的詳細內容。更多資訊請關注PHP中文網其他相關文章!

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

Google的雙子座高級:新的訂閱層即將到來 目前,訪問Gemini Advanced需要$ 19.99/月Google One AI高級計劃。 但是,Android Authority報告暗示了即將發生的變化。 最新的Google P中的代碼

儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。首席執行官慶祝AI的進步時,工程師努力應對緩慢的查詢時間,管道超載,一個

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。檢索結構化

利用Google的代理開發套件(ADK)的力量創建具有現實世界功能的智能代理!該教程通過使用ADK來構建對話代理,並支持Gemini和GPT等各種語言模型。 w

摘要: 小型語言模型 (SLM) 專為效率而設計。在資源匱乏、實時性和隱私敏感的環境中,它們比大型語言模型 (LLM) 更勝一籌。 最適合專注型任務,尤其是在領域特異性、控制性和可解釋性比通用知識或創造力更重要的情況下。 SLM 並非 LLMs 的替代品,但在精度、速度和成本效益至關重要時,它們是理想之選。 技術幫助我們用更少的資源取得更多成就。它一直是推動者,而非驅動者。從蒸汽機時代到互聯網泡沫時期,技術的威力在於它幫助我們解決問題的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

利用Google雙子座的力量用於計算機視覺:綜合指南 領先的AI聊天機器人Google Gemini擴展了其功能,超越了對話,以涵蓋強大的計算機視覺功能。 本指南詳細說明瞭如何利用

2025年的AI景觀正在充滿活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到來。 這些尖端的車型分開了幾週,具有可比的高級功能和令人印象深刻的基準分數。這個深入的比較


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

WebStorm Mac版
好用的JavaScript開發工具

SublimeText3漢化版
中文版,非常好用