為學習影片加上字幕多久? 1小時?很可能30秒就夠了。
想把視訊字幕匯出文字,還要一幀一幀記?一句話就行了。
你能想像這些操作依靠什麼完成的嗎?大多數人可能想不到,以往一些需要專業編輯軟體耗時耗力才能實現的操作,今後在百度網盤裡可以一鍵搞定了。不止如此,未來,透過百度網盤「雲一朵」助理,找圖、摘要、翻譯,都能成為一句話的事。
維特斯根坦說,我語言的邊界就是我世界的邊界。如今,AI正在拓寬世界的邊界——借助人類的自然語言。
未來的個人智慧助理
# 在科幻電影《Her》中,描述了這樣一個場景:一位擁有迷人聲線的虛擬AI,接管了人們大部分的工作和娛樂,不僅解放了雙手,甚至連雙腳也解放了,真正實現了常態化居家辦公。
過去幾十年,科幻電影對AI的描述大多離不開一個詞彙-效率。背後掩飾的是現實世界對未來生活的終極願景:生產力工具解放人類。
幾乎可以確定,每一部科幻片虛擬出來的AI都是在替人類工作,《西方世界》裡的服務機器人、《星際效應》裡的塔斯,比比皆是。它映射出現實世界對AI的想像,總是要圍繞著它最基礎的功能──效率躍遷。
從蒸汽機到內燃機,從數據化到資訊化,科技催生社會進步總是圍繞著效率躍遷,而效率的躍遷背後,隱藏著的往往是時代下人們龐大且沒被滿足的需求。
chatGPT引發的這一輪AI浪潮,之所以能在短時間內就席捲全球,技術創新是一方面,更底層的原因其實是社會對生產力工具進化的極度渴望。
正如文初我們所展示的那樣,生產力工具如今在AI的加持下已經開始表現的更科幻,而未來百度網盤結合大模型的升級,也將滿足社會對生產力工具的很大渴望。
1 更複雜的檔案理解
以往我們需要一份專業報告的總結,只能一頁一頁看,如果是外文報告可能還要用到翻譯工具,再或者還需要轉換文檔格式,上述操作需要我們在瀏覽器、閱讀器、word等多個軟體來回穿梭,不僅會頭暈眼花,可能還會忙中出錯。
好消息是,以後這些繁雜的工作可以在百度網盤一鍵完成了。
基於文心大模型,百度網盤將要實現的一個大功能,即文件從「閱讀」到「理解」。你可以讓它給你寫一個文檔總結,無論外文還是中文,幫助你快速從雜亂的信息中梳理知識。
你也可以挑選某一段讓它為你翻譯,又快又好。
連格式轉換也能一句話搞定。
簡而言之,透過這個例子,我們可以感受到一些變化,過去儲存在網盤的文件就只是一個文件,而今天百度網盤能夠幫助用戶理解其中的知識。
2 更快的圖片&文件搜尋
升級後的百度網盤,帶來了更快的圖片和檔案搜尋。
相較於傳統的翻閱式查找,在新的百度網盤中可以一句話找到想要的照片或文件。例如「幫我找一下最近拍的美食照片」或更複雜的「去年公司的團聚聚餐照片」就可以了。
借助大模型的能力,百度網盤能夠理解和分析更複雜的語義,並藉助影像辨識技術快速找到目標檔案。
而且,這項技術還不止步於圖片和文件,影片查找也是可以的。
例如在百度網盤裡的影片資料,上次學過的知識點想要複習一下,但又記不得是幾分幾秒?沒關係,可以直接提問某個知識點,百度網盤就會基於視頻內容提供相關的解答並給出視頻對應內容的位置,也可以直接定位跳到對應位置。
目前,百度網盤雲一朵正在內測中,開啟百度網盤PC客戶端(最新版)或網頁版,即刻預約體驗。
我們之前說過,某種技術的出現,背後往往是當時人類需求的集中爆發。內燃機的發明,讓我們能去到更遠的地方,促進了貿易和文化的交流;而數據化、資訊化相當於是輪子和發動機,讓知識跑的更遠。
而當資料膨脹到一定程度後,知識堆疊的冗餘就讓獲取知識變得困難。真正想找到有價值的資訊卻如大海撈針,這個問題在數位資訊時代變得越來越嚴重。生產力工具的演化,其目標就是讓知識獲取變得更容易。
如何解決這個新時代的新問題,這是我們看到在AI時代可能帶來的改變。就好像在輪子和引擎的基礎上加入一個導航儀,讓所有的內容和數據為我所用,這就從資訊化到知識化。
炸裂的B端智慧化
這次的AI浪潮不只惠及個人,也包含廣大的B端企業用戶,畢竟企業擁有更集中也更迫切的生產力需求。
chatGPT發布之後,諸如廣告業已有多家公司宣布將裁撤一部分基礎的文案崗位,轉向AIGC;一些畫師也在使用Midjourney這類的軟體為其工作。
跳到網盤市場的企業用戶,實際上存在兩類剛需,一類是資料儲存和傳輸,一類是基於儲存和傳輸的本地一鍵化產生。
對於第一類,比較典型的就是很多企業會將文件、合約、發票、素材等放到網盤裡,以作備份或傳輸用。那麼這一類需求的痛點就是,花在海量文件查找、歸類的時間,即辛苦又沒有價值。
基於文心大模型,未來,百度網盤升級後將在企業版中加入更聰明的圖片分類功能,定制了多達57個更契合辦公用途的分類,例如企業票證、商務合約、設計素材等,實現更好的管理和更快的查詢。
同個人版一樣,百度網盤企業版也將基於文心大模型,帶來企業知識長。透過對話式互動幫助企業版使用者對文件內容進行總結、提煉、問答和進一步加工。
例如可以讓它腦力激盪想10個小清新的飲品名稱、根據提綱完成一篇報告,或者潤飾一下文字讓文章看起來更高級,百度網盤都能搞定。
針對第二類需求,升級後的百度網盤某種意義上真正幫助特定產業實現了效率躍遷。
例如攝影行業,從客戶追蹤到售後服務一套流程下來,平均服務一個客戶需要15個員工花費35天。
百度網盤推出的即拍即選服務,為攝影行業實現了效率的極大改進。
拍完即上傳,並且藉助一鍵AI修圖、自動套版、生成網盤鏈接等本地操作,將傳統攝影機構一張照片涉及拍照、初修、調色、導卡選片等13個環節,平均參與人員15人,縮減到整個環節從5天到15分鐘,單人服務成本降低75%,效率提升超過30倍。
同樣,在電商產業,百度網盤的智慧多模態加工不僅針對⼈像精修,還能透過AI為圖⽚更換所需的背景,透過智慧扣圖然後配對對應的場景製作新的商品圖。
類似這樣針對特定產業的AI技術,其實不只百度一家在做,Adobe、Midjourney甚至還有專門的AI模特兒公司,但本質上它們還是傳統的軟體,也就是原有鏈條的一個部分。
而百度網盤未來支持AI模特兒、行銷海報製作,就是在一鍵本地生成的基礎上減少鍵條,讓生產力得到最大化的提升。
再例如生命科學產業,例如基因公司要將定序檔案交付給醫院、學校或科研機構,資料往往高達幾百GB甚至1TB,百度網盤提供的檔案交付解決方案支援TB層級的資料傳輸,能夠幫助客戶將超大文件既便捷又安全的完成交付。
網盤,科技推動資訊化到知識化
過去十年,網盤產業經歷了兩個階段。其一是數據化,人們習慣將本地文件上傳到雲端,實現本地資源的釋放和分享;其二是資訊化,沉澱在網盤的海量數據,催生了個人、企業乃至行業高效利用數據的新需求。
例如使用者在需要它們的時候可以隨時調用,這個階段網盤的價值在於提供一個目錄或索引,可以快速且有效率的找到檔案。
而未來十年,隨著資訊化越來越高,使用者需求也會隨之轉向。
一方面,知識化是一個大方向的趨勢,AI將有用的信息梳理成知識,無論是即時的還是過往的,用戶都可以輕鬆快捷的找到它並知識化它。
什麼是知識化?
資訊化的特徵是淺層理解與離散化,而知識是資訊的集合,是從相關資訊中過濾、提煉及加工而得到的有用資料。知識基於推理和分析,也可能產生新的知識。
而百度網盤的知識化,可以將其理解為提供了一種對資訊的理解、記憶、推理和連接的能力。它的作用類似汞,能從金砂中提煉出黃金。
三年前,百度網盤曾對產業未來做出判斷。認為網盤能力將活躍於包括手機、音箱、電視在內的智慧終端,使用者可以「隨時隨地上傳資料到雲端,或在終端機呈現內容」。同時,使用者會更願意直接在網盤操作和處理數據,而不是將其下載到本地。
今天百度網盤知識化的越級,對應的正是三年前的這個預判。
基於這些,未來百度網盤就能依托知識化建構網盤第二大腦,成為每個人都擁有的個人數位助理。
而這背後,都離不開百度長久以來對科技的長久投入與創新。
例如文字理解,百度網盤採用圖像預訓練大模型技術,能夠利用更多的上下文訊息,並透過自監督的思路提高效率和準確率。
再例如影像理解,依托文心大模型,百度網盤將模型規模縮小,成本下降的同時效率上去了。依托文心大模型,百度網盤的解決方案百度網盤的的解決方案,在16個場景中有10個領域處於領先地位,並已廣泛應用於網盤的照片故事和圖片視頻搜索中,支援複雜語意和多模態的搜尋能力。
還有人像美化,除了提供基本的人像美化效果與競品一致外,在保持效果的前提下,百度網盤將部分核心模型大小壓縮到百KB,推理耗時降低到百毫秒。
最後是音視頻理解。百度網盤的自動語音辨識(ASR)涵蓋了中、英、韓等多個國家的語言,辨識和翻譯準確率也處於業界領先地位。
尾聲
#讓我們回到開頭的例子:《西方世界》和《星際效應》都是科幻電影,但它們對於AI的立意卻是截然相反:前者刻畫了AI覺醒,而後者則是描述了AI為人類貢獻。
今天我們能體驗到的AI,包括百度網盤、chatGPT、Midjourney等等,它們現存的形態亦或者未來的進化方向,基本上都是一類的,智能協同、彼此優勢互補,實現更高效、更準確的工作成果。
百度網盤結合AI實現過目不忘和出口成章,是拓寬了我們語言的邊界,但它背後是人類不斷透過創造工具來增強自我的進化過程。
同時,人不是AI,人有語言與知識,也有體驗與感知。這是屬於我們更大的世界。
如果把語言和知識比做“讀萬卷書”,也許AI能比人做的更好。
但是體驗與感知是“行萬里路”,這裡不是單純的指去旅遊,而是用心去生活,去體會,去感悟,這是AI所無法替代的。
最後跟大家分享一句話:AI是工具,人生是體驗。
以上是AI時代,我們需要一個怎樣的網盤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!