搜尋
首頁科技週邊人工智慧真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

在AR向前推進的這條路上。還會不斷有新的產業角色、技術力量加入進來,共同推動AR駛向我們的終極想像:真正意義上面向大眾的擴增實境。

本文經AI新媒體量子位元(公眾號ID:QbitAI)授權轉載,轉載請聯絡來源。

AR苦內容久矣。

過去一段時間來,AR廠商們都爭相推出消費級AR眼鏡,在重量、續航、功能上卷出新花樣,但也逃不脫被人們詬病:

除了看片還能幹啥?

當下的消費級AR到底是不是真·AR?

對於使用者來說,AR眼鏡的作用,如果只是將一台投影機縮小到鏡片大小架在眼前,很難長期滿足消費者不斷湧現的新需求。

一直跟手機借內容生態?

似乎也不可取,畢竟AR最大的想像力就在於如何成為一個新型獨立終端。更何況手機內容都侷限在2D,和擴增實境基本定義裡反覆提及的3D也有本質性差異。

所以該怎麼辦?

賣空自家6萬台AR眼鏡庫存的行業頭部玩家,最近頂著元宇宙退潮交出了自家答卷:

透過一個AR應用,他們讓普通人在10分鐘內建造屬於自己的AR數位空間。

而且還是必須用手在物理空間裡創作的那種,AI這回沒話說了吧?

當然這是開玩笑,背後真正的目的在於,能夠讓更多開發者、創作者,能夠來AR空間內發揮自己的想像力,壯大AR內容生態,並進一步達到推動AR向大眾層面鋪平。

所以這款應用程式到底是什麼?僅憑它就能實現如此宏大的目標嗎?背後又揭露了AR產業的哪些暗湧?

靈境是什麼?

Rokid創辦人兼CEO 祝銘明表示,靈境是AR產業劃時代的產品,可以讓每一個人都參與AR數位內容的創作。

官方定義,靈境是一款AR空間創作工具,能做的事就是在3D空間內創作AR內容,而且門檻很低,人人可用。

具體操作步驟分為5步驟:

  • 手機掃描空間
  • 雲端空間重建
  • 線上場景佈局
  • #多端一鍵發布
  • AR終端體驗

也就是說,透過普通手機攝像頭,靈境就能獲取到空間信息,然後在雲端進行重建。之後就可以按照自己的想法完成創作了。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

創作好的AR內容可以直接發佈在平台上,一個空間內可以有多個人發布自己的創作。最後只要戴上AR眼鏡就能體驗。

整個過程下來,一個10平米左右的空間,只要10分鐘就能搞定。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

據介紹,靈境的內容渲染也是基於Rokid自己的3D渲染引擎,這樣可以大幅降低整個內容創作、落地的時間和人力成本。

要知道,目前AR內容創作的落地過程,基本上都還是一個長鏈流程。

需要有一定的產品資源、開發資源和內容創作資源,然後再由專業團隊打包資源到現場測試,最後進行驗收。常用的創作工具如Unity、UnrealEngine,在使用上也有門檻,要求用戶具備一定的開發基礎能力。

而且靈境也強調一大特點:協同合作

不僅實現了多端一致,即在手機、PC、AR眼鏡上都能看到創作內容空間;也實現了讓多人參與到同一空間內的AR創作。


這個定位明顯更偏向大眾化,業界使用者和一般消費者都能上手體驗,同時也會提出一些新的要求,如高並發需求、終端算力、內容創作效果等。

那麼問題來了--

靈境是如何實現的?

這背後其實是一整套技術堆疊的全方位升級,包括硬體、系統、雲端服務、演算法等。

首先來看硬體方面,這次配合靈境的發布,Rokid將AR眼鏡從傳統「雙魚眼 RGB三攝方案」升級為「單攝RGB輕量化SLAM」。

單眼方案的好處很直接:結構簡單、硬體設計複雜度降低、主機板面積小、成本功耗比大幅降低,用戶側能直接感受到配戴舒適度和續航力上的提升。

在落地應用程式上,據悉靈境搭載的硬體也是只有一個相機的。

因為把相機數量壓縮到最後一個,單眼方案可以帶來更低功耗更簡結構,更低成本等諸多優勢,舒適的配戴和較普惠的價格,符合靈境的「讓AR更普惠」的需求。

但單目方案也確實有短板,例如它無法得到絕對的尺度訊息,所以需要透過初始化恢復尺度訊息,而初始化的好壞直接影響演算法最終的精度。單眼計算絕對尺度準確度不夠高,尺度收斂也有不確定性,這些對單目SLAM演算法開發帶來很大的挑戰,會直接影響到AR體驗。

不過Rokid表示,目前業界已經出現了對應的解決方案。

演算法上,在IMU的輔助下,單目的靜態初始化和動態初始化已經有了很多方案,初始化完畢以後基本上獲得比較精確的絕對尺度先驗。再結合例如基於濾波的演算法,可以在後期使用過程中對各種SLAM參數持續優化,進一步提升演算法的定位精度,同時基於深度學習的技術在SLAM演算法上也有很多技術探索。

由此,也能感受到Rokid的理念是:AR產品不僅只是堆疊感測器,而是軟體、硬體、演算法和場景作為整體,提供用戶更舒適的AR綜合體驗。

軟體方面的提升,主要體現在3D點雲和SLAM方面。

並利用端雲協同的方式平衡了算力、功耗和高並發幾個方面的要求。

Rokid應用平台中心部門負責人Watson介紹:

基於3D點雲的視覺定位技術和裝置端的SLAM技術(Simultaneous localization and mapping,同步定位和地圖建構),可以類比自動駕駛中的道路高精地圖和車輛空間感知。

在AR場景下,也有一些開發者拿點雲作全域的粗定位,拿SLAM做局部精定位,兩個鬆耦合在一起。

Rokid這次將這個鬆散耦合,做了更深度的融合。實現了端上只做定位和跟踪,雲端上空間建圖。

這種端雲協同協作運算的方式,可以提升一些場景下的定位精度,如弱紋理、環境有變化的場景,同時也能降低行動端的運算功率。原理上主要利用了RTC(Real time communication,即時通訊)在弱網對抗/低時延傳輸和視訊影像壓縮上的優勢。

緊密耦合的實現,依靠了Rokid全新升級的底層作業系統YodaOS-Master

具體變化體現在XR系統、XR雲端服務和XR硬體三個層面。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

系統全方位升級後,Rokid可以建立一個更完整閉環的OS生態,以此更好地連結開發者和消費者。

深扒完靈境的技術堆疊後不難發現,Rokid這次發布是有備而來。

最核心的目的十分明確:降低AR內容創作門檻,壯大AR內容創作團隊。

只需一部手機即可體驗,耗時縮短到10分鐘,這確實是每個人幾乎都能滿足的條件,還有機會感受到所謂「真正的AR」到底是什麼形態。想一想,確實能吸引一波好奇者了。

由此也讓人開始好奇,為什麼要在此刻正式推出靈境?又為什麼要主打降門檻?

答案還是要從市場需求、AR產業發展及產業玩家經驗驗證幾個維度看起。

為什麼要做靈境?

最直接的影響因素還是來自於市場需求

Rokid副總裁、數位文化事業部負責人陳希表示,目前在文博文旅領域,對AR內容的需求非常突出,她給了一個很驚人的數據來說明:

今年春節期間在文博場景體驗過Rokid AR的人數達到了4萬人

全國範圍內,如廣東省博物館、西安博物院、陝西自然博物館、蘇州博物館、良渚古城遺址公園等都陸續推出了AR導覽。

AR會在文博領域快速進入的原因也很好理解,它能極大程度上豐富3D空間內的內容豐富度,並將文化知識以更加直觀、豐富、多樣的方式呈現到參觀者面前。

而全國登記在冊的博物館數量就超過了6000家,隨著越來越多博物館提出需求,過去長鏈條的內容生產模式,難以快速響應。更何況這種以方案落地的模式,對人力物力成本的要求也很高。

因此,市場上亟需一個能高效易上手的生產力工具,能夠加速AR內容的創作,並降低成本。

另一邊,在工業方面類似的情況。

Rokid副總裁、產品技術中心負責人江濤介紹說,和文博場景有些相似,在工業生產一線上,也希望能夠在3D空間裡盡可能展示更多信息。

這樣第一線人員進行操作時,不用再專門走到一些儀表前查看資料、核對情況,而是直接在工作現場就能看到所需資訊。

用江濤的話來說,從工業元宇宙的大概念出發,完成數位轉型是做完了工業元宇宙的基建,將整合分析好的數據再重新反饋到現場,才真正走完了一整個閉環。

由於工業場景天然對降本增效提出更高要求,因此工業場景內AR的需求和市場可能會更大。

在許多工廠中,許多條真實的AR生產線已經被搭起來了:

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

此外,在教育領域,用上AR輔助教學也逐漸普及開來。

例如基於AR的安防教育,就不再只是書面、視訊形式的灌輸了。小朋友們可以在模擬的火災場景中學習如何逃生,記憶點會更加深刻,教育的效果自然也會更好。

而在這一幕內,學校老師往往是需要基於課程要求,持續更新AR內容的,一個基於手機就能用的低門檻內容生產工具,也確實符合真實需求。

如上是市場方面帶來的直接需求。

更深層的影響因素,是AR現階段演化的要求。

一直以來,AR原生內容生態匱乏都常常被人吐槽,成為許多人不願意體驗AR設備的一大原因。

跟手機借生態?雖然內容豐富度短期上來了,但展現的內容更多侷限在2D層面,真正的AR內容沒有被展現出來,還會讓人覺得AR眼鏡的終途就是手機配件?

由此,對AR產業而言,幾乎所有人都意識到豐富內容生態是當下發展的重中之重。如蘋果在最早期探索AR時,也是率先發布了AR Kit開發平台,把APP Store的打法繼續用在AR領域。

畢竟只有內容豐富了,使用者才會被吸引過來,AR才有機會向前更進一步。那麼眼下的問題就變成如何豐富AR原生內容。

僅憑AR廠商一己之力顯然效率不夠高,過去多年來探索出的AR互動場景還是非常有限。

號召更多開發者和創作者加入,正逐漸成為業界的共識,並且要把使用門檻和成本都打下來。

由此也不難理解,身為業界的資深玩家,Rokid選擇推出靈境這樣一個AR空間引擎。

但,為什麼是現在?

Rokid給出的答案是:自身在文博領域的經驗積累,驗證了市場對於AR的真實需求。

陳希回憶起最初和良渚古城遺址公園的合作時,各種場景仍歷歷在目。

她記得當Rokid和花園提出,可以利用AR來對文物遺址進行修復時,花園立刻表示很感興趣。整個計畫從最初提出到落地,前後經歷了3個月左右,最終在2020年國慶日和大眾見面。

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

最開始,Rokid一天提供了200副AR眼鏡的租賃,結果一個小時左右設備就全被租出了。並且對AR好奇的人群,很多都是老人小孩,也出乎了Rokid的預料。

而有了真實場景的應用,其實能從第一線累積到非常寶貴的開發經驗。例如在設想里人們都會按照導覽順序參觀,但實際上不是如此,Rokid就要保證亂序參觀也不會影響AR效果的展現。以及針對博物館室內燈光條件不好的情況,技術團隊也特別做了優化……最終這些優化和迭代,一併體現在了靈境的設計上。

陳希也感慨說,不可否認當下還不是所有人都願意花上千元去購買一個專門的設備來體驗AR,但是如果只花50塊錢通過租借,是很多人都願意嘗試的

那麼等到未來,應用場景夠多時,價值就會慢慢體現,那時候可能就到了AR真正走向C端的時刻。

由此也不難理解,為什麼靈境會在此刻推出。

因為它能通過一個小槓桿,撬動龐大的開發者和創作者群體,發動數以千計、數以千計的人,共同探索廣闊的AR內容和應用場景。

並以此助推AR更快速走向大眾群體,成長為真正意義上的下一代行動運算終端設備。

靈境會帶來什麼?

作為一款AR原生內容生產力工具,靈境的出現向產業內外傳遞了一個訊號:

是時候發展AR的內容生態了。

並且不再是和手機或其他終端借生態,而是從AR本身出發,能夠展示「什麼叫真正的AR」。

一方面,參考目前行動運算終端的絕對霸主智慧型手機,它正是在出現了爆款內容應用程式後,才快速吸引了大量用戶。

另一方面,AR原生內容和手機等終端內容有本質性區別,它需要是3D的

如果一直跟手機借生態,那最終大眾對於AR的理解,可能只是手機的虛擬大屏,這會限制整個技術和產業發展的想像力,也會影響AR的獨立發展。

由此,開發AR原生內容是當下必須做的事。

儘管目前在算力、硬體等條件的限制下,AR內容還無法一下達到大家的最終期待。但誠如Windows最初,不也是只有掃雷、蜘蛛紙牌這樣的簡單應用嗎?

我們需要給予科技足夠的耐心,等待改變發生。

更何況,端雲一體的思路,確實為解決當下算力問題提供了新解法。

如果再從AR產業外的角度來看,靈境的出現也為廣大開發者和創作者提供了一個新的機會。畢竟每一代行動運算終端的崛起,都會伴隨一大批非常優秀的內容應用和軟體湧現。

總之,在AR向前推進的這條路上。還會不斷有新的產業角色、技術力量加入進來,共同推動AR駛向我們的終極想像:真正意義上面向大眾的擴增實境。

你覺得呢?

真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧

以上是真·3D創作來了,必須用手比劃!這回AI總不能搶我飯碗了吧的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51cto。如有侵權,請聯絡admin@php.cn刪除
及時工程中的思想圖是什麼及時工程中的思想圖是什麼Apr 13, 2025 am 11:53 AM

介紹 在迅速的工程中,“思想圖”是指使用圖理論來構建和指導AI的推理過程的新方法。與通常涉及線性S的傳統方法不同

優化您的組織與Genai代理商的電子郵件營銷優化您的組織與Genai代理商的電子郵件營銷Apr 13, 2025 am 11:44 AM

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

Apache Pinot實時應用程序性能監視Apache Pinot實時應用程序性能監視Apr 13, 2025 am 11:40 AM

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Apr 13, 2025 am 11:23 AM

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

pixtral -12b:Mistral AI'第一個多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一個多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

生成AI應用的代理框架 - 分析Vidhya生成AI應用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a

生成AI在金融部門的應用生成AI在金融部門的應用Apr 13, 2025 am 11:12 AM

介紹 金融業是任何國家發展的基石,因為它通過促進有效的交易和信貸可用性來推動經濟增長。交易的便利和信貸

在線學習和被動攻擊算法指南在線學習和被動攻擊算法指南Apr 13, 2025 am 11:09 AM

介紹 數據是從社交媒體,金融交易和電子商務平台等來源的前所未有的速度生成的。處理這種連續的信息流是一個挑戰,但它提供了

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)