搜尋
首頁科技週邊人工智慧從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?

在當前的科技浪潮中,元宇宙的概念憑藉其無限的想像和可能性,像一顆耀眼的新星吸引著世界的目光。巨大的發展潛力,吸引一波又一波的企業,前赴後繼地向元宇宙發動衝鋒。

在這些企業當中,蘋果是最被寄予厚望的一個重磅選手。 6 月 6 日,在經過了長達7年的準備之後,蘋果終於讓其頭戴顯示器設備 Vision Pro,在 WWDC 2023 正式亮相了。

某種意義上,在XR設備領域,蘋果能走多遠,就代表目前的技術前沿能走多遠。然而,以目前的情況來看,蘋果的產品雖然在多方面有不錯的表現,但離人們的期待還是有不少距離。從許多設計和指標,都能看出目前的技術瓶頸以及蘋果必須做出的一些妥協。更重要的是,Vision Pro的最終售價高達3499美元(約合人民幣24860元),這個價格意味著這款產品必然是一個小眾的“玩具”,不能飛入尋常百姓家。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走? 蘋果股價狀況

#那麼,我們離理想化的元宇宙世界還有多遠呢,到底還需要解決哪些技術問題和挑戰?為了回答這個問題,資料猿訪問了Cocos CEO林順、DataMesh創辦人兼CEO 李劼、優立科技CEO張雪兵、雲天暢銷CTO梁峰、亞信科技研發中心副總經理陳果、墨宇宙首席產品官林宇等多位業界專家,了解元宇宙各項關鍵技術的發展態勢。接下來,我們將結合蘋果最新發表的XR頭顯產品,深入探討近眼顯示、計算渲染 5G專網、感知互動和內容製作四個關鍵技術領域的最新發展態勢以及存在的挑戰。

近眼顯示:顯示面板技術路線明確,光波導還沒摸到「門」

近眼顯示器是通往元宇宙世界的第一道大門,從蘋果此次發布的產品來看,其Vision Pro配備了12顆攝像頭,配備Micro OLED屏幕,擁有2300萬像素,每隻眼睛分配到的像素超越4K電視,可以實現100吋螢幕的觀看,支援3D影片觀看,這算是目前能達到的頂尖水準了。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走? 蘋果Vision Pro 產品圖

那麼,整個近眼顯示有哪些關鍵技術,目前產業進展如何呢?在元宇宙的實現中,近眼顯示技術是硬體突破的關鍵。它主要由顯示面板和光學系統(尤其是光波導)兩部分組成,這兩個技術路線都還有許多技術難點需要克服。

1、顯示器面板,決定了解析度、色彩飽和度和刷新率,MicroLED被寄予厚望。

顯示面板是近眼顯示技術的重要組成部分,它直接影響使用者在元宇宙中的視覺體驗。顯示面板的主要技術指標包括解析度、色彩飽和度和更新率,這些指標的提升可以為使用者帶來更清晰、更豐富、更流暢的視覺體驗。

解析度是顯示面板的核心指標之一,它直接決定了元宇宙的細節展現能力。現階段,面板解析度的提升正面臨技術瓶頸,如何在確保面板尺寸和功耗的同時提升其分辨率,是顯示面板技術需要解決的重要問題。

色彩飽和度是另一個重要指標,它影響著元宇宙的色彩展現能力。目前,雖然各種顯示技術在色彩表現力上已經取得了不錯的效果,但要在元宇宙中實現真實世界的色彩還有一定的距離。

更新率影響著使用者的動態視覺體驗,高更新率可以提供更流暢的動畫效果。然而,提升刷新率會增加運算和功耗的壓力,如何在提升刷新率的同時降低功耗,是另一個大技術挑戰。

在顯示器面板領域,目前主要的技術包括液晶顯示器(LCD)、有機發光二極體(OLED)、微型LED(Micro-LED)。雖然LCD技術相對成熟且成本較低,但在色彩飽和度、對比和刷新率等方面相較其他技術有所欠缺,而OLED顯示器則需要解決壽命和成本問題。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走? 顯示面板發展進程

#

近年來,MicroLED顯示器技術以其卓越的性能受到了業界的廣泛關注。它採用微米級的LED作為像素,不僅能提供更高的解析度、更寬的色域和更高的更新率,而且還具有更低的功耗和更長的壽命。但是,MicroLED面板的製造難度大、成本高,特別是在像素尺寸小、像素密度高的情況下,如何實現大規模、高效率的生產,仍是一個待解決的關鍵技術難題。這次Vision Pro配備的就是Micro OLED螢幕,但在近2.5萬的價格中,相信這塊Micro OLED螢幕「貢獻」了不少。

2、光波導技術的成熟度比顯示面板低,其技術路線和突破時間都不確定。

光學系統,尤其是光波導,對於近眼顯示技術來說,同樣重要。光波導技術的核心是將光線引導到使用者的視網膜,從而在使用者的視野中產生虛擬影像。而視場角是衡量光波導品質的重要指標,它影響使用者在元宇宙中的視覺範圍。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?

在擴增實境(AR)和虛擬實境(VR)裝置中,顯示面板和光波導通常是緊密結合在一起的。顯示面板產生影像,然後這些影像被送入光波導。光波導的任務是將這些影像引導到使用者的眼睛,同時也可能進行一些調整以改善視覺體驗,例如擴大視野角或調整影像的焦距。這個過程可以簡單地想像成一個電影院:顯示面板就像是投影機,它產生圖像;而光波導就像是投影屏幕,它接收投影機產生的圖像並將其呈現給觀眾(在這種情況下,觀眾就是使用者的眼睛)。

光波導技術可以分為幾種不同的類型,包括衍射光波導、折射光波導和全像光波導等。其中,衍射光波導是目前最常使用的一種。它透過微型光柵將入射的光線分散成多個角度,然後利用總反射將這些光線引導到使用者的視網膜。這種技術可以提供較寬的視場角和較高的成像質量,但在光效率、色散以及複雜的製造過程等方面存在問題。

在光效率方面,繞射光波導的問題在於只有部分光線能夠有效利用,大部分光線會被散射掉,造成能源的浪費。而在色散方面,由於光的繞射角度與有關,因此不同顏色的光線在經過光柵後會產生色散,影響成像的色彩準確度。這對於元宇宙這樣追求高度真實感的應用來說,無疑是一大難題。

此外,製造過程的複雜性則表現在對精度的極高要求。衍射光波導的微型光柵需要精確到奈米級別,這在生產過程中帶來了極高的技術難度和成本壓力。為了克服這些問題,研究者們正在尋求新的光波導技術,如折射光波導和全像光波導。這些技術以不同的方式引導光線,有可能在克服衍射光波導的問題方面提供新的解決方案。例如,全像光波導利用全像影像記錄和重現光的波前,可以在減少色散和提高光效率方面提供優勢。

然而,新的光波導技術也有其自身的挑戰。例如,折射光波導雖然在光效率上優於衍射光波導,但其視場角通常較小;而全像光波導則面臨著如何實現大規模、高品質的全像影像製造的難題。

整體來看,顯示面板技術雖然還有提升的空間,但其技術路線相對確定,可以預期在未來幾年會有進一步的提升。相較於顯示面板技術,光波導技術的成熟度較低,其技術路線和突破時間仍不確定。 儘管光波導的基本原理已經被理解,但在實際應用中,如何設計和製造出高效、高品質、低成本的光波導仍然是一項技術挑戰。

運算渲染:GPU 雲端運算 邊緣運算 5G能突破算力瓶頸麼?

元宇宙要求建構一個富有沉浸感的、與真實世界無縫接軌的虛擬環境,而運算渲染就是實現這一目標的關鍵技術之一。計算渲染的任務就是將虛擬世界中的三維模型以及其材質、光線等屬性,轉換成最終使用者看到的二維影像。這個過程需要大量的計算,包括幾何計算、光線追蹤、光照計算、材質渲染、後處理等。

為了提升裝置算力,蘋果的Vision Pro 採用雙晶片設計,包含一枚 Mac 等級的 M2 晶片,同時配置即時感測器處理晶片 R1。其中,R1 晶片主要負責感測器的訊號傳輸、處理。

蘋果公司可以為了自家XR設備設計專門的晶片,但就整個產業來看,要實現理想的效果到底需要多大算力呢?接下來我們就這個問題進行更深入的探討。

1、要較好實現理想的元宇宙場景,每個XR裝置至少要塞一塊英偉達A100 GPU。

理想的狀態是實現即時的、高解析度的、高幀率的、全光線追蹤的渲染,這需要極高的算力。具體的算力需求取決於許多因素,如渲染的複雜度、解析度、幀率、影像品質等。目前有一些技術來降低計算量,比較典型就是注視點渲染技術,該技術利用人眼視覺特性,只在視線注視點及其周圍區域進行高精度渲染,而在其它區域進行低精度渲染,有效降低了渲染任務的複雜度。蘋果這次發布的Vision Pro ,就用到了動態注視點渲染技術,將最大的畫質精確地傳遞到使用者眼睛正在註視的每一幀。

蘋果Vision Pro產品介紹

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?

整體來看,元宇宙對運算渲染的需求還遠超現有技術的能力。特別是在行動裝置上,由於功耗、散熱等問題,算力的提供更為困難。 3D資料的處理不僅需要大量的運算資源,而且需要即時或接近即時的回饋。這就對算力和延遲提出了極高的要求。現有的運算設備,包括最先進的GPU和AI晶片,尚無法完全滿足這些需求。

為了更清楚的說明算力供給與元宇宙算力需求之間的“鴻溝”,我們來以一個典型場景來分析算力供需情況。

假設我們想要實現4K解析度(即3840x2160像素)、60幀/秒、每個像素追蹤100條光線的全光線追蹤渲染,處理一條光線需要進行大約500次浮點運算(實際數據可能要更高)。

那麼需要的算力=3840像素 x 2160像素 x 60幀/秒 x 100光線/像素x 500浮點運算/光線 = 4,976,640,000,000浮點運算/秒=25 TFLOPS。

需要說明的是,這是一個非常粗略的估計,實際所需的算力可能會更高,因為在光線追踪渲染中,除了光線追踪,還有許多其他類型的計算,比如著色、紋理取樣、幾何變換等。

英偉達高階晶片A100的峰值算力為19.5TFLOPS,在京東上英偉達A100 40G的售價超過6萬元。也就是說,要實現比較理想的元宇宙場景渲染效果,一個裝置就至少需要一塊A100晶片。光是一個晶片成本就超過6萬元,那XR設備的價格會更高。其他技術限制先不談,這個設備價格就是足以勸退絕大部分消費者。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走? 英偉達A100晶片

除了提升通用GPU效能外,針對光線追蹤的專用硬體 專門的軟體最佳化,看來是提升元宇宙應用運算效能的重要途徑。 對於元宇宙應用,光線追蹤是一個重要的運算任務,因此可以設計專門的光線追蹤硬體。英偉達的RTX系列GPU就是一個例子,它們包含了專門的RT核心,用來加速光線追蹤運算。這種硬體可以直接在硬體層級執行一些運算密集的操作,例如光線與場景中的物件的交點計算,從而大大提高計算效率。光線追蹤的軟體最佳化方面,則包括更好的光線排序演算法、更有效率的空間劃分結構等。

目前,要進行元宇宙的運算渲染離不開GPU,而GPU算力的來源主要有兩個,一是本地的GPU,二是雲端的GPU。本地的GPU主要用於遊戲、AR/VR設備等需要即時渲染的場景。雲端的GPU則可以用於更複雜的渲染任務,如電影特效、建築視覺化等,雲端渲染的結果透過網路傳輸到使用者的裝置上。

理想的運算渲染解決方案應該是一個綜合本地和雲端資源的混合渲染系統。這個系統應該可以智慧地根據任務的性質、網路狀況、設備效能等因素,決定渲染任務在本地端還是雲端執行,以及如何分配任務。此外,這個系統還應該支援各種渲染技術,如光線追蹤、即時光照、全域光照等,以便根據需要選擇合適的渲染技術。

要實現這個目標,就需要在本地和雲端(或邊緣端)實現高速的資料傳輸。那麼,到底要多高的網速,才能滿足元宇宙的要求呢?

2、5G勉強夠用,但5G網路建置進度不及預期。

我們還是以上面典型的元宇宙算力需求為例(4K解析度、60幀/秒、每個像素追蹤100條光線的全光線追蹤渲染),看看要想以雲(邊緣) 端的運算渲染方案,需要多大的網路頻寬。

如果我們將每個像素的顏色資訊簡化為24位元(8位元紅色、8位元綠色、8位元藍色),來計算所需的網路頻寬:

3840像素 * 2160像素 * 24位元/像素* 60幀/秒= 11,943,936,000位元=11.92Gbps。

5G網路的峰值資料速率理論上可以達到20Gbps,但這是在理想的實驗室環境下的峰值速度。在實際使用中,使用者通常可以期望在100Mbps到3Gbps之間的速度,離元宇宙的網路需求還有一定距離。即使是比較好的5G網絡,也只是勉強堪用。

要指出的是,即使是全球5G基地台最多的中國,5G網路建置進度也並不算快。據計算,如果要建立一個良好的5G網絡,至少需要1000萬5G基地台。而截至2023年2月末,我國5G基地台總數達238.4萬個,要超過1000萬規模還需要幾年時間。 也就是說,在網路建置方面,我們還沒為元宇宙做好準備。

顯然,無論是從算力或網路方面,目前都存在瓶頸。那麼,要如何破除這個瓶頸呢?為此,數據猿採訪了幾位業界專家。

就「GPU 雲端運算邊緣運算,是解除元宇宙算力瓶頸的金鑰匙麼?」這個問題,優立科技CEO張雪兵認為透過雲邊端協同並不是解決算力問題的一個很好方式, 「雲端渲染透過將渲染邏輯集中到伺服器端,只是降低了少量終端設備在特定時間內的渲染問題。而終端設備發展的趨勢是配置越來越高,運算能力越來越強,雲端渲染的資源堆積在成本角度和並發角度都是低效的,並且浪費了本地設備的算力。本地算力渲染只需要解決本地渲染能力瓶頸一個問題,就可以解決多並發問題,而雲端渲染邊緣運算GPU,卻需要解決伺服器並發量、負載平衡、視訊串流網路頻寬、雲端算力瓶頸等多個問題。當透過渲染演算法突破本地設備渲染瓶頸的時候,一切雲端渲染的建置將成為過去。」

張雪兵介紹到,優立科技透過獨創的國產自研的流式渲染技術,可以運用本地算力解決海量在線三維數據的遠程渲染問題,並且通過CPU渲染無需高配顯卡,突破雲渲染高成本和資料低併發瓶頸,已經解決了傳統雲端渲染邏輯下無法解決的各種問題。

雲天暢銷CTO梁峰認為,「5G時代,雲端遊戲、元宇宙等即時互動、快速反應的新興應用場景,對算力的需求呈現指數級增長,尤其是AI與元宇宙的加速融合,以及算力逐漸從To B到To C的轉移,為算力帶來了巨大的發展空間。若要真正實現大規模商業化應用,帶給用戶低延時、沉浸式的體驗,目前的算力遠遠無法滿足。GPU以其獨特、強大的平行運算能力逐漸成為市場探索支撐新興應用場景算力底座的重要方向,結合雲端運算和邊緣運算,為新興應用大規模商業化落地提供了新的思路。算網一體、雲端網路融合,打造全域覆蓋的算力網路正成為產業發展趨勢。」

亞信科技研發中心副總經理陳果持相同的觀點,他認為,「如果要達到元宇宙的理想狀態,現有算力資源遠遠不夠——極致的可視渲染、實時的虛實交互、精準的智慧推理都對算力資源提出極高要求。未來的「雲端端」多元算力協同,將更能滿足元宇宙的算力需求。同時,GPU等相關技術也是消除元宇宙算力瓶頸的關鍵-GPU算力加速圖形渲染、提供物理模擬能力,促動XR技術滿足元宇宙所需的沉浸式體驗;AIGC技術為建構元宇宙場景提供高效率、高精度、低成本的技術手段,促使元宇宙實現「人、場、貨」的快速建模;WebGPU技術的發展,使高擬真、真3D的互動式應用變成可能,將較大提升瀏覽器的圖形性能,消除未來元宇宙應用在前端的效能瓶頸。」

感知互動:內部捕捉是元宇宙最自然的互動方式

感知互動是建構元宇宙的另一個主要挑戰。要創造真正的沉浸式體驗,就必須確保使用者可以自然、直觀地與元宇宙進行交互,而這就需要涵蓋視覺、聽覺和觸覺等多個感知維度。

從蘋果Vision Pro 產品來看,其採用了手眼語音互動 Eyesight多種互動方式的融合。值得提出的是,Vision Pro 沒有配備手柄,這與以往的XR產品有很大的不同。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走? 蘋果Vision Pro產品示範圖

Vision Pro 透過語音、眼球追蹤以及手勢來操作,使用者透過注視來瀏覽應用程式圖標,手部輕點選擇,輕掃滾動,或發出語音指令,還可以使用虛擬鍵盤輸入文字。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走? 蘋果Vision Pro產品示範圖

要指出的是,Vision Pro還是一個「期貨」產品,要等到明年初才正式發售。因此,在示範影片中有哪些功能能實現,效果如何,得等到產品正式上市,使用者體驗之後才能有真實的感知。

對於感知交互,蘋果並沒有揭露太多的技術細節。接下來,我們從產業角度來分析感知互動的核心技術環節。一般而言,XR設備的感知互動方式,可分為視覺互動聽覺互動、觸覺互動、手勢互動幾種。

視覺互動主要依賴虛擬實境(VR)和擴增實境(AR)技術。目前已經有成熟的VR和AR設備,可以讓使用者以第一人稱視角在元宇宙中移動和觀察。但這些設備往往需要戴頭盔,對使用者的舒適度和長時間使用造成了挑戰。此外,如何提供足夠的視覺解析度和視野角,使用戶感覺像在現實世界一樣自然和真實,也是一個重要的技術挑戰。

聽覺互動則依賴3D音訊技術,包括空間音訊和物件音訊。這些技術可以創造出富有深度和方向感的音場,讓使用者可以準確地判斷聲音的來源和遠近。但目前的3D音訊技術仍難以提供完全自然的聽覺體驗,特別是在模擬複雜的聲音環境和聲音物理效應方面。

觸覺互動是最大的挑戰之一。儘管已經有各種觸覺回饋設備,如振動手柄和觸覺服,但這些設備的反饋強度和精度都無法滿足真實世界的觸覺體驗。更先進的技術,如電刺激和超音波觸覺回饋,正在研發中,但尚未成熟。

相較於以上幾種方式,手勢互動作為一種直覺且自然的互動方式,被視為元宇宙中理想的互動手段。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?

手勢互動的有兩個核心環節:捕捉和解析,捕捉是指透過各種技術收集使用者手部的運動訊息,而解析則是對這些資訊進行處理,辨識出具體的手勢和動作。

捕捉技術主要分為外部捕捉和內部捕捉。外部捕捉通常依賴相機或感測器來記錄手部的位置和動態,例如微軟的 Kinect 和 Leap Motion 就是使用這種方法。內部捕捉則使用穿戴式設備,這類設備通常裝備了一系列的感測器,如加速度計、陀螺儀、磁力計等,它們能夠在三個空間維度上捕捉手的位移、旋轉和加速度。

可以說,內部捕捉是最理想的互動方式。內部捕捉由於感測器直接與手部接觸,因此無論使用者處於什麼環境或光線條件下,都能夠穩定、準確地獲取手部運動資訊。此外,內部捕捉裝置通常比較小巧,容易穿戴,使用者可以隨時隨地進行手勢互動。內部捕捉最大的技術困難是感測器精確度和複雜手勢辨識能力。手部的運動非常複雜,要準確捕捉並即時轉換成虛擬動作,對感測器的精確度和處理速度都有很高要求。目前,雖然內部捕捉可以很好地獲取手部的基本運動,但對於更複雜的手勢,例如手指的微小動作,可能就難以準確識別了。 如果能夠解決複雜手勢的高精度辨識難題,內部捕捉將是元宇宙最理想的互動方式。

解析技術方面,則主要依賴電腦視覺和機器學習演算法。電腦視覺用於處理從捕捉設備獲得的圖像或視頻,提取出手部的關鍵點和輪廓。而機器學習演算法,特別是深度學習演算法,用於對這些數據進行分析,識別出具體的手勢。在解析技術方面,目前的演算法主要依賴深度學習,這要求有大量的標註資料進行訓練。然而,由於手部的複雜性和多樣性,要取得和標註這些數據是非常困難的。

除了捕捉和解析,還有一個問題需要解決——與虛擬物體的交互,如何讓用戶能夠在虛擬環境中透過手勢抓取、移動和操縱物體,以及如何給用戶提供觸覺反饋,都是需要解決的問題。一種可能的方法是使用虛擬手模型,將使用者的手勢轉換為虛擬手的運動,然後讓虛擬手去操作虛擬物體。同時,需要研究更有效的觸覺回饋技術,如電刺激和超音波,來提供使用者觸覺回饋。

可以發現,在感知互動方面,還有一系列技術難題需要解決。

內容製作:ChatGPT、AIGC成為建構智慧NPC的關鍵

蘋果是打造內容生態的高手,在此次 Vision Pro發表會上,蘋果也發表了一些內容建置的進展。例如,Complete HeartX 創造的互動式的 3D 心臟;JigSpace 讓設計師能視覺化的審閱自己的F1賽車設計草稿 。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走? Vision Pro產品介紹圖

需要指出的是,蘋果所展現出來的一些內容製作能力,離我們理想的內容元宇宙還有很遠的距離。我們想要的是像《頭號玩家》或《失控玩家》那樣的元宇宙,而不是只是一個個精美的3D「展品」。為了實現這個目標,我們需要探討元宇宙內容製作的深層邏輯。

在元宇宙中,環境、人的虛擬代表以及非玩家角色(NPC)構成了這個虛擬世界的核心內容。這三者共同建構了元宇宙的世界觀和故事線。環境為虛擬世界提供了實體和文化背景,定義了虛擬世界的規則和操作方式。它是虛擬世界的基礎,構成了元宇宙的空間維度。人的虛擬代表,或稱為玩家角色,是使用者在虛擬世界中的身分和行動者。它是使用者參與和體驗虛擬世界的工具,反映了使用者的意願和行為。

在理想情況下,NPC可以為虛擬世界提供多樣化的角色和故事線,豐富虛擬世界的內容和體驗。他們是虛擬世界的活動驅動者,能夠幫助使用者更好地參與和理解虛擬世界。 NPC的可塑性和創造性使得元宇宙的故事線具有無盡的可能性,透過與NPC的互動,使用者可以在元宇宙中體驗到各種各樣的故事和冒險。人類在元宇宙中的虛擬代表透過與NPC的互動,可以獲得特殊的「特權」或能力。這種「特權」可以幫助使用者在虛擬世界中達成目標,提升使用者在虛擬世界中的身分和地位。因此,NPC不僅是元宇宙的故事驅動者,也是使用者在虛擬世界中獲得成功和滿足感的重要因素。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?

然而,要實現上述目標,需要NPC具有高度的智慧水平,目前元宇宙中的NPC是遠遠達不到的。目前的NPC多依賴預設的對話和行為,這使得他們在回應玩家行為時可能顯得刻板,缺乏真實感和個人化。同時,NPC在推動故事情節和持續互動方面也存在著限。

在這個背景下,使用AI技術,尤其是AIGC、ChatGPT來優化元宇宙內容生產、建構智慧NPC的潛力和優勢就顯得尤為突出。

Cocos CEO 林順認為,AIGC與元宇宙的結合,可以大幅提升內容的生成效率與創造力。 AIGC 可以承擔繁重、重複的內容創作工作,為開發者節省時間和精力,同時帶來更多樣化和豐富的遊戲內容。採用 AIGC的技術,可以自動生成世界和場景,加速元宇宙的內容創造過程,讓元宇宙的世界更加豐富多彩,服務於各種形態的需求。例如:自動生成任務和劇情,使得元宇宙中的內容更加生動有趣;自動生成NPC和角色設計,AIGC 可以幫助開發者生成各種個性化的NPC 和角色形象,使得元宇宙中的角色更加多樣化和獨特;自動產生音效和音樂,逼真的音效效果和動態音樂,讓元宇宙場景更有身臨其境的沉浸體驗。

林順也認為,AI 可以為元宇宙中的NPC 提供更逼真和聰明的交互,帶有「靈魂」的NPC 可以在元宇宙中形成一個動態的世界,NPC 可以根據玩家的行為和決策做出相應的反應,使遊戲世界更逼真、更生動,推動世界的發展。它們可以透過自然語言處理和情感識別技術來理解玩家的指示和情感,並做出相應的回應,從而提供更個人化和豐富的遊戲體驗。 AI 賦予 NPC 更真實的"靈魂"或個性,透過情緒建模和認知模型,AI 可以使NPC表現出複雜的情緒狀態、個性特徵和行為模式,增加玩家與 NPC 之間的情感連結和互動。

墨宇宙首席產品官林宇表達了類似的觀點,他認為,「AIGC將極大的提升元宇宙在「人、物、場景」3個核心要素上的生產效率。例如,在數位人形象造型的設計方面,提升設計效率;在數位人大腦智慧的建構方面,極大的提升數位人的智慧水準;2D和3D的圖片和影片內容的AIGC,可以提升物和場景的建模設計效率。AIGC可以賦予NPC大腦,即“靈魂”,極大的提升NPC的智能化水平,比如NPC和用戶的智能問答,不僅是文本的問答,甚至包括語音的問答,以及圖片和視頻等多模態的智能溝通。」

最後,DataMesh創辦人兼CEO 李劼提到,在企業元宇宙領域,還需要解決一個「雞生蛋還是蛋生雞」的難題——要有高品質的內容才能吸引用戶,但如果沒有足夠的用戶,就無法產生和維護這些高品質的內容。這是一個典型的網路效應問題。

李劼認為,在企業元宇宙的TEMS(訓練、體驗、監控和模擬)模型下,解決這個問題的一種可能的方式是透過模擬(Simulation)和訓練(Training)這兩個面向來初始驅動元宇宙的內容生成。在早期,企業可以透過建立特定的模擬場景來進行內部員工的培訓和教育,這不僅可以提升員工的技能,也可以為元宇宙提供初期的活躍用戶和內容。

隨著時間的推移,當員工逐漸適應並依賴這種新的工作方式,企業元宇宙的使用者基礎將會成長,同時這些使用者也會在元宇宙中產生大量的互動資料。這些數據可以被收集和分析,從而進一步優化元宇宙的體驗(Experience)和監控(Monitor and Control)功能,形成一個良性的循環。

在談到元宇宙的殺手級應用時,李劼認為殺手級應用可能是將TEMS四個方面完美融合的解決方案。例如,一個能夠即時模擬複雜業務流程,提供豐富和客製化的培訓內容,同時具備高效的監控和控制功能,以及提供無縫、身臨其境的用戶體驗的應用,可能就是元宇宙的殺手級應用。這樣的應用不僅可以大幅提升企業的生產效率和員工的工作滿意度,也能推動企業的持續創新與發展。

以上,我們分析了XR、元宇宙的一些核心技術領域和麵臨的挑戰。最後,期待蘋果這樣的公司能夠繼續突破技術瓶頸,並且早點把價格降下來(超過2萬的價格的確不親民),讓《頭號玩家》那樣絢麗多彩的元宇宙早點到來。

從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?

但實事求是的說,我並不看好蘋果這次發布的XR頭顯。蘋果是一家偉大的公司,消費性電子領域的產品力也獨步全球。但是,XR設備、元宇宙產業還存在一些顯著的技術瓶頸,要突破這些瓶頸需要全行業的努力,並且需要時間,單靠一家公司來突破是不太可能的。當初蘋果發表Iphone,將人類拉入行動網路時代,不只是蘋果的功勞。事實上,當時人類已經一腳邁入行動網路時代了,只不過蘋果的產品做得最好,摘了最大的果實。試想一下,如果我們的網路還停留在2G甚至1G,Iphone還有用麼?蘋果很偉大,但再偉大的企業也不可能超越時代。

理性來看,上述的近眼顯示、計算渲染、感知互動、內容製作,每一項都還存在不小的挑戰。即使強如蘋果,也只是在現有產業條件下拿出了一款最好的產品,但離我們的元宇宙理想還差不少的距離。可以預見,等大量使用者真正體驗Vision Pro的時候,大機率的感受會是:跟以往XR產品相比有一些不錯的設計和突破,但整體離預期還差很遠,「槽點」不少。例如,根據介紹,Vision Pro那一配套的有線電池只能撐2小時。

文:一蓑煙雨 / 資料猿

#

以上是從「嘿,Siri」到元宇宙,蘋果還有多遠距離要走?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
Python的隊列 - 分析VidhyaPython的隊列 - 分析VidhyaApr 16, 2025 am 10:32 AM

介紹 在超市隊列中設想自己,耐心地等待輪到您為自己喜歡的藝術家購買音樂會門票。 這個有序的過程,個人加入一條線並首先以(FIFO)的方式進行前進,是PREC

AV字節:人工智能行業轉移和技術突破 - 分析VidhyaAV字節:人工智能行業轉移和技術突破 - 分析VidhyaApr 16, 2025 am 10:29 AM

本週在AI中:重大收購,模型進步和道德考慮因素 該AV字節版涵蓋了過去一周的重大AI突破。 從Google對角色的戰略收購到BITNET B1.58的發布

探索Movinets:有效的移動視頻識別探索Movinets:有效的移動視頻識別Apr 16, 2025 am 10:25 AM

介紹 讓我們通過“ Movinets unleashed”深入研究移動視頻識別的迷人世界!該博客將為您探索Movinets如何在移動設備上轉換視頻分析

熊貓vs Polars熊貓vs PolarsApr 16, 2025 am 10:24 AM

介紹 想像一下,您在數據項目中深處膝蓋,與大量數據集搏鬥,並儘快尋找模式。您可以觸及自己的數據操縱工具,但是如果存在更好的選擇,該怎麼辦? 輸入方面,一個相對較開的

IT業務分析師的角色IT業務分析師的角色Apr 16, 2025 am 10:19 AM

介紹 在啟動創新軟件的邊緣設想了一個動態的IT公司。 儘管興奮很高,但仍出現了一個關鍵的挑戰:彌合技術開發商與業務利益相關者之間的差距。這是IT業務分析師

Python的階乘計劃Python的階乘計劃Apr 16, 2025 am 10:13 AM

介紹 想像一下,準備具有特定所需風味的菜餚;正確的步驟序列至關重要。 同樣,在數學和編程中,計算數字的階乘需要精確的乘法序列

數據編排的氣流替代方案-Analytics Vidhya數據編排的氣流替代方案-Analytics VidhyaApr 16, 2025 am 09:55 AM

介紹 Apache氣流是數據編排中的關鍵組成部分,並以其處理複雜的工作流程和自動化數據管道的能力而聞名。許多組織因其靈活性而選擇了它

您如何註冊NVIDIA AI峰會2024?您如何註冊NVIDIA AI峰會2024?Apr 16, 2025 am 09:49 AM

NVIDIA AI峰會2024:深入研究印度的AI革命 在2024年Datahack Summit之後,印度為10月23日25日在孟買的Jio世界會議中心舉行的NVIDIA AI Summit 2024做好準備。 這個關鍵事件舞會

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),