作者|蘇小如
#AIGC火得一塌糊塗,元宇宙是不是被人遺忘了?
隨著蘋果發表售價高達2.4萬元的新款AR眼鏡 Vision Pro,本來已經沉寂了一段時間的AR和VR又一次回到了大家關注的中心位置。
誰是最先為AR和VR做好準備,並且是最早重新興奮起來的?當然就是做虛擬人、數位人的一系列公司。虛擬人技術是跟文娛結合非常緊密的技術。而在稍早前的元宇宙概念下,和現在的AIGC時代中,虛擬人都有很多能與熱點融合的地方。
與AIGC概念結合,是今年上半年產業的最大主題。本月初,網紅「半藏森林」的數位克隆人上線,用戶可採用月或包年的形式享受語音、通話等服務。由於AI取代了真人驅動,數位人可以7x24不眠不休地工作,使產能大為提升。
這裡所說的在直播過程中依靠真人即「中之人」表演來驅動,是虛擬人的「傳統流派」之一。隨著人工智慧的不斷進化,完全由程式或AI驅動,隨機應變地提供問答已經成為虛擬人產業另一個主要的發展方向。
在實現AI虛擬人的技術路線上,目前也分成兩種:一種是將大模型私有化部署,另一種是在已有開源模型基礎上,進行針對性的二次開發。
表1 本文訪談的三家虛擬人公司的類型劃分 製表/娛樂資本論
#在本文中,娛樂資本論將帶您走進三家典型的虛擬人技術開發商,探索AI為它們的產品研發和商業模式帶來了哪些改變。
AIGC虛擬內容平台雲舶以面向直播播主的「小K直播姬」為載體,以遊戲化的方式探索建構深層的直播生態;
專注端到端生成式AI虛擬人技術的中科深智主打商家帶貨“自動播”,剛剛發布自有的大模型,以顯著提升虛擬人問答互動的效果;
跨模態智慧軟體服務公司邁吉客在為企業提供全自動虛擬主播的同時,也利用企業內部資料訓練專有模型,培育企業的內部資料庫和搜尋引擎。
很多B站直播的主播和觀眾對小K直播姬都絕對不會感到陌生。小K直播姬採用RGB 鏡頭,在收集2D圖片動作數據的基礎上,用演算法產生3D動作數據,形成了技術上的護城河。用戶可以直接使用小K直播姬打造自己的直播虛擬人。
「我們做了3年才搭建了底層演算法,擁有私有訓練資料集,產品初見成效。」
2017年,梅嵩辭去藍港互動遊戲製作人的工作,投身人工智慧產業,創建了雲舶科技,這就是小K直播姬的開發商。遊戲和AI產業的雙重背景,也讓雲舶的商業模式顯得非常獨特。
AI作圖 by娛樂資本論
「我們公司的業務範圍ToB、 ToC兼具。產品包括小K AI動捕、AI繪圖、虛擬人引擎等,也有自營的MCN公會和主播基地。此外,公司也面對直播、遊戲、電商三大核心場景,為企業提供虛擬人,虛擬內容服務。」
專注於端對端生成式AI虛擬人技術的中科深智,5月10日正式發布自有大模型,名叫「GenSense數智薑尚」。
「Open AI公佈了訓練方法後,大模型的入場卷難度變低,企業是否要自建大模型,主要取決於大模型的商業空間。」中科深智的創始人與CEO成維忠說。 「2020年初,我們便基於transformer做跨模態的訓練工作,在資料清洗上也有經驗。」
「我們做大模型主要是兩個方面,一是未來的多模態訓練會基於大語言模型,垂直領域的底層演算法需要依靠大模型開展。二是很多客戶提出做私有化部署,這要求算力能降下來。接入其他大模型,那我們也拿不到原始碼和資料集。」
中科深智的業務範圍,除了虛擬直播、數位員工等,也有金融、醫療、政企等企業的B端私有化部署業務。本公司的虛擬人即時互動和應答系統「雲小七」、元宇宙電商和虛擬人直播工具「百寶箱自動播&虛擬助播」、AI快速動畫生成系統「自動畫」等都已上線。
目前中科深智「自動播」的客戶佔據了天貓、淘寶、京東等平台使用AI虛擬人的中腰部品牌商家中70%以上的份額。他們近期推出了一款虛擬助理的產品,可以實現真人和虛擬人同時出鏡。
「打造虛擬人端到端的工作是我們的目標。使用者輸入文字後,可以直接自動建模成3D人物,即時產生動作表情,形成內容輸出。」成維忠指出,公司要為企業提供全鏈路的解決方案。
邁吉客科技給自己的一個標籤是“跨模態”,該公司專注於智慧數位資產和智慧生成領域,主要產品是智慧內容生產、智慧虛擬直播、千人千面的個人化智能互動,以及最近在中關村論壇上發布的新品-數智空間站,三維、實時、智能是其亮點優勢。
早在2016年,邁吉客科技就開始進入AIGC領域,創辦人兼董事長伏英娜說。
「我們沒有採用人工標定資料語料,而是基於非結構化技術建構資料。例如,我們可以把企業內不同的資料文件分層處理,為企業建立跨模態搜尋引擎,讓企業資料智能生成內容,輕鬆實現互動。」
為企業做私有化部署的公司很多,但中小企業做大模型很困難,伏英娜認為其護城河在於基於開源大模型做組合創新“,其實,算法和模型在應用上可以並聯、串聯組合。邁吉客科技的底層技術是分層演算法,這樣的演算法組合算力要求低,可以成本低、效率高的構建,基於小樣本資料進行資源量迭代,最終形成可以進化的智能。」
虛擬人直播主要分為娛樂、遊播、電商直播三種。雲舶的梅嵩認為,「從價值來看,虛擬人更適合前兩種。帶貨場景最核心的是貨品,只要東西便宜,肯定有人買,東西貴了,誰都不好賣,虛擬直播解決不了貨的問題。」
「虛擬人直播能改善真人直播時,無法和粉絲即時互動的特點。粉絲可以隨時給虛擬主播打賞換裝,虛擬直播內容更加具有互動性和豐富性。」梅嵩說,「高品質的直播內容肯定需要真人參與。」
打開B站,隨處可以看到小K直播姬的「自來水」用戶。梅嵩透露,小K直播姬在3D虛擬主播領域市場保有率達 90%,全網服務的主播超40萬,日活超過5000主播開播。在所有動捕直播工具當中,完全C端免費的就小K一支「獨苗」。
「我不指望靠小K直播姬的產品收費,未來我希望能透過這款產品,吸引更多的主播使用,這些人自帶粉絲有流量。後期,我可以利用空間場景做互動遊戲,進行內容流量變現,類似遊戲的聯運模式。」
梅嵩認為,虛擬直播互動會分成三個階段。 1. 0時代是日常的真人直播,打賞禮物,播放特效,有彈幕。 2.0粉絲可以透過彈幕禮物影響直播間虛擬內容或創造角色等,但粉絲沒有操控性。 3.0就是元宇宙空間,粉絲和主播可以自由直播互動,粉絲有虛擬搖桿擁有完全的自主控制,例如開演唱會、玩PK等。今年下半年,雲舶會推出類似“元宇宙”的“小K太空站”,落地直播互動的第三代場景。
邁吉客科技的伏英娜認為,不同平台對虛擬人直播的政策不同。 「抖音不會鼓勵,但B站很可能會鼓勵,畢竟用戶不同。未來平台可以單獨出虛擬人直播專區,畢竟有受眾在。」
另一方面,「長遠看來,虛擬人替代真人是在薅平台羊毛,侵犯平台利益,未來一定會被封殺掉。」中科深智的成維忠說,之前的數位人帶貨直播爆火,是因為抖音要扶持本地生活的表現。
「未來的虛擬人直播帶貨,一定是跟平台間處於多贏的狀態。虛擬人技術供應商應該想清楚平台、使用者、商家需要什麼。虛擬主播應該具備真人沒有的推理、分析能力等等,例如可以即時分析判斷彈幕氛圍是否正面,這才是人工智慧的價值。」
說到大模型,成維忠表示:「訓練深層AI需要大量語料,這都是OpenAI們的存量應用場景。更重要的是,深層AI技術什麼時候能突破閾值,也能有新的應用場景。同理,我們正在打造的大模型也在謀求在虛擬人方面的閾值突破,預計一年後能在虛擬人的場景交互上取得進展。」
除了ChatGPT浪潮,成維忠也一直關注蘋果眼鏡。 「蘋果的AR眼鏡能否走的長遠,除了看技術上能不能融合AR和VR,更重要的是商業模式上,能否和開發者分錢,這樣才能吸引開發者入場,共創生態。 ”
「隨著AR 眼鏡的發展,內容表現方式也會改變,這也會為做3D內容生成與虛擬人的公司帶來更大的機會,是屬於創業者的好機會。」
談到蘋果眼鏡,梅嵩認為VR和元宇宙最好的落地場景前期都在遊戲中。 「為什麼 VR 的滲透率、用戶數沒有起來,核心原因是沒有基於VR的好內容。」
雲舶投入了三千萬元來打造小K直播姬中的3D資產,「一方面是成本,另一方面我們有小K視訊引擎等自研的技術做了6年,這才形成了我們自己的護城河。」
「下半年,我們會啟動AIGC多模態轉換的產品開發,例如AI音樂、AI語音;小K直播姬會推出單攝全身動捕版本;也會產品融入遊戲動畫製作流程中,幫助使用者產生可使用的動畫資料;此外,也會推出小K繪圖的電商版、遊戲版。」
這些規劃當然也需要大模型的支持,因此雲舶接下來也會採用大量資料來訓練模型,公司已經擁有數十人的標註團隊。
伏英娜也用升級換代的說法來形容AR/VR普及後的情景。 「第一代互聯網,是每個企業都有自己的網站。第二代互聯網是每個企業都有APP。第三代互聯網將是四維時空的體驗,會升級到3D內容智能生成,把時間和空間折疊,實現即時智慧互動。3D內容可以用H5的方式輕量化輸出,而且可以同時出現在網頁、客戶端等任何地方即時互動。」
邁吉客科技最新打造的“數智空間站”,為企業在虛擬空間建立“數位名片”,能立體化、視覺化、智能化呈現,超越現實物理時空局限,給用戶提供一對一、千人千面的個人化智能服務。這種內容運作可以透過私有化部署或SaaS來實現。這是建構新一代內容生產力和沈浸式體驗的關鍵,也是數位經濟時代重要的工具及平台。
AIGC技術在不斷革新產業認知的同時,也為虛擬人科技帶來一場革命。對虛擬人技術從業人員來說,由ChatGPT引發的AI熱潮,加上AR/VR的新熱點,產生了雙倍的興奮。
當看到的新鮮事太多,想做的事情也太多的時候,如何使用AI幫忙生成無窮無盡的內容消費品,打開通往新世界的大門,恐怕是技術提供商和B端客戶們需要共同解決的問題。
以上是蘋果頭顯降臨,AI虛擬人的救星還是流星?的詳細內容。更多資訊請關注PHP中文網其他相關文章!