作者/劉曉潔
(資料圖片僅供參考)
2022世界人工智能大會(WAIC 2022) 在9月1日正式開幕,此次大會中元宇宙是一大展出亮點,作為最快落地場景的虛擬數(shù)字人也頻繁在大會出鏡互動。
“我們不應(yīng)該把元宇宙看成一個空間概念,而應(yīng)該看成一個時間概念,即當(dāng)人們在虛擬世界里花的時間越來越多,直到超過現(xiàn)實世界時,才可以說我們進入了元宇宙時代。”在9月1日晚的“滴水湖AI夜話——AI+元宇宙”論壇上,unity中國總裁兼首席執(zhí)行官張俊波從生產(chǎn)效率和實時交互上為我們提供了一個技術(shù)人的觀察視角,及其對未來的判斷和思考。
元宇宙仍然遙遠
“我在互聯(lián)網(wǎng)及軟件行業(yè)有20多年的從業(yè)經(jīng)驗,這些年科技進步可以說是飛速的,非常令人驚訝,但是一看生產(chǎn)流程,又覺得我們才剛剛起步,還處于工業(yè)革命之前,技術(shù)剛剛萌發(fā)卻沒有實現(xiàn)大批量規(guī)模化生產(chǎn)的階段,生產(chǎn)效率比較低下?!?/p>
以近幾年非常火爆的虛擬數(shù)字人為例,張俊波認為,雖然很多制作數(shù)字人的公司用的是元宇宙的概念,但是其本質(zhì)上卻是圖形渲染公司,“比如一個虛擬偶像類的數(shù)字人,其背后是動畫師們在一幀一幀的精修渲染,或者是依賴于對中之人的動作捕捉,不僅成本非常高,且制作流程十分耗時?!?/p>
現(xiàn)在市場上也有可以批量生產(chǎn)的數(shù)字人,但張俊波表示這些虛擬形象同質(zhì)化嚴重,不能充分表達用戶的個性化需求。這不僅是國內(nèi)的現(xiàn)狀,整個國際市場都是如此?;诋?dāng)前技術(shù)和成本的限制,擁有雄厚資本與能力的企業(yè)尚且不能做到規(guī)?;a(chǎn),更不用談讓廣大消費者來參與。
元宇宙離我們還有距離,因為張俊波認為元宇宙是一個3D版本的互聯(lián)網(wǎng),其特征為始終實時3D,高度交互、高度社交和持續(xù)穩(wěn)定。
從這個定義來看,現(xiàn)在很多元宇宙概念產(chǎn)品不能被稱之為真正意義上的元宇宙。如提前錄制的虛擬演唱會、云游戲等,要么靜態(tài)展示無法互動,即使互動也是由設(shè)定好的程序按部就班去執(zhí)行,無法對設(shè)定程序以外的行為做出反應(yīng),無法滿足實時性與交互性特點。
這需要元宇宙世界有足夠豐富有趣的內(nèi)容,給人以比現(xiàn)實世界更多元的體驗,才能讓人們更愿意在虛擬世界中花時間。但要實現(xiàn)這一點需要海量的內(nèi)容,海量的虛擬人、場景、資產(chǎn)等素材。
AI加速元宇宙的到來
目前相對傳統(tǒng)的生產(chǎn)方式無法滿足元宇宙時代海量的內(nèi)容需求,基于此,張俊波認為,能夠指數(shù)級降低數(shù)字資產(chǎn)制作成本的AI技術(shù),是實現(xiàn)元宇宙必不可少的先決條件。
“賦予工具智慧,將工具訓(xùn)練成技術(shù)人員大腦的延伸,用AI打造數(shù)字資產(chǎn)制作的流水線,才能夠大規(guī)模生產(chǎn)高質(zhì)量的虛擬內(nèi)容,帶動整個行業(yè)加速發(fā)展?!?/p>
元宇宙有三個不可或缺的基本要素,人、場、物,這些數(shù)字資產(chǎn)共同構(gòu)建了元宇宙世界,影響著人們在元宇宙世界中的體驗,unity在這三個領(lǐng)域的探索指引了一些AI技術(shù)可以應(yīng)用的方向。
當(dāng)下元宇宙最熱門的方向是虛擬數(shù)字人,張俊波表示,在這個領(lǐng)域當(dāng)前很多公司采用的流程是,讓模特在光場設(shè)備中做出極限表情并拍攝下來,而后讓藝術(shù)家進行模型清理,這個步驟耗時耗力。
人的表情是由面部肌肉牽動的,只要掌握了面部肌肉間的相互的作用和關(guān)系,就可以借助AI技術(shù)模擬出人類的所有表情,而不需要找真人一一來掃描。張俊波展示了一段由加拿大虛擬角色軟件開發(fā)商Ziva Dynamics制作的數(shù)字人的視頻,其神態(tài)和形象已經(jīng)可以媲美真人。
在今年初,Ziva Dynamics被unity收購,張俊波介紹,Ziva Dynamics精通復(fù)雜模擬與模型變形、機器學(xué)習(xí)與實時角色創(chuàng)作,同時團隊對復(fù)雜的解剖學(xué)模擬與實時藝術(shù)工具有著深厚的專業(yè)知識和理解。
基于Ziva Dynamics的技術(shù),原本要耗費數(shù)周甚至數(shù)月的角色臉部創(chuàng)作時間,濃縮成云端的一次點擊。藝術(shù)家的創(chuàng)作周期從十幾天縮短到短短的兩個小時。AI技術(shù)簡化數(shù)字人制作流程,從而可以讓規(guī)?;臄?shù)字人生產(chǎn)變成可能。
除了虛擬數(shù)字人之外,場景也是元宇宙的重要部分,在這方面,AIGC將發(fā)揮重要作用。
未來的元宇宙會是一個開放大世界,現(xiàn)在創(chuàng)作數(shù)千甚至數(shù)萬平方公里的虛擬世界,已無法用純?nèi)斯さ姆绞絹頂[放和設(shè)計每一寸土地,程序化和規(guī)則化的生存世界,成為開放大世界的一個關(guān)鍵技術(shù)。
在元宇宙的物體方面,逐一建模復(fù)刻效率同樣低下,通過可視化的方式與3D掃描,可以把現(xiàn)實世界中的對象進行3D重建。用戶只需用手機拍攝一分鐘的視頻,然后將其上傳至云端,視頻就會在AI技術(shù)的輔助下進行處理與壓縮,從而成為高質(zhì)量的3D模型。在未來這項技術(shù)可以成為用戶在元宇宙中的好幫手,比如把生活中的擺件、書籍等物品掃描成3D模型。
在解決了人、物、景的問題后,交互性、社交屬性同樣是不可忽視的基本特征,因為元宇宙并不僅僅是一個靜態(tài)的畫面。這要求元宇宙世界里的數(shù)字人能夠與用戶對話,給出實時的反應(yīng)和反饋,不僅僅要有精美靈動的外表,還需要有近乎于人的智能甚至靈魂。
華院計算虛擬數(shù)字人產(chǎn)品總監(jiān)馮絢博士持有同樣觀點,此前在接受第一財經(jīng)采訪時,她表示,在成本、終端等制約因素外,長遠看更重要的或許是如何賦予虛擬數(shù)字人一個有趣的靈魂,包括它的知識、智慧、個性以及情感。
在這一方面,已經(jīng)涉及到很多人工智能前沿領(lǐng)域,例如如何在與人的交互當(dāng)中理解人的感情,和人產(chǎn)生共情,如何產(chǎn)生感情的回應(yīng)。馮絢認為這是最引人入勝的一部分,也是未來帶來更大想象空間的一部分。
在這之后,人工智能結(jié)合虛擬數(shù)字人可用的場景和可發(fā)揮的價值,會有飛躍式的拓展。
關(guān)鍵詞: