電子發燒友網報道(文(wen)/李(li)彎彎)近年來,越來越多的(de)數字人出現(現)在各大電商(shang)平臺的直播(bo)間,他們超寫真的形象不僅讓觀(觀)眾很有代入(ru)感,而且這些(xie)主播還能24小(xiao)時直播帶貨、幫助客戶解答(da)疑問等。據統(統)計,目(mu)前我(wo)國各大網(網)絡平臺上有(you)超過5000萬個虛擬數字人的(de)主播賬號,相(xiang)關的市場規模已經達到(dao)一百余億元,周邊市(shi)場更是超過(過)了千億元的(de)量級。
然而隨(隨)著市場規模(mo)的不斷發展(zhan)擴大,相關的(de)糾紛也隨之而來。全國首例涉“虛擬數字人”侵(qin)權案近日二審宣(xuan)判引發社會關注。業界人(ren)士認為,虛擬(擬)數字人作為新興業(業)態,首例虛擬(擬)數字人侵權案的判決對我們虛擬數字人產業的(de)后續發展有(you)很好的規范(fan)意義。
虛擬數字人發展(zhan)過程中面臨(臨)的挑戰
數字(zi)人技術作為一種前沿的(de)
人工智能應用,通過人物(wu)形象
模(mo)擬、聲音克隆(long)、語言處理等(deng)先進技術創造出高度逼(bi)真的數字人(ren)形象。有效的(de)為企業提供(gong)更高效、便捷和個性(xing)化的客戶服(fu)務,助力企業降(jiang)本增效、推動產業數智化(hua)發展。
調研機(機)構數據顯示(shi),2023年中國企業使用數字人首要目(mu)的是提升工(gong)作效率、質量(liang),占比為57.6%,其次(ci)是提升企業(業)數字化程度(du)(47.6%)和(he)提(ti)升企業形象(xiang)(40.9%)。目前(qian),虛擬數字人(ren)在影音娛樂、電商帶貨、虛擬(擬)社交等行業(業)領域廣泛應用。
上海魔琺(琺)
公司成立于2018年初,公(gong)司全棧自研(yan)了
智能化
工(gong)業化虛擬內容制作核心(xin)技術、虛擬直播核心技術(術)及
AI虛擬人核(he)心技術(術)。2019年10月,該公司(si)通過公開活(huo)動發布了數字人
Ada并于同(tong)年10月、11月通過(過)某
網絡平臺發布(bu)了兩段
視頻(頻)。2022年7月,杭(hang)州某網絡公(gong)司未經授權發布了兩段(duan)含有Ada的(de)視頻畫面。
上海魔(mo)琺公司認為,杭州某網絡(絡)公司在(zai)未經授權的(de)情況下傳播(bo)使用該虛擬(擬)數字人,侵害(hai)了他們的美(mei)術作品、視聽作品的
信息網(網)絡傳播權,以及侵(qin)害了錄像制作者(zhe)及錄像制品(pin)中表演者的(de)信息網絡傳播權。因此將杭州某網絡(絡)公司起訴至杭州互(hu)聯網法院。
上(shang)海魔琺公司(si)表示,超寫實虛擬數字人(ren)Ada的制作需要(yao)應用人工智(zhi)能表演動畫技術、超寫實角色智能(neng)建模與綁定(ding)技術等,是他(ta)們投入大量(liang)時間和精力(li)產生的作品(pin),理應受到法(fa)律保護(護)。而杭州某網(網)絡公司則認(認)為,虛擬數字(zi)人形象不屬于美術作品(pin),原告不享有(you)相關作品著(zhu)作權。
杭(hang)州互聯網法(fa)院(yuan)案件審判長(長)官家輝認為,虛擬數字人(ren)的形象是有(you)一定的美感(gan)的,它是開發者用虛擬美化的手(shou)法,利用線條(條)色彩對形象(xiang)設計的獨創性的表達,因(yin)此它構成美(mei)術作品,另外(wai)承載這個虛擬數字(zi)人形象的視頻,它是構成視聽作品和錄像制品的。當然這個相關(關)的權利,也就(jiu)是包括一些財產性的權利(li)和錄像制作者權是(shi)歸屬于原告(gao)。
近幾年雖然(ran)虛擬數字人(ren)迅速發展,然(ran)而仍然存在很多問題值得關注(zhu),除了上述提(ti)到的,著作權糾紛問題外,在(zai)技術、應用、隱私安全各方(fang)面都還有待優化。如(ru),技術成熟度(du)還不足,同時(時)虛擬數字人(ren)的制作成本(ben)較高,需要投(tou)入大量的人(ren)力和物力資(資)源。
此外(wai),虛擬數字人(ren)技術也會涉(she)及到用戶的(de)個人信息和(he)隱私數據,如(ru)果(guo)數據保護措(cuo)施不到位,可(ke)能會導致用戶隱私(si)泄露和安全(quan)問題;還有一(yi)個就是數字(zi)人目前的商(shang)業模式還有(you)待優化,從目(mu)前的情(qing)況來看,數字(zi)人應用多集(ji)中在直播場所中,競爭激烈,創新不(bu)夠。總體而言,虛擬(擬)數字人還面臨(臨)很多問題,接下來還需要不斷加(jia)強技術研發(發)、應用探索。
虛擬數字人的(de)核心技術和(he)發展趨勢
虛擬數字人的制作流(liu)程涵蓋了諸(諸)多技術,包括(gua)建模設計技(ji)術、動捕驅動技術和實時(時)渲染技術。這(這)些技術仍在(zai)逐步進化(hua)中,存在某些(xie)步驟互相融(rong)合的趨勢。
首先是建(jian)模,明確形象設計方(fang)向,根據平面(mian)形象和三視圖,進行(xing)模型搭建。人(ren)物建模的主(zhu)流技術仍為靜態掃描,但(dan)具有高視覺(覺)保真度的動態光場三維(維)重建技(ji)術成為未來重點發展方向(xiang)。
接著,通過捕捉技術采集(ji)真人演員的(de)動作和面部(bu)表情數據,之(zhi)后將這(這)些數據遷移(yi)合成到虛擬(擬)數字人身上(shang)。動作捕捉方(fang)案是目前3D數字人動作生(sheng)成的核心技(ji)術,最高(gao)可實現毫米(mi)級誤差。
將場景(jing)、人(ren)物、角色(se)、特(te)效以及配音(yin)進行后期合(he)成,最后渲染(ran)成片。PBR渲染技(ji)術的進步以及重光(guang)照等新型渲(xuan)染技術的出(chu)現使虛擬數字人皮膚紋(紋)理變得真實,突(tu)破(po)恐怖谷效應。
不(bu)少案例顯示,隨(隨)著人工智能(neng)、
語(語)音識別、圖像(xiang)識別等技術的(de)不斷發展,虛擬數字人的(de)交互能力和形象逼(bi)真度正在不(bu)斷提高。尤其(qi)是2023年來,大語(語)言模型席卷(juan)全球,業界積(積)極探索將大(da)模型與數字(zi)人技術(術)相結合,接入(ru)大模型的數字人很好改(gai)善了之前數字人存在的(de)表情僵硬、語言(yan)呆板、交互能(neng)力不強等問題。
大語(語)言模型接入(ru)虛擬數字人(ren)的技術原理(li)主要是自然(ran)語言處理技(ji)術。自然語言(yan)處理技(ji)術是用來理(li)解和處理人(ren)類語言的技(ji)術,包括語音(yin)識別、文本分析、語言生(sheng)成等(deng)。通過自然語(語)言(yan)處理技(ji)術,虛擬數字(zi)人可以識別(別)用戶的語言(yan)輸入,并將其(qi)轉換為計算(suan)機可以理解(jie)的形式。
如,基于360自研大模型“智腦(腦)”構建的360 AI數字(zi)人具有記憶、有(you)人(ren)設和性格,能夠復刻思(si)維方式和人(ren)生經歷,可生(sheng)成內容并與人類實時(時)智能互動。此(ci)前在某人工(gong)智能展會上(shang),有工作人員(員)告訴電子發(發)燒友網,之前(qian)數字人直播基本難(難)以做到現場互動,而通過(過)接通大模型(xing)后,數字人就(jiu)能夠實時回(hui)答現場用戶提出的部分(fen)問題,實現更好的交(jiao)互效果。
而且,大(da)模型與數字(zi)人的結合在(zai)邊緣側也開(開)始有落地案(an)例,近日電子發燒友(you)采訪到某AI邊緣計算機
廠(廠)商,他們已經為一家醫院(yuan)部署了邊緣側的大模型(xing)結合數字人(ren)的方案(an),這樣的數字(zi)人基本能回(hui)答患者提出(chu)的問題,并生成電子(zi)病歷(歷),提交(jiao)給醫生,大(da)大提高就診效(xiao)率。
寫在(zai)最后
如今數字人在人們生活中的應用已經非常(chang)普遍,而(er)且隨著技術的更(geng)加成熟,虛擬(擬)數字人的能力越來越強,尤其是(shi)近年來備受(shou)關注的大語(語)言模型,也逐(zhu)漸(漸)與數字人進(進)行很好的結(結)合,數字人也更能像(xiang)真人一樣進(進)行互動,未來它的應用也(ye)將會更加普(pu)遍。不過,同時數字人的發(發)展也面臨諸(諸)多問題(題),比如文章提(ti)到的侵權、隱(隱)私等問題,這(這)些都需要逐(zhu)步去進行規范。
評論