用一篇文章,幫你了解什么是虛擬數(shù)字人?

2021-12-28    seo達(dá)人



1.數(shù)字人的三方面特征

虛擬數(shù)字人是指具有數(shù)字化外形的虛擬人物。與具備實(shí)體的機(jī)器人不同,虛擬數(shù)字人依賴顯示設(shè)備存在,我們所知的很多虛擬人都要通過(guò)手機(jī)、電腦或者智慧大屏等設(shè)備才能顯示。

圖片

虛擬數(shù)字人宜具備以下三方面特征:

  • 一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;
  • 二是擁有人的行為,具有用語(yǔ)言、面部表情和肢體動(dòng)作表達(dá)的能力;
  • 三是擁有人的思想,具有識(shí)別外界環(huán)境、并能與人交流互動(dòng)的能力。

綜合來(lái)看,就是具備四方面的能力,即形象能力、感知能力、表達(dá)能力和娛樂(lè)互動(dòng)能力。

如果我們下次再看到有公司推出數(shù)字人,就可以結(jié)合這些特征和能力來(lái)判斷這個(gè)數(shù)字人的可信度,避免被借勢(shì)營(yíng)銷的企業(yè)鉆了空子。

 

2.數(shù)字人的運(yùn)作原理

知道了什么是數(shù)字人,接下來(lái)就要搞清楚數(shù)字人到底是怎么說(shuō)話、互動(dòng)的,是背后有真人在操控,還是完全通過(guò)技術(shù)生成。

面對(duì)新興的數(shù)字人,相信很多讀者都存在類似的疑問(wèn)。

數(shù)字人的誕生發(fā)展和AI人工智能可以說(shuō)是密不可分,想了解數(shù)字人的運(yùn)作原理,首先要知道數(shù)字人的通用系統(tǒng)框架

虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語(yǔ)音生成、動(dòng)畫生成、音視頻合成顯示、交互等5個(gè)模塊構(gòu)成。(資料參考: 2020年虛擬數(shù)字人發(fā)展白皮書)

圖片

交互模塊為擴(kuò)展項(xiàng),根據(jù)其有無(wú),可將數(shù)字人分為交互型數(shù)字人和非交互型數(shù)字人。

首先看一下非交互型數(shù)字人:系統(tǒng)依據(jù)目標(biāo)文本生成對(duì)應(yīng)的人物語(yǔ)音及動(dòng)畫,并合成音視頻呈現(xiàn)給用戶。

圖片

交互型數(shù)字人根據(jù)驅(qū)動(dòng)方式的不同可分為智能驅(qū)動(dòng)型和真人驅(qū)動(dòng)型。

圖片

 智能驅(qū)動(dòng)型數(shù)字人:通過(guò)智能系統(tǒng)自動(dòng)讀取并解析識(shí)別外界輸入信息,根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,驅(qū)動(dòng)人物模型生成相應(yīng)的語(yǔ)音與動(dòng)作來(lái)使數(shù)字人跟用戶互動(dòng)。

這種人物模型是預(yù)先通過(guò)AI技術(shù)訓(xùn)練得到,可通過(guò)文本驅(qū)動(dòng)生成語(yǔ)音和對(duì)應(yīng)動(dòng)畫,業(yè)內(nèi)將此模型稱為TTSA(Text To Speech & Animation)人物模型

 

圖片

 真人驅(qū)動(dòng)型數(shù)字人:真人根據(jù)視頻監(jiān)控系統(tǒng)傳來(lái)的用戶視頻,與用戶實(shí)時(shí)語(yǔ)音,同時(shí)通過(guò)動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而與用戶進(jìn)行交互。

 

3.數(shù)字人常見(jiàn)的類型

調(diào)研分析當(dāng)前市場(chǎng)上的數(shù)字人,根據(jù)人物圖形維度,分為2D和3D兩大類,從外形上可分為卡通、寫實(shí)等風(fēng)格,綜合來(lái)看可分為二次元、3D卡通、3D高寫實(shí)、真人形象四種類型。

圖片

接下來(lái)根據(jù)每種類型的特點(diǎn),從外在形象、服飾裝扮、表情動(dòng)作等方面,結(jié)合典型案例來(lái)逐一分析虛擬數(shù)字人的設(shè)計(jì)。

 

二次元類型

虛擬歌手-洛天依

圖片

洛天依的職業(yè)設(shè)定為虛擬歌姬,個(gè)性軟萌可愛(ài)、溫柔細(xì)膩,外貌特征上是灰發(fā)、綠瞳,頭戴碧玉發(fā)飾。

圖片

 除了獨(dú)特的形象和性格,洛天依還能唱歌、跳舞、直播帶貨,多樣的才藝加持讓人物設(shè)定不單薄,受到很多用戶的關(guān)注。

 

3D卡通類型

虛擬助理-度曉曉

度曉曉是基于虛擬人IP的陪伴型虛擬助理。在小度助手的能力基礎(chǔ)上,度曉曉有虛擬人物形象和情感交互系統(tǒng),具備視覺(jué)識(shí)別能力,支持自然的交流方式。

圖片

 在外形裝扮上,度曉曉是紅色短發(fā)的甜美可愛(ài)風(fēng),五官比例偏向二次元風(fēng)格。根據(jù)現(xiàn)有案例來(lái)看,度曉曉在眨眼、微笑等面部微動(dòng)作以及肢體的造型,都很自然、生動(dòng),整體設(shè)計(jì)效果相對(duì)較好。

 

圖片

 度曉曉定期更新身穿不同主題服裝、擺著各種pose的形象,每套服裝都有一個(gè)主題再帶配上各種周邊小配飾,營(yíng)造出一種清新時(shí)尚的效果。

 

3D高寫實(shí)類型

浦發(fā)銀行數(shù)字員工-小浦

小浦作為銀行的數(shù)字員工,主要進(jìn)行風(fēng)險(xiǎn)評(píng)估、要聞播報(bào)、投資建議等在線服務(wù)。

圖片

▲ 從外觀上,小浦在形象上無(wú)論發(fā)型還是五官都足夠擬人化、職業(yè)化,穿著銀行職業(yè)裝,屬于比較典型的銀行職員形象。

 

圖片

▲ 小浦沒(méi)有很夸張的面部表情,始終以面帶微笑的狀態(tài)面向用戶,給人一種親切感。肢體動(dòng)作相對(duì)較少,沒(méi)有特別夸張的動(dòng)作設(shè)定,只有固定的幾套動(dòng)作。

 

虛擬偶像-AYAYI

AYAYI是使用Unreal引擎造出來(lái)的特別擬真的Metahuman形象。

圖片

▲ 外在形象:寫實(shí)程度更高,人物整體效果已經(jīng)和真人十分接近,五官特別精致、眼瞼微斂、銀色短發(fā),散發(fā)著一種清冷氣質(zhì)。

 

圖片

▲ 從AYAYI社交賬號(hào)的更新來(lái)看,目前主要是分享一些AYAYI的擺拍圖片,穿著的服裝、飾品都比較真實(shí)、時(shí)尚,拍照環(huán)境都是休閑、藝術(shù)類的場(chǎng)景。

 

圖片

▲ AYAYI人物形象的時(shí)尚感和真實(shí)感,更容易切入商業(yè)化,比如穿著特定品牌的服裝進(jìn)行擺拍。

 

高保真數(shù)字人-Siren(塞壬)

圖片

Siren是高保真、實(shí)時(shí)、可交互數(shù)字人,用到了實(shí)時(shí)渲染、表情捕捉、動(dòng)作捕捉、高保真3D掃描等前沿技術(shù),達(dá)到了目前業(yè)界最高的技術(shù)水平。

圖片

▲ Siren的面貌細(xì)節(jié)更加真實(shí),可以很清楚看到皮膚的細(xì)節(jié)、眼睛的轉(zhuǎn)動(dòng)說(shuō)話的神態(tài)、臉上各種各樣的細(xì)紋。不管是毛孔、細(xì)紋等皮膚質(zhì)感,還是神態(tài)上的表情,都很像真人。

 

圖片

▲ Siren在說(shuō)話時(shí)嘴唇動(dòng)作自然,效果真實(shí)。

之所以有的數(shù)字人看起來(lái)不自然,很大一部分原因是因?yàn)?strong>數(shù)字人面部表情不生動(dòng),特別是在說(shuō)話時(shí)嘴唇和臉部、牙齒甚至舌頭的聯(lián)動(dòng),很容易出現(xiàn)動(dòng)作不聯(lián)動(dòng)、不真實(shí)的情況。

 

真人形象類型

新華社AI合成主播-新小浩

圖片

“新小浩”是無(wú)論外在形象、面部表情、服裝搭配、說(shuō)話聲音,還是肢體動(dòng)作上,都是完全基于真實(shí)主持人生成。

圖片

通過(guò)語(yǔ)音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報(bào)能力的“AI 合成主播”。

圖片

▲ 我們每天都會(huì)遇見(jiàn)各種各樣的人,即使臉上最細(xì)微的表情,我們都可以感知到,用計(jì)算機(jī)打造出來(lái)的表情,往往缺乏靈氣。

真人形象的虛擬主播的優(yōu)勢(shì)在于,他的特征都是來(lái)源于真人,呈現(xiàn)的面貌和狀態(tài)更容易被用戶了解。如果不仔細(xì)看,可能分辨不出是不是真人。

 

4.數(shù)字人的應(yīng)用場(chǎng)景

目前國(guó)內(nèi)市場(chǎng)上已經(jīng)出現(xiàn)了非常多的虛擬數(shù)字人,在各行各業(yè)中有著廣泛的應(yīng)用。

虛擬數(shù)字人技術(shù)結(jié)合實(shí)際應(yīng)用場(chǎng)景領(lǐng)域,切入各類,形成行業(yè)應(yīng)用解決方案,賦能影視、傳媒、游戲、金融、文旅等領(lǐng)域,根據(jù)需求為用戶提供定制化服務(wù)

圖片

按照應(yīng)用場(chǎng)景或行業(yè)的不同,已經(jīng)出現(xiàn)了娛樂(lè)型數(shù)字人,如虛擬偶像、歌手、網(wǎng)紅、虛擬代言人等;

圖片

助手型數(shù)字人,如虛擬客服、虛擬導(dǎo)游、智能助手。

圖片

主播型數(shù)字人,如虛擬主播、虛擬支持人等。

圖片

這里搜集的案例只是虛擬數(shù)字人的應(yīng)用的一小部分,還有很多優(yōu)秀的應(yīng)用案例等待著大家去一起發(fā)現(xiàn)。

 

5.代表性的研發(fā)平臺(tái)

國(guó)內(nèi)有很多互聯(lián)網(wǎng)平臺(tái)在研發(fā)虛擬數(shù)字人,我也從中收獲了大量的信息和資料,這次把這些平臺(tái)分享給大家:

  • 搜狗AI開(kāi)放平臺(tái)
  • 網(wǎng)易伏羲、網(wǎng)易易現(xiàn)
  • 百度AI開(kāi)放平臺(tái)
  • 騰訊云、騰訊NEXT Studios
  • 訊飛開(kāi)放平臺(tái)…

 

設(shè)計(jì)夾把這些網(wǎng)站進(jìn)行了匯總,如果大家想了解更多關(guān)于AI人工智能、數(shù)字人和最新科技的發(fā)展,可以去公眾號(hào)后臺(tái)獲取網(wǎng)站鏈接~

領(lǐng)取方式:關(guān)注公眾號(hào),后臺(tái)回復(fù)【數(shù)字人】領(lǐng)取虛擬數(shù)字人網(wǎng)址鏈接匯總

圖片

慢慢來(lái)比較快,希望對(duì)你有所幫助!

 

原文地址:Clip設(shè)計(jì)夾(公眾號(hào))

作者:Clippp

轉(zhuǎn)載請(qǐng)注明:學(xué)UI網(wǎng)》用一篇文章,幫你了解什么是虛擬數(shù)字人?

藍(lán)藍(lán)設(shè)計(jì)建立了UI設(shè)計(jì)分享群,每天會(huì)分享國(guó)內(nèi)外的一些優(yōu)秀設(shè)計(jì),如果有興趣的話,可以進(jìn)入一起成長(zhǎng)學(xué)習(xí),請(qǐng)掃碼藍(lán)小助,報(bào)下信息,藍(lán)小助會(huì)請(qǐng)您入群。歡迎您加入噢~~希望得到建議咨詢、商務(wù)合作,也請(qǐng)與我們聯(lián)系。

截屏2021-05-13 上午11.41.03.png

分享此文一切功德,皆悉回向給文章原作者及眾讀者.
免責(zé)聲明:藍(lán)藍(lán)設(shè)計(jì)尊重原作者,文章的版權(quán)歸原作者。如涉及版權(quán)問(wèn)題,請(qǐng)及時(shí)與我們?nèi)〉寐?lián)系,我們立即更正或刪除。

藍(lán)藍(lán)設(shè)計(jì)sillybuy.com )是一家專注而深入的界面設(shè)計(jì)公司,為期望卓越的國(guó)內(nèi)外企業(yè)提供卓越的UI界面設(shè)計(jì)、BS界面設(shè)計(jì) 、 cs界面設(shè)計(jì) 、 ipad界面設(shè)計(jì) 、 包裝設(shè)計(jì) 、 圖標(biāo)定制 、 用戶體驗(yàn) 、交互設(shè)計(jì)、 網(wǎng)站建設(shè) 、平面設(shè)計(jì)服務(wù)


分享本文至:

日歷

鏈接

個(gè)人資料

存檔