TTAF 203-2024 面向3D身份型虛擬數(shù)字人技術(shù)要求和測試方法_第1頁
TTAF 203-2024 面向3D身份型虛擬數(shù)字人技術(shù)要求和測試方法_第2頁
TTAF 203-2024 面向3D身份型虛擬數(shù)字人技術(shù)要求和測試方法_第3頁
TTAF 203-2024 面向3D身份型虛擬數(shù)字人技術(shù)要求和測試方法_第4頁
TTAF 203-2024 面向3D身份型虛擬數(shù)字人技術(shù)要求和測試方法_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ICS33.160

CCSM61

團(tuán)體標(biāo)準(zhǔn)

T/TAF203—2024

面向3D身份型虛擬數(shù)字人技術(shù)要求和測試

方法

Technicalrequirementsandtestmethodsofdigitalhumanfor3D

identitytypeoriented

2024-02-23發(fā)布2024-02-23實(shí)施

電信終端產(chǎn)業(yè)協(xié)會(huì)發(fā)布

T/TAF203—2024

面向3D身份型虛擬數(shù)字人技術(shù)要求和測試方法

1范圍

本文件規(guī)定了3D身份型虛擬數(shù)字人的技術(shù)要求和測試方法,主要描述了載體、整體設(shè)定、靜態(tài)形

象、動(dòng)態(tài)行為、語音能力、交互能力、易用性等方面技術(shù)要求的測試方法。

本文件適用于各種制式的3D身份型虛擬數(shù)字人。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文

件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適

用于本文件。

GB/T21024—2007中文語音合成系統(tǒng)通用技術(shù)規(guī)范

T/BAGIA0001—2019影視動(dòng)畫三維模型制作

3術(shù)語和定義

下列術(shù)語和定義適用于本文件。

3.1

虛擬數(shù)字人digitalhuman

簡稱數(shù)字人或虛擬人,是運(yùn)用數(shù)字技術(shù)創(chuàng)造出來的、與人類形象接近的數(shù)字化人物形象。

3.2

身份型虛擬數(shù)字人identitydigitalhuman

具有身份性的虛擬數(shù)字人,多以虛擬IP或偶像呈現(xiàn),能夠?yàn)槲磥淼奶摂M化世界提供人的核心交互

中介。

3.3

模型model

按照對(duì)象所需呈現(xiàn)的結(jié)構(gòu)或動(dòng)勢(shì)等,通過專用軟件完成對(duì)象每個(gè)表面拓?fù)浣Y(jié)構(gòu)的數(shù)學(xué)表示,從而

在虛擬三維空間中塑造出的物體。

[來源:T/BAGIA0001—2019]

3.4

韻律prosody

1

T/TAF203—2024

一般也稱為超音段特征,是將各種語言學(xué)單位組織成話語或話語中關(guān)聯(lián)組塊的系統(tǒng)組織。從物理

角度,指基頻、時(shí)長和強(qiáng)度等聲學(xué)參數(shù);從語言學(xué)的角度,指音段層次以上的音系組織。

[來源:GB/T21024—2007]

4縮略語

下列縮略語使用于本文件。

3D:三維(3-Dimensional)

3S貼圖:磁表面散射貼圖(Sub-SurfaceScattering)

AO貼圖:環(huán)境遮擋貼圖(AmbientOcclusion)

AR:增強(qiáng)現(xiàn)實(shí)技術(shù)(VirtualReality)

FPS:每秒傳輸幀數(shù)(FramesPerSecond)

LED:發(fā)光二極管(light-emittingdiode)

PX:像素(Pixel)

VR:虛擬現(xiàn)實(shí)技術(shù)(VirtualReality)

5技術(shù)要求

5.1載體要求

5.1.1基礎(chǔ)載體

基礎(chǔ)載體要求如下:

a)具備在手機(jī)、電視、投影、LED大屏等任意平臺(tái)中運(yùn)行;

b)具備在裸眼立體、VR、AR顯示等任意環(huán)境里直接展示運(yùn)行。

5.1.2兼容載體

兼容載體要求如下:

a)具備在相同類型的平臺(tái)中,多品牌、多型號(hào)設(shè)備載體上應(yīng)能正常運(yùn)行;

b)具備在相同類型的環(huán)境中,多品牌、多型號(hào)設(shè)備載體上應(yīng)能正常運(yùn)行。

5.2整體設(shè)定要求

5.2.1身份設(shè)定

身份設(shè)定要求如下:

a)人物姓名、性別、身高、體型屬性,應(yīng)與設(shè)計(jì)匹配;

b)人物特點(diǎn)、特長(技能)屬性,應(yīng)與設(shè)計(jì)匹配;

c)人物與現(xiàn)實(shí)世界定位,應(yīng)和設(shè)計(jì)匹配。

5.2.2外形設(shè)定

人物外形,應(yīng)和設(shè)計(jì)匹配。

5.2.3建模風(fēng)格

人物模型應(yīng)屬于卡通、擬人、寫實(shí)、超寫實(shí)四種風(fēng)格。

2

T/TAF203—2024

5.3靜態(tài)形象要求

5.3.1規(guī)范性

規(guī)范性要求如下:

a)人物不應(yīng)有破面問題;

b)人物不應(yīng)有嚴(yán)重穿插問題;

c)人物不應(yīng)有嚴(yán)重的變形問題;

d)人物不應(yīng)有材質(zhì)球渲染問題;

e)人物不應(yīng)有其他破損情況問題;

f)人物不應(yīng)有沒焊接的點(diǎn)問題;

g)人物不應(yīng)有陰影問題;

h)人物不應(yīng)有時(shí)裝穿模問題;

i)人物不應(yīng)有碰撞問題;

j)人物不應(yīng)有法線問題;

k)人物不應(yīng)有口型問題;

l)人物不應(yīng)有資源丟失問題;

m)人物不應(yīng)有骨骼異常問題。

5.3.2精細(xì)度

精細(xì)度要求如下:

a)人物面數(shù),不低于3000面;

b)人物貼圖數(shù)量,不低于4張;

c)人物貼圖分辨率,不低于1024px*1024px;

d)人物毛發(fā)貼圖精度,不低于2048px*2048px;

e)人物應(yīng)使用AO貼圖;

f)人物眼睛模型應(yīng)有顏色貼圖;

g)人物眼睛模型應(yīng)有粗糙貼圖;

h)人物皮膚應(yīng)有3S貼圖;

i)人物應(yīng)有眼球結(jié)構(gòu);

j)人物應(yīng)有眼球晶狀體結(jié)構(gòu);

k)人物應(yīng)有口腔內(nèi)部結(jié)構(gòu);

l)人物模型應(yīng)為可編輯多邊形;

m)人物骨骼應(yīng)是Biped骨骼;

n)人物骨骼點(diǎn)應(yīng)在模型骨骼關(guān)節(jié)處;

o)人物角色脖子骨骼應(yīng)帶有角度;

p)人物發(fā)型帽飾動(dòng)態(tài)骨骼數(shù)量應(yīng)為5根以上;

q)人物所有骨骼應(yīng)至少2Link以上的權(quán)重;

r)人物蒙皮后角色A-pose應(yīng)改為標(biāo)準(zhǔn)T-pose;

s)人物轉(zhuǎn)化為T-pose的角色蒙皮不應(yīng)出現(xiàn)錯(cuò)誤;

t)人物布線走向應(yīng)和骨骼方向垂直。

5.3.3可編輯性

可編輯性要求如下:

3

T/TAF203—2024

a)人物應(yīng)可調(diào)整臉型;

b)人物應(yīng)可調(diào)整五官;

c)人物應(yīng)可調(diào)整妝容;

d)人物應(yīng)可調(diào)整膚色;

e)人物應(yīng)可調(diào)整身高;

f)人物應(yīng)可調(diào)整體重;

g)人物應(yīng)可更換衣服;

h)人物應(yīng)可更換發(fā)型;

i)人物應(yīng)可更換裝飾品。

5.4動(dòng)態(tài)行為要求

5.4.1動(dòng)作契合度

嘴唇動(dòng)作

嘴唇動(dòng)作要求如下:

a)人物按字發(fā)音時(shí),嘴形和發(fā)音應(yīng)同步;

b)人物按句發(fā)音時(shí),前后若干相鄰發(fā)音和嘴形應(yīng)同步;

c)人物按照快樂的文字發(fā)音時(shí),嘴型應(yīng)嘴唇上拉、嘴角收緊;

d)人物按照生氣的文字發(fā)音時(shí),嘴型應(yīng)下唇上推、撅嘴;

e)人物按照不同意見文字發(fā)音時(shí),嘴型應(yīng)噘嘴。

眉毛與眼皮動(dòng)作

眉毛與眼皮動(dòng)作要求如下:

a)人物說話時(shí),眉毛應(yīng)根據(jù)表達(dá)的語意動(dòng)態(tài)變化、眼皮應(yīng)眨眼;

b)人物表達(dá)快樂時(shí),內(nèi)眉毛應(yīng)上揚(yáng)、上眼瞼應(yīng)上揚(yáng);

c)人物表達(dá)生氣時(shí),內(nèi)眉毛應(yīng)下降、臉頰應(yīng)提升并眼輪外圈收緊;

d)人物表達(dá)不同意見時(shí),應(yīng)皺眉、眼輪內(nèi)圈收緊;

e)人物應(yīng)可以閉眼、眨眼。

眼球動(dòng)作

眼球動(dòng)作要求如下:

a)人物眼球應(yīng)可以旋轉(zhuǎn);

b)人物表達(dá)快樂時(shí),瞳孔應(yīng)會(huì)放大;

c)人物表達(dá)生氣時(shí),瞳孔應(yīng)會(huì)縮小;

d)人物表達(dá)不同意見時(shí),應(yīng)瞇著眼睛;

e)人物表達(dá)驚訝、好奇時(shí),應(yīng)睜大眼睛。

頭旋轉(zhuǎn)動(dòng)作

頭旋轉(zhuǎn)動(dòng)作要求如下:

a)人物說話時(shí),應(yīng)旋轉(zhuǎn)到對(duì)應(yīng)位置,并且根據(jù)表達(dá)的語意動(dòng)態(tài)變化;

b)人物表達(dá)相同意見時(shí),頭應(yīng)點(diǎn)頭;

c)人物表達(dá)不同意見時(shí),頭應(yīng)搖頭;

4

T/TAF203—2024

d)人物頭應(yīng)可以左轉(zhuǎn)、右轉(zhuǎn)、向上、向下、左傾斜、右傾斜、前傾、后仰;

e)人物頭應(yīng)可以上下擺動(dòng)、左右擺動(dòng)、上揚(yáng)再左/右傾。

上身肢體動(dòng)作

上身肢體動(dòng)作要求如下:

a)人物說話時(shí),上身肢體動(dòng)作應(yīng)根據(jù)表達(dá)的語意動(dòng)態(tài)變化;

b)人物上身肢體應(yīng)可以按照實(shí)體的屬性或行為動(dòng)作;

c)人物上身肢體應(yīng)可以按照抽象性的概念動(dòng)作;

d)人物上身肢體應(yīng)可以模擬真實(shí)人類進(jìn)行相關(guān)生產(chǎn)生活動(dòng)作。

下身肢體動(dòng)作

下身肢體動(dòng)作要求如下:

a)人物下身肢體應(yīng)可以模擬真人自然地維持身體的平衡;

b)人物下身肢體應(yīng)可以走、跑、跳實(shí)現(xiàn)身體位移;

c)人物進(jìn)行多種行動(dòng)方式動(dòng)作,動(dòng)作應(yīng)自然切換;

d)人物內(nèi)心著急狀態(tài)時(shí),走路/跑步姿態(tài)和頻率與普通應(yīng)不一致。

全身動(dòng)作

根據(jù)人物特性,執(zhí)行相關(guān)場景動(dòng)作,人物全身動(dòng)作應(yīng)協(xié)調(diào)一致。

5.4.2實(shí)時(shí)驅(qū)動(dòng)

實(shí)時(shí)驅(qū)動(dòng)要求如下:

a)人物在手機(jī)及攝像頭面捕驅(qū)動(dòng)下,面部表情應(yīng)具有準(zhǔn)確度、即時(shí)性(時(shí)延)、平滑度(抖

動(dòng));

b)人物在手臂傳感系統(tǒng)、手套等設(shè)備及半身攝像頭設(shè)備下,上肢動(dòng)作應(yīng)具有準(zhǔn)確度、即時(shí)性

(時(shí)延)、平滑度(抖動(dòng))、協(xié)調(diào)性;

c)人物在光學(xué)系統(tǒng)、慣性系統(tǒng)等設(shè)備及攝像頭動(dòng)捕設(shè)備下,全身動(dòng)作應(yīng)具有準(zhǔn)確度、即時(shí)性

(時(shí)延)、平滑度(抖動(dòng))、協(xié)調(diào)性。

5.4.3交互準(zhǔn)確性

交互準(zhǔn)確性要求如下:

a)兩個(gè)人物進(jìn)行交互,表情應(yīng)契合;

b)兩個(gè)人物進(jìn)行交互,動(dòng)作應(yīng)契合。

5.5語音能力要求

5.5.1發(fā)音準(zhǔn)確度

發(fā)音準(zhǔn)確度要求如下:

a)人物按字發(fā)音,準(zhǔn)確率不低于95%;

b)人物按句發(fā)音。準(zhǔn)確率不低于95%。

5.5.2韻律準(zhǔn)確度

人物按段停頓斷句,韻律準(zhǔn)確率不低于95%。

5

T/TAF203—2024

5.5.3語音效果

語音效果要求如下:

a)人物應(yīng)可以使用不同音色聲音說話;

b)人物應(yīng)可以調(diào)整說話速度。

5.5.4語言能力

語言能力要求如下:

a)人物應(yīng)可以使用不同方言說話;

b)人物應(yīng)可以使用不同外語說話。

5.5.5交互準(zhǔn)確度

兩個(gè)人物進(jìn)行語音交互,語音識(shí)別準(zhǔn)確率超過95%。

5.6交互能力要求

5.6.1輸入

輸入要求如下:

a)人物應(yīng)可以點(diǎn)觸控制;

b)人物應(yīng)可以圖像控制;

c)人物應(yīng)可以文字控制;

d)人物應(yīng)可以語音控制;

e)人物應(yīng)可以動(dòng)捕硬件控制;

f)人物應(yīng)可以面捕硬件控制。

5.6.2處理

處理要求如下:

a)人物與用戶單輪對(duì)話,意圖識(shí)別率不低于95%;

b)人物與用戶多輪對(duì)話,任務(wù)完成率不低于95%;

c)人物與用戶多種語言對(duì)話,意圖識(shí)別率不低于95%;

d)人物與用戶交互,平均響應(yīng)時(shí)間不低于2秒;

e)人物與用戶長時(shí)間交互,不應(yīng)出現(xiàn)卡頓、反應(yīng)慢、延遲等現(xiàn)象;

f)用戶使用生氣或者憤怒等情緒激動(dòng)的詞語與人物交互,系統(tǒng)應(yīng)識(shí)別并有效的給予安撫;

g)用戶使用欺詐、惡意自擾、自殺、恢復(fù)設(shè)置等業(yè)務(wù)風(fēng)險(xiǎn)關(guān)鍵詞交互,系統(tǒng)應(yīng)能識(shí)別和規(guī)避。

5.6.3輸出

輸出要求如下:

a)系統(tǒng)生成數(shù)字人視頻的流暢度,視頻幀率不低于30FPS;

b)系統(tǒng)生成固定幀數(shù)視頻,不應(yīng)出現(xiàn)跳幀、卡頓等錯(cuò)誤;

c)固定時(shí)長(單位:s)視頻,不應(yīng)出現(xiàn)口型多余、缺失,音頻提前、延遲等錯(cuò)誤。

5.7易用性要求

5.7.1形象舒適性

6

T/TAF203—2024

從好感度、自然度、契合度、使用愿景四個(gè)方面進(jìn)行評(píng)分。

5.7.2語音舒適性

從語音語調(diào)、流暢連貫度、情緒飽滿度、擬人舒適度四個(gè)方面進(jìn)行評(píng)分。

5.7.3動(dòng)畫舒適性

從口型匹配度、面部表情自然度、肢體動(dòng)作自然度、動(dòng)作銜接連貫性四個(gè)方面進(jìn)行評(píng)分。

5.7.4用戶交互體驗(yàn)

從交互準(zhǔn)確度、風(fēng)格一致性兩個(gè)方面進(jìn)行評(píng)分。

6測試方法

6.1載體測試方法

6.1.1基礎(chǔ)載體

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在多個(gè)平臺(tái)和多個(gè)環(huán)境里直接展示運(yùn)行,按照5.1.1基

礎(chǔ)載體中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人運(yùn)行是否正常。

b)預(yù)期結(jié)果:

1)3D身份型虛擬數(shù)字人能夠在任意一個(gè)平臺(tái)中正常運(yùn)行;

2)3D身份型虛擬數(shù)字人能夠在任意一個(gè)環(huán)境中正常展示運(yùn)行。

6.1.2兼容載體

測試方法如下:

a)測試方法:

1)將3D身份型虛擬數(shù)字人,在多于十臺(tái)相同類型平臺(tái)終端上運(yùn)行,按照5.1.2兼容載體中

規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人運(yùn)行是否正常;

2)將3D身份型虛擬數(shù)字人,在多于十臺(tái)相同類型環(huán)境終端上運(yùn)行,按照5.1.2兼容載體中

規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人運(yùn)行是否正常。

b)預(yù)期結(jié)果:

1)3D身份型虛擬數(shù)字人能夠在相同類型的平臺(tái)中,多品牌、多型號(hào)設(shè)備載體上正常運(yùn)行;

2)3D身份型虛擬數(shù)字人能夠在相同類型的環(huán)境中,多品牌、多型號(hào)設(shè)備載體上正常運(yùn)行。

6.2整體設(shè)定測試方法

6.2.1身份設(shè)定

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.2.1身份設(shè)定中規(guī)定

的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人人物各種屬性和定位是否和設(shè)計(jì)匹配。

b)預(yù)期結(jié)果:

1)人物姓名、性別、身高、體型屬性和設(shè)計(jì)匹配;

2)人物特點(diǎn)、特長(技能)屬性和設(shè)計(jì)匹配;

7

T/TAF203—2024

3)人物與現(xiàn)實(shí)世界定位和設(shè)計(jì)匹配。

6.2.2外形設(shè)定

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.2.2外形設(shè)定中規(guī)定

的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人人物外形是否和設(shè)計(jì)匹配。

b)預(yù)期結(jié)果:人物外形和設(shè)計(jì)匹配。

6.2.3建模風(fēng)格

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.2.3建模風(fēng)格中規(guī)定

的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人人物模型屬于哪一種風(fēng)格。

b)預(yù)期結(jié)果:人物模型屬于卡通、擬人、寫實(shí)、超寫實(shí)四種其中一種風(fēng)格。

6.3靜態(tài)形象測試方法

6.3.1規(guī)范性

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.3.1規(guī)范性中規(guī)定的

技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人是否存在規(guī)范性問題。

b)預(yù)期結(jié)果:

1)人物不存在破面;

2)人物不存在嚴(yán)重穿插;

3)人物不存在嚴(yán)重的變形;

4)人物不存在材質(zhì)球渲染問題;

5)人物不存在其他破損情況;

6)人物不存在沒焊接的點(diǎn);

7)人物不存在陰影問題;

8)人物不存在時(shí)裝穿模問題;

9)人物不存在碰撞問題;

10)人物不存在法線問題;

11)人物不存在口型問題;

12)人物不存在資源丟失問題;

13)人物不存在骨骼異常問題。

6.3.2精細(xì)度

測試方法如下:

a)測試方法:在專業(yè)的虛擬數(shù)字人開發(fā)工具上,按照5.3.2精細(xì)度中規(guī)定的技術(shù)要求內(nèi)容,檢

查虛擬數(shù)字人精細(xì)度是否符合要求。

b)預(yù)期結(jié)果:

1)卡通人物模型面數(shù)超過3000面,擬人人物面數(shù)超過1萬面,寫實(shí)人物面數(shù)超過5萬面,

超寫實(shí)人物面數(shù)超過500萬面;

2)人物貼圖數(shù)量超過4張;

8

T/TAF203—2024

3)人物貼圖分辨率高于1024px*1024px;

4)人物毛發(fā)貼圖精度高于2048px*2048px;

5)人物有使用AO貼圖;

6)人物眼睛模型有顏色貼圖;

7)人物眼睛模型有粗糙貼圖;

8)人物皮膚有3S貼圖;

9)人物有眼球結(jié)構(gòu);

10)人物有眼球晶狀體結(jié)構(gòu);

11)人物有口腔內(nèi)部結(jié)構(gòu);

12)人物模型為可編輯多邊形;

13)人物骨骼是Biped骨骼;

14)人物骨骼點(diǎn)在模型骨骼關(guān)節(jié)處;

15)人物角色脖子骨骼帶有角度;

16)人物發(fā)型帽飾動(dòng)態(tài)骨骼數(shù)量為5根以上;

17)人物所有骨骼至少2Link以上的權(quán)重;

18)人物蒙皮后角色A-pose改為標(biāo)準(zhǔn)T-pose;

19)人物轉(zhuǎn)化為T-pose的角色蒙皮沒有錯(cuò)誤;

20)人物布線走向和骨骼方向垂直。

6.3.3可編輯性

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.3.3可編輯性中規(guī)定

的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人是否可以編輯。

b)預(yù)期結(jié)果:

1)人物可調(diào)整臉型;

2)人物可調(diào)整五官;

3)人物可調(diào)整妝容;

4)人物可調(diào)整膚色;

5)人物可調(diào)整身高;

6)人物可調(diào)整體重;

7)人物可更換衣服;

8)人物可更換發(fā)型;

9)人物可更換裝飾品。

6.4動(dòng)態(tài)行為測試方法

6.4.1動(dòng)作契合度

嘴唇動(dòng)作

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照嘴唇動(dòng)作中規(guī)

定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人嘴唇動(dòng)作是否符合要求。

b)預(yù)期結(jié)果:

9

T/TAF203—2024

1)人物按字發(fā)音時(shí),嘴形和發(fā)音同步;

2)人物按句發(fā)音時(shí),前后若干相鄰發(fā)音和嘴形同步;

3)人物按照快樂的文字發(fā)音時(shí),嘴唇上拉、嘴角收緊;

4)人物按照生氣的文字發(fā)音時(shí),下唇上推、撅嘴;

5)人物按照不同意見文字發(fā)音時(shí),噘嘴。

眉毛與眼皮動(dòng)作

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照眉毛與眼皮動(dòng)

作中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人眉毛與眼皮動(dòng)作是否符合要求。

b)預(yù)期結(jié)果:

1)人物說話時(shí),眉毛根據(jù)表達(dá)的語意動(dòng)態(tài)變化、眼皮眨眼;

2)人物表達(dá)快樂時(shí),內(nèi)眉毛上揚(yáng)、上眼瞼上揚(yáng);

3)人物表達(dá)生氣時(shí),內(nèi)眉毛下降、臉頰提升并眼輪外圈收緊;

4)人物表達(dá)不同意見時(shí),皺眉、眼輪內(nèi)圈收緊;

5)人物可以閉眼、眨眼。

眼球動(dòng)作

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照眼球動(dòng)作中規(guī)

定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人眼球動(dòng)作是否符合要求。

b)預(yù)期結(jié)果:

1)人物眼球可以旋轉(zhuǎn);

2)人物表達(dá)快樂時(shí),瞳孔會(huì)放大;

3)人物表達(dá)生氣時(shí),瞳孔會(huì)縮小;

4)人物表達(dá)不同意見時(shí),瞇著眼睛;

5)人物表達(dá)驚訝、好奇時(shí),睜大眼睛。

頭旋轉(zhuǎn)動(dòng)作

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照頭旋轉(zhuǎn)動(dòng)作中

規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人頭旋轉(zhuǎn)動(dòng)作是否符合要求。

b)預(yù)期結(jié)果:

1)人物說話時(shí),頭旋轉(zhuǎn)到對(duì)應(yīng)位置,并且根據(jù)表達(dá)的語意動(dòng)態(tài)變化;

2)人物表達(dá)相同意見時(shí),點(diǎn)頭;

3)人物表達(dá)不同意見時(shí),搖頭;

4)人物頭可以左轉(zhuǎn)、右轉(zhuǎn)、向上、向下、左傾斜、右傾斜、前傾、后仰;

5)人物頭可以上下擺動(dòng)、左右擺動(dòng)、上揚(yáng)再左/右傾。

上身肢體動(dòng)作

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照上身肢體動(dòng)作

中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人上身肢體動(dòng)作是否符合要求。

10

T/TAF203—2024

b)預(yù)期結(jié)果:

1)人物說話時(shí),上身肢體動(dòng)作根據(jù)表達(dá)的語意動(dòng)態(tài)變化;

2)人物上身肢體可以按照實(shí)體的屬性或行為動(dòng)作;

3)人物上身肢體可以按照抽象性的概念動(dòng)作;

4)人物上身肢體可以模擬真實(shí)人類進(jìn)行相關(guān)生產(chǎn)生活動(dòng)作。

下身肢體動(dòng)作

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照下身肢體動(dòng)作

中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人下身肢體動(dòng)作是否符合要求。

b)預(yù)期結(jié)果:

1)人物下身肢體可以模擬真人自然地維持身體的平衡;

2)人物下身肢體可以走、跑、跳實(shí)現(xiàn)身體位移;

3)人物進(jìn)行多種行動(dòng)方式動(dòng)作,動(dòng)作可以自然切換;

4)人物內(nèi)心著急狀態(tài)時(shí),走路/跑步姿態(tài)和頻率與普通一致。

全身動(dòng)作

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照全身動(dòng)作中規(guī)

定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人全身肢體動(dòng)作是否符合要求。

b)預(yù)期結(jié)果:人物全身動(dòng)作協(xié)調(diào)一致。

6.4.2實(shí)時(shí)驅(qū)動(dòng)

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在多種可適配載體終端上運(yùn)行,按照5.4.2實(shí)時(shí)驅(qū)動(dòng)中

規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人實(shí)時(shí)驅(qū)動(dòng)是否符合要求。

b)預(yù)期結(jié)果:

1)人物在手機(jī)及攝像頭面捕驅(qū)動(dòng)下,面部表情準(zhǔn)確、延遲低、無抖動(dòng);

2)人物在手臂傳感系統(tǒng)、手套等設(shè)備及半身攝像頭設(shè)備下,上肢動(dòng)作表情準(zhǔn)確、延遲低、

無抖動(dòng);

3)人物在光學(xué)系統(tǒng)、慣性系統(tǒng)等設(shè)備及攝像頭動(dòng)捕設(shè)備下,全身動(dòng)作表情準(zhǔn)確、延遲低、

無抖動(dòng)。

6.4.3交互準(zhǔn)確性

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.4.3交互準(zhǔn)確性中規(guī)

定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人交互準(zhǔn)確性是否符合要求。

b)預(yù)期結(jié)果:

1)兩個(gè)人物進(jìn)行交互表情契合;

2)兩個(gè)人物進(jìn)行交互動(dòng)作契合。

6.5語音能力測試方法

11

T/TAF203—2024

6.5.1發(fā)音準(zhǔn)確度

測試方法如下:

a)測試方法:

1)將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行;

2)構(gòu)建包含普通文本和特殊文本的文本測試集,生成對(duì)應(yīng)視頻,統(tǒng)計(jì)發(fā)音錯(cuò)誤的字符數(shù),

以及發(fā)音錯(cuò)誤的句數(shù),按照5.5.1發(fā)音準(zhǔn)確度中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人

發(fā)音準(zhǔn)確度是否符合要求;

3)發(fā)音字準(zhǔn)確率,計(jì)算方法如公式1所示:

New

Rwc(1-)100%

Nw…………(1)

式中:

Nw——文本總字?jǐn)?shù),單位為個(gè);

New——發(fā)音錯(cuò)誤字?jǐn)?shù)(多種發(fā)音錯(cuò)誤字?jǐn)?shù)之和),單位為個(gè);

Rwc——發(fā)音字準(zhǔn)確率。

4)發(fā)音句準(zhǔn)確率,計(jì)算方法如公式2所示:

Nes

Rsc(1-)100%

Ns…………(2)

式中:

Ns——文本總句數(shù),單位為個(gè);

Nes——發(fā)音錯(cuò)誤句數(shù),單位為個(gè);

Rsc——發(fā)音句準(zhǔn)確率。

b)預(yù)期結(jié)果:

1)人物按字發(fā)音字準(zhǔn)確率超過95%;

2)人物按句發(fā)音句準(zhǔn)確率超過95%。

6.5.2韻律準(zhǔn)確度

測試方法如下:

a)測試方法:

1)將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行;

2)使用普通文本測試數(shù)據(jù),輸入一段文本,生成對(duì)應(yīng)視頻,記錄文字停頓、斷句位置與標(biāo)

準(zhǔn)答案比對(duì),一個(gè)句子為一個(gè)用例,統(tǒng)計(jì)停頓正確用例數(shù),按照5.5.2韻律準(zhǔn)確度中規(guī)

定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人韻律準(zhǔn)確度是否符合要求;

3)韻律準(zhǔn)確率,計(jì)算方法如公式3所示:

N

Rpc100%

pcN

…………(3)

式中:

Npc——停頓正確用例數(shù),單位為個(gè);

12

T/TAF203—2024

N——總用例數(shù),單位為個(gè);

Rpc——韻律準(zhǔn)確率。

b)預(yù)期結(jié)果:人物按段停頓斷句韻律準(zhǔn)確率超過95%。

6.5.3語音效果

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,使用不同音色和說話速度,

按照5.5.3語音效果中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人語音效果是否符合要求。

b)預(yù)期結(jié)果:

1)人物可以使用不同音色聲音說話;

2)人物可以調(diào)整說話速度。

6.5.4語言能力

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,使用不同方言和外語,按照

5.5.4語言能力中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人語言能力是否符合要求。

b)預(yù)期結(jié)果:

1)人物可以使用不同方言說話,包括東北話、四川話、粵語等;

2)人物可以使用不同外語說話,包括英語、法語、俄語等。

6.5.5交互準(zhǔn)確度

測試方法如下:

a)測試方法:

1)將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,兩個(gè)虛擬數(shù)字人進(jìn)行語音交互,按

照5.5.5交互準(zhǔn)確性中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人交互準(zhǔn)確度是否符合要

求;

2)語音識(shí)別準(zhǔn)確率,按照GB/T21024—2007中的5.2.1、5.2.2、5.2.3進(jìn)行評(píng)估。

b)預(yù)期結(jié)果:兩個(gè)人物進(jìn)行語音交互,語音識(shí)別準(zhǔn)確率超過95%。

6.6交互能力測試方法

6.6.1輸入

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在多種可適配載體終端上,通過不同方式控制虛擬數(shù)字

人,按照5.6.1輸入能力中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字輸入能力是否符合要求。

b)預(yù)期結(jié)果:

1)人物可以點(diǎn)觸控制;

2)人物可以圖像控制;

3)人物可以文字控制;

4)人物可以語音控制;

5)人物可以動(dòng)捕硬件控制;

6)人物可以面捕硬件控制。

6.6.2處理

13

T/TAF203—2024

測試方法如下:

a)測試方法:

1)將3D身份型虛擬數(shù)字人,在可適配載體終端上,通過不同語音對(duì)話方式、不同語言與虛

擬數(shù)字人交互,按照5.6.2處理能力中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人處理能力

是否符合要求。

2)單輪對(duì)話意圖識(shí)別率,計(jì)算方法如公式4所示:

Nar

Rarc100%

N…………(4)

式中:

Nar——精準(zhǔn)識(shí)別的數(shù)量,單位為個(gè);

N——單輪對(duì)話測試總數(shù),單位為個(gè);

Rarc——意圖識(shí)別率。

3)多輪對(duì)話任務(wù)完成率,計(jì)算方法如公式5所示:

L1

Rtc100%

N…………(5)

式中:

L1——任務(wù)完成量(多輪對(duì)話每次測試所有輪次均順利識(shí)別視為任務(wù)完成),單位為個(gè);

N——多輪對(duì)話測試總數(shù),單位為個(gè);

Rtc——任務(wù)完成率。

4)多種語言對(duì)話意圖識(shí)別率,計(jì)算方法如公式6所示:

L2

Rcr100%

M…………(6)

式中:

L2——成功識(shí)別的總輪次,單位為個(gè);

M——測試總輪次數(shù);

Rcr——下文識(shí)別率。

5)交互的平均響應(yīng)時(shí)間,計(jì)算方法如公式7所示:

N

(TsiTei)

Ti1

N…………(7)

式中:

i——表示第i輪交互;

Tsi——系統(tǒng)開始反饋的時(shí)間點(diǎn),單位為秒(s);

Tei——用戶輸入信息結(jié)束的時(shí)間點(diǎn),單位為秒(s);

N——測試總次數(shù);

T——平均交互響應(yīng)時(shí)間,單位為秒(s)。

b)預(yù)期結(jié)果:

1)人物單輪對(duì)話意圖識(shí)別率超過95%;

2)人物多輪對(duì)話任務(wù)完成率超過95%;

14

T/TAF203—2024

3)人物多種語言對(duì)話意圖識(shí)別率95%;

4)人物交互的平均響應(yīng)時(shí)間不超過2秒;

5)人物長時(shí)間交互,不會(huì)出現(xiàn)卡頓、反應(yīng)慢、延遲等現(xiàn)象;

6)人物能夠識(shí)別用戶情緒,并有效的給予安撫;

7)人物能夠識(shí)別業(yè)務(wù)風(fēng)險(xiǎn),并有效進(jìn)行規(guī)避。

6.6.3輸出

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,生成視頻輸出,按照5.6.3輸出能力中規(guī)定的技術(shù)要求

內(nèi)容,檢查虛擬數(shù)字人輸出能力是否符合要求。

b)預(yù)期結(jié)果:

1)FPS值超過30;

2)視頻畫面不會(huì)出現(xiàn)跳幀、卡頓等錯(cuò)誤;

3)視頻畫面不會(huì)出現(xiàn)口型多余、缺失,音頻提前、延遲等錯(cuò)誤。

6.7易用性測試方法

6.7.1形象舒適性

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶看到的數(shù)字人形象

質(zhì)量,參照表1的李克特量表從形象舒適性主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量優(yōu)劣,1

最差~5最優(yōu),最后取均值。

表1形象舒適性主觀評(píng)分規(guī)則

測試內(nèi)容描述54321

好感度你喜歡該形象的設(shè)計(jì)嗎?十分喜歡比較喜歡一般不太喜歡十分不喜歡

自然度該形象是否自然?十分自然比較自然基本自然不太自然十分不自然

契合度該形象是否和設(shè)計(jì)或?qū)嶓w契合?十分契合比較契合基本契合不太契合十分不契合

使用愿景你愿意使用該形象為你服務(wù)嗎?非常愿意比較愿意一般不太愿意十分不愿意

b)預(yù)期結(jié)果:從好感度、自然度、契合度、使用愿景四個(gè)方面分別給出一個(gè)主觀評(píng)分。

6.7.2語音舒適性

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶聽到的數(shù)字人聲音

質(zhì)量,參照表2的李克特量表從語音舒適性主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量優(yōu)劣,1

最差~5最優(yōu),最后取均值。

表2語音舒適性主觀評(píng)分規(guī)則

測試內(nèi)容描述54321

整體發(fā)音是否標(biāo)準(zhǔn)?十分標(biāo)準(zhǔn)比較標(biāo)準(zhǔn)基本標(biāo)準(zhǔn)個(gè)別標(biāo)準(zhǔn)十分不標(biāo)準(zhǔn)

語音語調(diào)

發(fā)音吐字是否清晰?十分清晰比較清晰基本清晰不太清晰十分不清晰

15

T/TAF203—2024

表2語音舒適性主觀評(píng)分規(guī)則(續(xù))

測試內(nèi)容描述54321

斷詞斷句、停頓是否

十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)

恰當(dāng)?

語音語調(diào)語氣語調(diào)是否自然?十分自然比較自然基本自然不太自然十分不自然

重讀發(fā)音是否得當(dāng)?十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)

語速表達(dá)是否恰當(dāng)?十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)

流暢連貫度語音表達(dá)是否流利?十分自然比較自然基本自然不太自然十分不自然

按照文本語義和內(nèi)

情緒飽滿度容,情緒表達(dá)是否恰十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)

當(dāng)?

比較相似,

聲音擬人程度是否和完全無法區(qū)

與真人語音基本相似不太一樣完全不一樣

真人一樣?分

有細(xì)微區(qū)別

擬人舒適度聆聽該聲音時(shí),感受

十分愉悅比較愉悅一般不太愉悅十分不愉悅

是否愉悅?

你愿意使用該聲音為

十分愿意比較愿意一般不太愿意十分不愿意

你服務(wù)嗎?

b)預(yù)期結(jié)果:從語音語調(diào)、流暢連貫度、情緒飽滿度、擬人舒適度四個(gè)方面分別給出一個(gè)主觀

評(píng)分。

6.7.3動(dòng)畫舒適性

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶看到的數(shù)字人動(dòng)畫

效果,參照表3的李克特量表從動(dòng)畫舒適性主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量優(yōu)劣,1

最差~5最優(yōu),最后取均值。

表3動(dòng)畫舒適性主觀評(píng)分規(guī)則

測試內(nèi)容描述54321

口型匹配度口型與發(fā)音匹配嗎?完全匹配比較匹配基本匹配不太匹配完全不匹配

面部表情自然度面部表情是否自然?十分自然比較自然基本自然不太自然十分不自然

肢體動(dòng)作自然度肢體動(dòng)作是否自然?十分自然比較自然基本自然不太自然十分不自然

動(dòng)作銜接連貫性動(dòng)作銜接是否連貫?十分連貫比較連貫基本連貫不太連貫十分不連貫

b)預(yù)期結(jié)果:從口型匹配度、面部表情自然度、肢體動(dòng)作自然度、動(dòng)作銜接連貫性四個(gè)方面分

別給出一個(gè)主觀評(píng)分。

6.7.4用戶交互體驗(yàn)

測試方法如下:

a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶對(duì)參評(píng)數(shù)字人系統(tǒng)

的交互體驗(yàn),參照表4的李克特量表從用戶交互體驗(yàn)主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量

優(yōu)劣,1最差~5最優(yōu),最后取均值。

16

T/TAF203—2024

表4用戶交互體驗(yàn)主觀評(píng)分規(guī)則

測試內(nèi)容描述54321

咨詢問答情景下,

系統(tǒng)是否能夠準(zhǔn)確完全準(zhǔn)確比較準(zhǔn)確基本準(zhǔn)確不太準(zhǔn)確完全不準(zhǔn)確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論