




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
ICS33.160
CCSM61
團(tuán)體標(biāo)準(zhǔn)
T/TAF203—2024
面向3D身份型虛擬數(shù)字人技術(shù)要求和測試
方法
Technicalrequirementsandtestmethodsofdigitalhumanfor3D
identitytypeoriented
2024-02-23發(fā)布2024-02-23實(shí)施
電信終端產(chǎn)業(yè)協(xié)會(huì)發(fā)布
T/TAF203—2024
面向3D身份型虛擬數(shù)字人技術(shù)要求和測試方法
1范圍
本文件規(guī)定了3D身份型虛擬數(shù)字人的技術(shù)要求和測試方法,主要描述了載體、整體設(shè)定、靜態(tài)形
象、動(dòng)態(tài)行為、語音能力、交互能力、易用性等方面技術(shù)要求的測試方法。
本文件適用于各種制式的3D身份型虛擬數(shù)字人。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文
件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適
用于本文件。
GB/T21024—2007中文語音合成系統(tǒng)通用技術(shù)規(guī)范
T/BAGIA0001—2019影視動(dòng)畫三維模型制作
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
虛擬數(shù)字人digitalhuman
簡稱數(shù)字人或虛擬人,是運(yùn)用數(shù)字技術(shù)創(chuàng)造出來的、與人類形象接近的數(shù)字化人物形象。
3.2
身份型虛擬數(shù)字人identitydigitalhuman
具有身份性的虛擬數(shù)字人,多以虛擬IP或偶像呈現(xiàn),能夠?yàn)槲磥淼奶摂M化世界提供人的核心交互
中介。
3.3
模型model
按照對(duì)象所需呈現(xiàn)的結(jié)構(gòu)或動(dòng)勢(shì)等,通過專用軟件完成對(duì)象每個(gè)表面拓?fù)浣Y(jié)構(gòu)的數(shù)學(xué)表示,從而
在虛擬三維空間中塑造出的物體。
[來源:T/BAGIA0001—2019]
3.4
韻律prosody
1
T/TAF203—2024
一般也稱為超音段特征,是將各種語言學(xué)單位組織成話語或話語中關(guān)聯(lián)組塊的系統(tǒng)組織。從物理
角度,指基頻、時(shí)長和強(qiáng)度等聲學(xué)參數(shù);從語言學(xué)的角度,指音段層次以上的音系組織。
[來源:GB/T21024—2007]
4縮略語
下列縮略語使用于本文件。
3D:三維(3-Dimensional)
3S貼圖:磁表面散射貼圖(Sub-SurfaceScattering)
AO貼圖:環(huán)境遮擋貼圖(AmbientOcclusion)
AR:增強(qiáng)現(xiàn)實(shí)技術(shù)(VirtualReality)
FPS:每秒傳輸幀數(shù)(FramesPerSecond)
LED:發(fā)光二極管(light-emittingdiode)
PX:像素(Pixel)
VR:虛擬現(xiàn)實(shí)技術(shù)(VirtualReality)
5技術(shù)要求
5.1載體要求
5.1.1基礎(chǔ)載體
基礎(chǔ)載體要求如下:
a)具備在手機(jī)、電視、投影、LED大屏等任意平臺(tái)中運(yùn)行;
b)具備在裸眼立體、VR、AR顯示等任意環(huán)境里直接展示運(yùn)行。
5.1.2兼容載體
兼容載體要求如下:
a)具備在相同類型的平臺(tái)中,多品牌、多型號(hào)設(shè)備載體上應(yīng)能正常運(yùn)行;
b)具備在相同類型的環(huán)境中,多品牌、多型號(hào)設(shè)備載體上應(yīng)能正常運(yùn)行。
5.2整體設(shè)定要求
5.2.1身份設(shè)定
身份設(shè)定要求如下:
a)人物姓名、性別、身高、體型屬性,應(yīng)與設(shè)計(jì)匹配;
b)人物特點(diǎn)、特長(技能)屬性,應(yīng)與設(shè)計(jì)匹配;
c)人物與現(xiàn)實(shí)世界定位,應(yīng)和設(shè)計(jì)匹配。
5.2.2外形設(shè)定
人物外形,應(yīng)和設(shè)計(jì)匹配。
5.2.3建模風(fēng)格
人物模型應(yīng)屬于卡通、擬人、寫實(shí)、超寫實(shí)四種風(fēng)格。
2
T/TAF203—2024
5.3靜態(tài)形象要求
5.3.1規(guī)范性
規(guī)范性要求如下:
a)人物不應(yīng)有破面問題;
b)人物不應(yīng)有嚴(yán)重穿插問題;
c)人物不應(yīng)有嚴(yán)重的變形問題;
d)人物不應(yīng)有材質(zhì)球渲染問題;
e)人物不應(yīng)有其他破損情況問題;
f)人物不應(yīng)有沒焊接的點(diǎn)問題;
g)人物不應(yīng)有陰影問題;
h)人物不應(yīng)有時(shí)裝穿模問題;
i)人物不應(yīng)有碰撞問題;
j)人物不應(yīng)有法線問題;
k)人物不應(yīng)有口型問題;
l)人物不應(yīng)有資源丟失問題;
m)人物不應(yīng)有骨骼異常問題。
5.3.2精細(xì)度
精細(xì)度要求如下:
a)人物面數(shù),不低于3000面;
b)人物貼圖數(shù)量,不低于4張;
c)人物貼圖分辨率,不低于1024px*1024px;
d)人物毛發(fā)貼圖精度,不低于2048px*2048px;
e)人物應(yīng)使用AO貼圖;
f)人物眼睛模型應(yīng)有顏色貼圖;
g)人物眼睛模型應(yīng)有粗糙貼圖;
h)人物皮膚應(yīng)有3S貼圖;
i)人物應(yīng)有眼球結(jié)構(gòu);
j)人物應(yīng)有眼球晶狀體結(jié)構(gòu);
k)人物應(yīng)有口腔內(nèi)部結(jié)構(gòu);
l)人物模型應(yīng)為可編輯多邊形;
m)人物骨骼應(yīng)是Biped骨骼;
n)人物骨骼點(diǎn)應(yīng)在模型骨骼關(guān)節(jié)處;
o)人物角色脖子骨骼應(yīng)帶有角度;
p)人物發(fā)型帽飾動(dòng)態(tài)骨骼數(shù)量應(yīng)為5根以上;
q)人物所有骨骼應(yīng)至少2Link以上的權(quán)重;
r)人物蒙皮后角色A-pose應(yīng)改為標(biāo)準(zhǔn)T-pose;
s)人物轉(zhuǎn)化為T-pose的角色蒙皮不應(yīng)出現(xiàn)錯(cuò)誤;
t)人物布線走向應(yīng)和骨骼方向垂直。
5.3.3可編輯性
可編輯性要求如下:
3
T/TAF203—2024
a)人物應(yīng)可調(diào)整臉型;
b)人物應(yīng)可調(diào)整五官;
c)人物應(yīng)可調(diào)整妝容;
d)人物應(yīng)可調(diào)整膚色;
e)人物應(yīng)可調(diào)整身高;
f)人物應(yīng)可調(diào)整體重;
g)人物應(yīng)可更換衣服;
h)人物應(yīng)可更換發(fā)型;
i)人物應(yīng)可更換裝飾品。
5.4動(dòng)態(tài)行為要求
5.4.1動(dòng)作契合度
嘴唇動(dòng)作
嘴唇動(dòng)作要求如下:
a)人物按字發(fā)音時(shí),嘴形和發(fā)音應(yīng)同步;
b)人物按句發(fā)音時(shí),前后若干相鄰發(fā)音和嘴形應(yīng)同步;
c)人物按照快樂的文字發(fā)音時(shí),嘴型應(yīng)嘴唇上拉、嘴角收緊;
d)人物按照生氣的文字發(fā)音時(shí),嘴型應(yīng)下唇上推、撅嘴;
e)人物按照不同意見文字發(fā)音時(shí),嘴型應(yīng)噘嘴。
眉毛與眼皮動(dòng)作
眉毛與眼皮動(dòng)作要求如下:
a)人物說話時(shí),眉毛應(yīng)根據(jù)表達(dá)的語意動(dòng)態(tài)變化、眼皮應(yīng)眨眼;
b)人物表達(dá)快樂時(shí),內(nèi)眉毛應(yīng)上揚(yáng)、上眼瞼應(yīng)上揚(yáng);
c)人物表達(dá)生氣時(shí),內(nèi)眉毛應(yīng)下降、臉頰應(yīng)提升并眼輪外圈收緊;
d)人物表達(dá)不同意見時(shí),應(yīng)皺眉、眼輪內(nèi)圈收緊;
e)人物應(yīng)可以閉眼、眨眼。
眼球動(dòng)作
眼球動(dòng)作要求如下:
a)人物眼球應(yīng)可以旋轉(zhuǎn);
b)人物表達(dá)快樂時(shí),瞳孔應(yīng)會(huì)放大;
c)人物表達(dá)生氣時(shí),瞳孔應(yīng)會(huì)縮小;
d)人物表達(dá)不同意見時(shí),應(yīng)瞇著眼睛;
e)人物表達(dá)驚訝、好奇時(shí),應(yīng)睜大眼睛。
頭旋轉(zhuǎn)動(dòng)作
頭旋轉(zhuǎn)動(dòng)作要求如下:
a)人物說話時(shí),應(yīng)旋轉(zhuǎn)到對(duì)應(yīng)位置,并且根據(jù)表達(dá)的語意動(dòng)態(tài)變化;
b)人物表達(dá)相同意見時(shí),頭應(yīng)點(diǎn)頭;
c)人物表達(dá)不同意見時(shí),頭應(yīng)搖頭;
4
T/TAF203—2024
d)人物頭應(yīng)可以左轉(zhuǎn)、右轉(zhuǎn)、向上、向下、左傾斜、右傾斜、前傾、后仰;
e)人物頭應(yīng)可以上下擺動(dòng)、左右擺動(dòng)、上揚(yáng)再左/右傾。
上身肢體動(dòng)作
上身肢體動(dòng)作要求如下:
a)人物說話時(shí),上身肢體動(dòng)作應(yīng)根據(jù)表達(dá)的語意動(dòng)態(tài)變化;
b)人物上身肢體應(yīng)可以按照實(shí)體的屬性或行為動(dòng)作;
c)人物上身肢體應(yīng)可以按照抽象性的概念動(dòng)作;
d)人物上身肢體應(yīng)可以模擬真實(shí)人類進(jìn)行相關(guān)生產(chǎn)生活動(dòng)作。
下身肢體動(dòng)作
下身肢體動(dòng)作要求如下:
a)人物下身肢體應(yīng)可以模擬真人自然地維持身體的平衡;
b)人物下身肢體應(yīng)可以走、跑、跳實(shí)現(xiàn)身體位移;
c)人物進(jìn)行多種行動(dòng)方式動(dòng)作,動(dòng)作應(yīng)自然切換;
d)人物內(nèi)心著急狀態(tài)時(shí),走路/跑步姿態(tài)和頻率與普通應(yīng)不一致。
全身動(dòng)作
根據(jù)人物特性,執(zhí)行相關(guān)場景動(dòng)作,人物全身動(dòng)作應(yīng)協(xié)調(diào)一致。
5.4.2實(shí)時(shí)驅(qū)動(dòng)
實(shí)時(shí)驅(qū)動(dòng)要求如下:
a)人物在手機(jī)及攝像頭面捕驅(qū)動(dòng)下,面部表情應(yīng)具有準(zhǔn)確度、即時(shí)性(時(shí)延)、平滑度(抖
動(dòng));
b)人物在手臂傳感系統(tǒng)、手套等設(shè)備及半身攝像頭設(shè)備下,上肢動(dòng)作應(yīng)具有準(zhǔn)確度、即時(shí)性
(時(shí)延)、平滑度(抖動(dòng))、協(xié)調(diào)性;
c)人物在光學(xué)系統(tǒng)、慣性系統(tǒng)等設(shè)備及攝像頭動(dòng)捕設(shè)備下,全身動(dòng)作應(yīng)具有準(zhǔn)確度、即時(shí)性
(時(shí)延)、平滑度(抖動(dòng))、協(xié)調(diào)性。
5.4.3交互準(zhǔn)確性
交互準(zhǔn)確性要求如下:
a)兩個(gè)人物進(jìn)行交互,表情應(yīng)契合;
b)兩個(gè)人物進(jìn)行交互,動(dòng)作應(yīng)契合。
5.5語音能力要求
5.5.1發(fā)音準(zhǔn)確度
發(fā)音準(zhǔn)確度要求如下:
a)人物按字發(fā)音,準(zhǔn)確率不低于95%;
b)人物按句發(fā)音。準(zhǔn)確率不低于95%。
5.5.2韻律準(zhǔn)確度
人物按段停頓斷句,韻律準(zhǔn)確率不低于95%。
5
T/TAF203—2024
5.5.3語音效果
語音效果要求如下:
a)人物應(yīng)可以使用不同音色聲音說話;
b)人物應(yīng)可以調(diào)整說話速度。
5.5.4語言能力
語言能力要求如下:
a)人物應(yīng)可以使用不同方言說話;
b)人物應(yīng)可以使用不同外語說話。
5.5.5交互準(zhǔn)確度
兩個(gè)人物進(jìn)行語音交互,語音識(shí)別準(zhǔn)確率超過95%。
5.6交互能力要求
5.6.1輸入
輸入要求如下:
a)人物應(yīng)可以點(diǎn)觸控制;
b)人物應(yīng)可以圖像控制;
c)人物應(yīng)可以文字控制;
d)人物應(yīng)可以語音控制;
e)人物應(yīng)可以動(dòng)捕硬件控制;
f)人物應(yīng)可以面捕硬件控制。
5.6.2處理
處理要求如下:
a)人物與用戶單輪對(duì)話,意圖識(shí)別率不低于95%;
b)人物與用戶多輪對(duì)話,任務(wù)完成率不低于95%;
c)人物與用戶多種語言對(duì)話,意圖識(shí)別率不低于95%;
d)人物與用戶交互,平均響應(yīng)時(shí)間不低于2秒;
e)人物與用戶長時(shí)間交互,不應(yīng)出現(xiàn)卡頓、反應(yīng)慢、延遲等現(xiàn)象;
f)用戶使用生氣或者憤怒等情緒激動(dòng)的詞語與人物交互,系統(tǒng)應(yīng)識(shí)別并有效的給予安撫;
g)用戶使用欺詐、惡意自擾、自殺、恢復(fù)設(shè)置等業(yè)務(wù)風(fēng)險(xiǎn)關(guān)鍵詞交互,系統(tǒng)應(yīng)能識(shí)別和規(guī)避。
5.6.3輸出
輸出要求如下:
a)系統(tǒng)生成數(shù)字人視頻的流暢度,視頻幀率不低于30FPS;
b)系統(tǒng)生成固定幀數(shù)視頻,不應(yīng)出現(xiàn)跳幀、卡頓等錯(cuò)誤;
c)固定時(shí)長(單位:s)視頻,不應(yīng)出現(xiàn)口型多余、缺失,音頻提前、延遲等錯(cuò)誤。
5.7易用性要求
5.7.1形象舒適性
6
T/TAF203—2024
從好感度、自然度、契合度、使用愿景四個(gè)方面進(jìn)行評(píng)分。
5.7.2語音舒適性
從語音語調(diào)、流暢連貫度、情緒飽滿度、擬人舒適度四個(gè)方面進(jìn)行評(píng)分。
5.7.3動(dòng)畫舒適性
從口型匹配度、面部表情自然度、肢體動(dòng)作自然度、動(dòng)作銜接連貫性四個(gè)方面進(jìn)行評(píng)分。
5.7.4用戶交互體驗(yàn)
從交互準(zhǔn)確度、風(fēng)格一致性兩個(gè)方面進(jìn)行評(píng)分。
6測試方法
6.1載體測試方法
6.1.1基礎(chǔ)載體
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在多個(gè)平臺(tái)和多個(gè)環(huán)境里直接展示運(yùn)行,按照5.1.1基
礎(chǔ)載體中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人運(yùn)行是否正常。
b)預(yù)期結(jié)果:
1)3D身份型虛擬數(shù)字人能夠在任意一個(gè)平臺(tái)中正常運(yùn)行;
2)3D身份型虛擬數(shù)字人能夠在任意一個(gè)環(huán)境中正常展示運(yùn)行。
6.1.2兼容載體
測試方法如下:
a)測試方法:
1)將3D身份型虛擬數(shù)字人,在多于十臺(tái)相同類型平臺(tái)終端上運(yùn)行,按照5.1.2兼容載體中
規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人運(yùn)行是否正常;
2)將3D身份型虛擬數(shù)字人,在多于十臺(tái)相同類型環(huán)境終端上運(yùn)行,按照5.1.2兼容載體中
規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人運(yùn)行是否正常。
b)預(yù)期結(jié)果:
1)3D身份型虛擬數(shù)字人能夠在相同類型的平臺(tái)中,多品牌、多型號(hào)設(shè)備載體上正常運(yùn)行;
2)3D身份型虛擬數(shù)字人能夠在相同類型的環(huán)境中,多品牌、多型號(hào)設(shè)備載體上正常運(yùn)行。
6.2整體設(shè)定測試方法
6.2.1身份設(shè)定
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.2.1身份設(shè)定中規(guī)定
的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人人物各種屬性和定位是否和設(shè)計(jì)匹配。
b)預(yù)期結(jié)果:
1)人物姓名、性別、身高、體型屬性和設(shè)計(jì)匹配;
2)人物特點(diǎn)、特長(技能)屬性和設(shè)計(jì)匹配;
7
T/TAF203—2024
3)人物與現(xiàn)實(shí)世界定位和設(shè)計(jì)匹配。
6.2.2外形設(shè)定
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.2.2外形設(shè)定中規(guī)定
的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人人物外形是否和設(shè)計(jì)匹配。
b)預(yù)期結(jié)果:人物外形和設(shè)計(jì)匹配。
6.2.3建模風(fēng)格
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.2.3建模風(fēng)格中規(guī)定
的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人人物模型屬于哪一種風(fēng)格。
b)預(yù)期結(jié)果:人物模型屬于卡通、擬人、寫實(shí)、超寫實(shí)四種其中一種風(fēng)格。
6.3靜態(tài)形象測試方法
6.3.1規(guī)范性
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.3.1規(guī)范性中規(guī)定的
技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人是否存在規(guī)范性問題。
b)預(yù)期結(jié)果:
1)人物不存在破面;
2)人物不存在嚴(yán)重穿插;
3)人物不存在嚴(yán)重的變形;
4)人物不存在材質(zhì)球渲染問題;
5)人物不存在其他破損情況;
6)人物不存在沒焊接的點(diǎn);
7)人物不存在陰影問題;
8)人物不存在時(shí)裝穿模問題;
9)人物不存在碰撞問題;
10)人物不存在法線問題;
11)人物不存在口型問題;
12)人物不存在資源丟失問題;
13)人物不存在骨骼異常問題。
6.3.2精細(xì)度
測試方法如下:
a)測試方法:在專業(yè)的虛擬數(shù)字人開發(fā)工具上,按照5.3.2精細(xì)度中規(guī)定的技術(shù)要求內(nèi)容,檢
查虛擬數(shù)字人精細(xì)度是否符合要求。
b)預(yù)期結(jié)果:
1)卡通人物模型面數(shù)超過3000面,擬人人物面數(shù)超過1萬面,寫實(shí)人物面數(shù)超過5萬面,
超寫實(shí)人物面數(shù)超過500萬面;
2)人物貼圖數(shù)量超過4張;
8
T/TAF203—2024
3)人物貼圖分辨率高于1024px*1024px;
4)人物毛發(fā)貼圖精度高于2048px*2048px;
5)人物有使用AO貼圖;
6)人物眼睛模型有顏色貼圖;
7)人物眼睛模型有粗糙貼圖;
8)人物皮膚有3S貼圖;
9)人物有眼球結(jié)構(gòu);
10)人物有眼球晶狀體結(jié)構(gòu);
11)人物有口腔內(nèi)部結(jié)構(gòu);
12)人物模型為可編輯多邊形;
13)人物骨骼是Biped骨骼;
14)人物骨骼點(diǎn)在模型骨骼關(guān)節(jié)處;
15)人物角色脖子骨骼帶有角度;
16)人物發(fā)型帽飾動(dòng)態(tài)骨骼數(shù)量為5根以上;
17)人物所有骨骼至少2Link以上的權(quán)重;
18)人物蒙皮后角色A-pose改為標(biāo)準(zhǔn)T-pose;
19)人物轉(zhuǎn)化為T-pose的角色蒙皮沒有錯(cuò)誤;
20)人物布線走向和骨骼方向垂直。
6.3.3可編輯性
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.3.3可編輯性中規(guī)定
的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人是否可以編輯。
b)預(yù)期結(jié)果:
1)人物可調(diào)整臉型;
2)人物可調(diào)整五官;
3)人物可調(diào)整妝容;
4)人物可調(diào)整膚色;
5)人物可調(diào)整身高;
6)人物可調(diào)整體重;
7)人物可更換衣服;
8)人物可更換發(fā)型;
9)人物可更換裝飾品。
6.4動(dòng)態(tài)行為測試方法
6.4.1動(dòng)作契合度
嘴唇動(dòng)作
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照嘴唇動(dòng)作中規(guī)
定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人嘴唇動(dòng)作是否符合要求。
b)預(yù)期結(jié)果:
9
T/TAF203—2024
1)人物按字發(fā)音時(shí),嘴形和發(fā)音同步;
2)人物按句發(fā)音時(shí),前后若干相鄰發(fā)音和嘴形同步;
3)人物按照快樂的文字發(fā)音時(shí),嘴唇上拉、嘴角收緊;
4)人物按照生氣的文字發(fā)音時(shí),下唇上推、撅嘴;
5)人物按照不同意見文字發(fā)音時(shí),噘嘴。
眉毛與眼皮動(dòng)作
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照眉毛與眼皮動(dòng)
作中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人眉毛與眼皮動(dòng)作是否符合要求。
b)預(yù)期結(jié)果:
1)人物說話時(shí),眉毛根據(jù)表達(dá)的語意動(dòng)態(tài)變化、眼皮眨眼;
2)人物表達(dá)快樂時(shí),內(nèi)眉毛上揚(yáng)、上眼瞼上揚(yáng);
3)人物表達(dá)生氣時(shí),內(nèi)眉毛下降、臉頰提升并眼輪外圈收緊;
4)人物表達(dá)不同意見時(shí),皺眉、眼輪內(nèi)圈收緊;
5)人物可以閉眼、眨眼。
眼球動(dòng)作
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照眼球動(dòng)作中規(guī)
定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人眼球動(dòng)作是否符合要求。
b)預(yù)期結(jié)果:
1)人物眼球可以旋轉(zhuǎn);
2)人物表達(dá)快樂時(shí),瞳孔會(huì)放大;
3)人物表達(dá)生氣時(shí),瞳孔會(huì)縮小;
4)人物表達(dá)不同意見時(shí),瞇著眼睛;
5)人物表達(dá)驚訝、好奇時(shí),睜大眼睛。
頭旋轉(zhuǎn)動(dòng)作
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照頭旋轉(zhuǎn)動(dòng)作中
規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人頭旋轉(zhuǎn)動(dòng)作是否符合要求。
b)預(yù)期結(jié)果:
1)人物說話時(shí),頭旋轉(zhuǎn)到對(duì)應(yīng)位置,并且根據(jù)表達(dá)的語意動(dòng)態(tài)變化;
2)人物表達(dá)相同意見時(shí),點(diǎn)頭;
3)人物表達(dá)不同意見時(shí),搖頭;
4)人物頭可以左轉(zhuǎn)、右轉(zhuǎn)、向上、向下、左傾斜、右傾斜、前傾、后仰;
5)人物頭可以上下擺動(dòng)、左右擺動(dòng)、上揚(yáng)再左/右傾。
上身肢體動(dòng)作
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照上身肢體動(dòng)作
中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人上身肢體動(dòng)作是否符合要求。
10
T/TAF203—2024
b)預(yù)期結(jié)果:
1)人物說話時(shí),上身肢體動(dòng)作根據(jù)表達(dá)的語意動(dòng)態(tài)變化;
2)人物上身肢體可以按照實(shí)體的屬性或行為動(dòng)作;
3)人物上身肢體可以按照抽象性的概念動(dòng)作;
4)人物上身肢體可以模擬真實(shí)人類進(jìn)行相關(guān)生產(chǎn)生活動(dòng)作。
下身肢體動(dòng)作
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照下身肢體動(dòng)作
中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人下身肢體動(dòng)作是否符合要求。
b)預(yù)期結(jié)果:
1)人物下身肢體可以模擬真人自然地維持身體的平衡;
2)人物下身肢體可以走、跑、跳實(shí)現(xiàn)身體位移;
3)人物進(jìn)行多種行動(dòng)方式動(dòng)作,動(dòng)作可以自然切換;
4)人物內(nèi)心著急狀態(tài)時(shí),走路/跑步姿態(tài)和頻率與普通一致。
全身動(dòng)作
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照全身動(dòng)作中規(guī)
定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人全身肢體動(dòng)作是否符合要求。
b)預(yù)期結(jié)果:人物全身動(dòng)作協(xié)調(diào)一致。
6.4.2實(shí)時(shí)驅(qū)動(dòng)
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在多種可適配載體終端上運(yùn)行,按照5.4.2實(shí)時(shí)驅(qū)動(dòng)中
規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人實(shí)時(shí)驅(qū)動(dòng)是否符合要求。
b)預(yù)期結(jié)果:
1)人物在手機(jī)及攝像頭面捕驅(qū)動(dòng)下,面部表情準(zhǔn)確、延遲低、無抖動(dòng);
2)人物在手臂傳感系統(tǒng)、手套等設(shè)備及半身攝像頭設(shè)備下,上肢動(dòng)作表情準(zhǔn)確、延遲低、
無抖動(dòng);
3)人物在光學(xué)系統(tǒng)、慣性系統(tǒng)等設(shè)備及攝像頭動(dòng)捕設(shè)備下,全身動(dòng)作表情準(zhǔn)確、延遲低、
無抖動(dòng)。
6.4.3交互準(zhǔn)確性
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,按照5.4.3交互準(zhǔn)確性中規(guī)
定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人交互準(zhǔn)確性是否符合要求。
b)預(yù)期結(jié)果:
1)兩個(gè)人物進(jìn)行交互表情契合;
2)兩個(gè)人物進(jìn)行交互動(dòng)作契合。
6.5語音能力測試方法
11
T/TAF203—2024
6.5.1發(fā)音準(zhǔn)確度
測試方法如下:
a)測試方法:
1)將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行;
2)構(gòu)建包含普通文本和特殊文本的文本測試集,生成對(duì)應(yīng)視頻,統(tǒng)計(jì)發(fā)音錯(cuò)誤的字符數(shù),
以及發(fā)音錯(cuò)誤的句數(shù),按照5.5.1發(fā)音準(zhǔn)確度中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人
發(fā)音準(zhǔn)確度是否符合要求;
3)發(fā)音字準(zhǔn)確率,計(jì)算方法如公式1所示:
New
Rwc(1-)100%
Nw…………(1)
式中:
Nw——文本總字?jǐn)?shù),單位為個(gè);
New——發(fā)音錯(cuò)誤字?jǐn)?shù)(多種發(fā)音錯(cuò)誤字?jǐn)?shù)之和),單位為個(gè);
Rwc——發(fā)音字準(zhǔn)確率。
4)發(fā)音句準(zhǔn)確率,計(jì)算方法如公式2所示:
Nes
Rsc(1-)100%
Ns…………(2)
式中:
Ns——文本總句數(shù),單位為個(gè);
Nes——發(fā)音錯(cuò)誤句數(shù),單位為個(gè);
Rsc——發(fā)音句準(zhǔn)確率。
b)預(yù)期結(jié)果:
1)人物按字發(fā)音字準(zhǔn)確率超過95%;
2)人物按句發(fā)音句準(zhǔn)確率超過95%。
6.5.2韻律準(zhǔn)確度
測試方法如下:
a)測試方法:
1)將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行;
2)使用普通文本測試數(shù)據(jù),輸入一段文本,生成對(duì)應(yīng)視頻,記錄文字停頓、斷句位置與標(biāo)
準(zhǔn)答案比對(duì),一個(gè)句子為一個(gè)用例,統(tǒng)計(jì)停頓正確用例數(shù),按照5.5.2韻律準(zhǔn)確度中規(guī)
定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人韻律準(zhǔn)確度是否符合要求;
3)韻律準(zhǔn)確率,計(jì)算方法如公式3所示:
N
Rpc100%
pcN
…………(3)
式中:
Npc——停頓正確用例數(shù),單位為個(gè);
12
T/TAF203—2024
N——總用例數(shù),單位為個(gè);
Rpc——韻律準(zhǔn)確率。
b)預(yù)期結(jié)果:人物按段停頓斷句韻律準(zhǔn)確率超過95%。
6.5.3語音效果
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,使用不同音色和說話速度,
按照5.5.3語音效果中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人語音效果是否符合要求。
b)預(yù)期結(jié)果:
1)人物可以使用不同音色聲音說話;
2)人物可以調(diào)整說話速度。
6.5.4語言能力
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,使用不同方言和外語,按照
5.5.4語言能力中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人語言能力是否符合要求。
b)預(yù)期結(jié)果:
1)人物可以使用不同方言說話,包括東北話、四川話、粵語等;
2)人物可以使用不同外語說話,包括英語、法語、俄語等。
6.5.5交互準(zhǔn)確度
測試方法如下:
a)測試方法:
1)將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,兩個(gè)虛擬數(shù)字人進(jìn)行語音交互,按
照5.5.5交互準(zhǔn)確性中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人交互準(zhǔn)確度是否符合要
求;
2)語音識(shí)別準(zhǔn)確率,按照GB/T21024—2007中的5.2.1、5.2.2、5.2.3進(jìn)行評(píng)估。
b)預(yù)期結(jié)果:兩個(gè)人物進(jìn)行語音交互,語音識(shí)別準(zhǔn)確率超過95%。
6.6交互能力測試方法
6.6.1輸入
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在多種可適配載體終端上,通過不同方式控制虛擬數(shù)字
人,按照5.6.1輸入能力中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字輸入能力是否符合要求。
b)預(yù)期結(jié)果:
1)人物可以點(diǎn)觸控制;
2)人物可以圖像控制;
3)人物可以文字控制;
4)人物可以語音控制;
5)人物可以動(dòng)捕硬件控制;
6)人物可以面捕硬件控制。
6.6.2處理
13
T/TAF203—2024
測試方法如下:
a)測試方法:
1)將3D身份型虛擬數(shù)字人,在可適配載體終端上,通過不同語音對(duì)話方式、不同語言與虛
擬數(shù)字人交互,按照5.6.2處理能力中規(guī)定的技術(shù)要求內(nèi)容,檢查虛擬數(shù)字人處理能力
是否符合要求。
2)單輪對(duì)話意圖識(shí)別率,計(jì)算方法如公式4所示:
Nar
Rarc100%
N…………(4)
式中:
Nar——精準(zhǔn)識(shí)別的數(shù)量,單位為個(gè);
N——單輪對(duì)話測試總數(shù),單位為個(gè);
Rarc——意圖識(shí)別率。
3)多輪對(duì)話任務(wù)完成率,計(jì)算方法如公式5所示:
L1
Rtc100%
N…………(5)
式中:
L1——任務(wù)完成量(多輪對(duì)話每次測試所有輪次均順利識(shí)別視為任務(wù)完成),單位為個(gè);
N——多輪對(duì)話測試總數(shù),單位為個(gè);
Rtc——任務(wù)完成率。
4)多種語言對(duì)話意圖識(shí)別率,計(jì)算方法如公式6所示:
L2
Rcr100%
M…………(6)
式中:
L2——成功識(shí)別的總輪次,單位為個(gè);
M——測試總輪次數(shù);
Rcr——下文識(shí)別率。
5)交互的平均響應(yīng)時(shí)間,計(jì)算方法如公式7所示:
N
(TsiTei)
Ti1
N…………(7)
式中:
i——表示第i輪交互;
Tsi——系統(tǒng)開始反饋的時(shí)間點(diǎn),單位為秒(s);
Tei——用戶輸入信息結(jié)束的時(shí)間點(diǎn),單位為秒(s);
N——測試總次數(shù);
T——平均交互響應(yīng)時(shí)間,單位為秒(s)。
b)預(yù)期結(jié)果:
1)人物單輪對(duì)話意圖識(shí)別率超過95%;
2)人物多輪對(duì)話任務(wù)完成率超過95%;
14
T/TAF203—2024
3)人物多種語言對(duì)話意圖識(shí)別率95%;
4)人物交互的平均響應(yīng)時(shí)間不超過2秒;
5)人物長時(shí)間交互,不會(huì)出現(xiàn)卡頓、反應(yīng)慢、延遲等現(xiàn)象;
6)人物能夠識(shí)別用戶情緒,并有效的給予安撫;
7)人物能夠識(shí)別業(yè)務(wù)風(fēng)險(xiǎn),并有效進(jìn)行規(guī)避。
6.6.3輸出
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,生成視頻輸出,按照5.6.3輸出能力中規(guī)定的技術(shù)要求
內(nèi)容,檢查虛擬數(shù)字人輸出能力是否符合要求。
b)預(yù)期結(jié)果:
1)FPS值超過30;
2)視頻畫面不會(huì)出現(xiàn)跳幀、卡頓等錯(cuò)誤;
3)視頻畫面不會(huì)出現(xiàn)口型多余、缺失,音頻提前、延遲等錯(cuò)誤。
6.7易用性測試方法
6.7.1形象舒適性
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶看到的數(shù)字人形象
質(zhì)量,參照表1的李克特量表從形象舒適性主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量優(yōu)劣,1
最差~5最優(yōu),最后取均值。
表1形象舒適性主觀評(píng)分規(guī)則
測試內(nèi)容描述54321
好感度你喜歡該形象的設(shè)計(jì)嗎?十分喜歡比較喜歡一般不太喜歡十分不喜歡
自然度該形象是否自然?十分自然比較自然基本自然不太自然十分不自然
契合度該形象是否和設(shè)計(jì)或?qū)嶓w契合?十分契合比較契合基本契合不太契合十分不契合
使用愿景你愿意使用該形象為你服務(wù)嗎?非常愿意比較愿意一般不太愿意十分不愿意
b)預(yù)期結(jié)果:從好感度、自然度、契合度、使用愿景四個(gè)方面分別給出一個(gè)主觀評(píng)分。
6.7.2語音舒適性
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶聽到的數(shù)字人聲音
質(zhì)量,參照表2的李克特量表從語音舒適性主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量優(yōu)劣,1
最差~5最優(yōu),最后取均值。
表2語音舒適性主觀評(píng)分規(guī)則
測試內(nèi)容描述54321
整體發(fā)音是否標(biāo)準(zhǔn)?十分標(biāo)準(zhǔn)比較標(biāo)準(zhǔn)基本標(biāo)準(zhǔn)個(gè)別標(biāo)準(zhǔn)十分不標(biāo)準(zhǔn)
語音語調(diào)
發(fā)音吐字是否清晰?十分清晰比較清晰基本清晰不太清晰十分不清晰
15
T/TAF203—2024
表2語音舒適性主觀評(píng)分規(guī)則(續(xù))
測試內(nèi)容描述54321
斷詞斷句、停頓是否
十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)
恰當(dāng)?
語音語調(diào)語氣語調(diào)是否自然?十分自然比較自然基本自然不太自然十分不自然
重讀發(fā)音是否得當(dāng)?十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)
語速表達(dá)是否恰當(dāng)?十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)
流暢連貫度語音表達(dá)是否流利?十分自然比較自然基本自然不太自然十分不自然
按照文本語義和內(nèi)
情緒飽滿度容,情緒表達(dá)是否恰十分恰當(dāng)比較恰當(dāng)基本恰當(dāng)不太恰當(dāng)很不恰當(dāng)
當(dāng)?
比較相似,
聲音擬人程度是否和完全無法區(qū)
與真人語音基本相似不太一樣完全不一樣
真人一樣?分
有細(xì)微區(qū)別
擬人舒適度聆聽該聲音時(shí),感受
十分愉悅比較愉悅一般不太愉悅十分不愉悅
是否愉悅?
你愿意使用該聲音為
十分愿意比較愿意一般不太愿意十分不愿意
你服務(wù)嗎?
b)預(yù)期結(jié)果:從語音語調(diào)、流暢連貫度、情緒飽滿度、擬人舒適度四個(gè)方面分別給出一個(gè)主觀
評(píng)分。
6.7.3動(dòng)畫舒適性
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶看到的數(shù)字人動(dòng)畫
效果,參照表3的李克特量表從動(dòng)畫舒適性主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量優(yōu)劣,1
最差~5最優(yōu),最后取均值。
表3動(dòng)畫舒適性主觀評(píng)分規(guī)則
測試內(nèi)容描述54321
口型匹配度口型與發(fā)音匹配嗎?完全匹配比較匹配基本匹配不太匹配完全不匹配
面部表情自然度面部表情是否自然?十分自然比較自然基本自然不太自然十分不自然
肢體動(dòng)作自然度肢體動(dòng)作是否自然?十分自然比較自然基本自然不太自然十分不自然
動(dòng)作銜接連貫性動(dòng)作銜接是否連貫?十分連貫比較連貫基本連貫不太連貫十分不連貫
b)預(yù)期結(jié)果:從口型匹配度、面部表情自然度、肢體動(dòng)作自然度、動(dòng)作銜接連貫性四個(gè)方面分
別給出一個(gè)主觀評(píng)分。
6.7.4用戶交互體驗(yàn)
測試方法如下:
a)測試方法:將3D身份型虛擬數(shù)字人,在可適配載體終端上運(yùn)行,根據(jù)用戶對(duì)參評(píng)數(shù)字人系統(tǒng)
的交互體驗(yàn),參照表4的李克特量表從用戶交互體驗(yàn)主觀評(píng)分規(guī)則進(jìn)行主觀打分來評(píng)價(jià)質(zhì)量
優(yōu)劣,1最差~5最優(yōu),最后取均值。
16
T/TAF203—2024
表4用戶交互體驗(yàn)主觀評(píng)分規(guī)則
測試內(nèi)容描述54321
咨詢問答情景下,
系統(tǒng)是否能夠準(zhǔn)確完全準(zhǔn)確比較準(zhǔn)確基本準(zhǔn)確不太準(zhǔn)確完全不準(zhǔn)確
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件設(shè)計(jì)師考試全面分析試題及答案
- 網(wǎng)絡(luò)互聯(lián)技術(shù)及其應(yīng)用試題及答案
- 政治參與中的意愿與行為研究試題及答案
- 西方政治制度與國際法的重要性及影響分析試題及答案
- 團(tuán)隊(duì)文化在項(xiàng)目管理中的作用試題及答案
- 政治算法在民主決策中的應(yīng)用試題及答案
- 壹釋機(jī)電工程考試內(nèi)容知識(shí)的核心要素試題及答案
- 公共政策解析與評(píng)估試題及答案
- 新時(shí)代背景下公共政策的創(chuàng)新研究試題及答案
- 透視2025年西方政治制度的社會(huì)結(jié)構(gòu)試題及答案
- 江蘇省南通市海安市2024-2025學(xué)年高二下學(xué)期4月期中生物試題(原卷版+解析版)
- 供配電技術(shù)試題及答案
- 山東財(cái)經(jīng)綜招試題及答案
- 2025年華陽新材料科技集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 山東省菏澤市成武縣2024屆重點(diǎn)中學(xué)小升初數(shù)學(xué)入學(xué)考試卷含解析
- 廣西桂林市2023-2024學(xué)年八年級(jí)下學(xué)期語文期末試卷
- 社會(huì)主義發(fā)展簡史智慧樹知到課后章節(jié)答案2023年下北方工業(yè)大學(xué)
- 塑料包裝袋購銷合同
- 生產(chǎn)良率系統(tǒng)統(tǒng)計(jì)表
- 代理機(jī)構(gòu)服務(wù)質(zhì)量考核評(píng)價(jià)表
- 淺談打擊樂器在小學(xué)低段音樂課堂中的運(yùn)用
評(píng)論
0/150
提交評(píng)論