隨著元宇宙概念的火爆也一同帶動(dòng)了數(shù)字人市場(chǎng)的快速升溫,據(jù)計(jì)算全球平均每天都會(huì)誕生一個(gè)數(shù)字人。數(shù)字人正成為一股潮流,涌入人們的日常生活——會(huì)“捉妖”的虛擬美妝達(dá)人柳夜熙,抖音出道三天點(diǎn)贊即超百萬(wàn),一夜之間成為國(guó)內(nèi)虛擬偶像界的“頂流”;在江蘇衛(wèi)視跨年演唱會(huì)上,昔日歌后鄧麗君“重返”舞臺(tái),與歌手周深同臺(tái)對(duì)唱,交織幾代人的青春記憶;而在杭州亞運(yùn)會(huì)上,數(shù)字人點(diǎn)燃火炬,成為開幕式的亮點(diǎn)。除此之外,數(shù)字人擔(dān)當(dāng)起手語(yǔ)主播、氣象主播、公益宣傳、帶貨達(dá)人等各式角色,代替真人提供服務(wù)支持……
一、什么是AI數(shù)字人?
數(shù)字人的核心是“人”,本質(zhì)上是通過(guò)數(shù)字技術(shù)提高數(shù)字人的綜合體驗(yàn),使之帶來(lái)真人般的感受和互動(dòng)。
一方面,隨著人工智能、虛擬現(xiàn)實(shí)、高精度渲染等技術(shù)的發(fā)展和融合,數(shù)字人的擬人化程度愈來(lái)愈高,從形象、表情、姿態(tài)、動(dòng)作,再到語(yǔ)音、語(yǔ)意、語(yǔ)態(tài)等方方面面正在逐步逼近真人水平。例如,超寫實(shí)數(shù)字人(Metahuman)已成為當(dāng)前主流,柳夜熙、“鄧麗君”等都是超寫實(shí)數(shù)字人的代表,擁有高度逼真的數(shù)字化外觀形象。
另一方面,人工智能技術(shù)在數(shù)字人形象生成、動(dòng)作驅(qū)動(dòng)和語(yǔ)言交互等環(huán)節(jié)的深入應(yīng)用,也將進(jìn)一步提升數(shù)字人制作的自動(dòng)化水平,推動(dòng)數(shù)字人市場(chǎng)從利基走向大眾。
數(shù)字人的擬人化,以及生產(chǎn)制作的自動(dòng)化程度反映數(shù)字人系統(tǒng)整體進(jìn)化和發(fā)展水平,代表著數(shù)字技術(shù)綜合運(yùn)用能力和成熟度體現(xiàn)。
根據(jù)“擬人化”和“自動(dòng)化”兩個(gè)維度,我們可以將數(shù)字人分成 L1-L5 五個(gè)等級(jí),如下圖所示。
其中,我們將 L4 和 L5 等級(jí)的數(shù)字人統(tǒng)稱為“AI 數(shù)字人”。Ta 們不僅具備高度的擬人化呈現(xiàn),在形象、動(dòng)作和智力層面都更接近于真人水平,能夠聽懂、看懂、有記憶、自學(xué)習(xí),與人進(jìn)行自然交互;同時(shí),在制作流程中也融合了大量的人工智能算法技術(shù)來(lái)提升數(shù)字人的生產(chǎn)效率,降低數(shù)字人的制作成本。普遍認(rèn)為,只有達(dá)到 L4 級(jí)別及以上的數(shù)字人才能真正的走入千行百業(yè),在消費(fèi)和產(chǎn)業(yè)領(lǐng)域大放異彩。
二、AI數(shù)字人的三大特征
多模態(tài)交互、深度學(xué)習(xí)和 AIGC是 AI 數(shù)字人的三大特征。
首先,在應(yīng)用層面,多模態(tài)交互是 AI 數(shù)字人的“核心力”。
我們認(rèn)為,具備足夠自然和擬真的多模態(tài)交互能力,是數(shù)字人在更廣泛的應(yīng)用場(chǎng)景中逐步替代真人角色的關(guān)鍵。所謂“多模態(tài)交互”,即是將深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)圖形學(xué)相結(jié)合,充分模擬人與人之間自然真實(shí)的交互方式,實(shí)現(xiàn)“聽得懂,看得見,說(shuō)得出”的人機(jī)交互效果。
擁有多模態(tài)交互能力的 AI 數(shù)字人,不僅能夠呈現(xiàn)傳統(tǒng)語(yǔ)音對(duì)話無(wú)法展現(xiàn)的多媒體信息,通過(guò)結(jié)合計(jì)算機(jī)視覺技術(shù),還能完成身份識(shí)別、手勢(shì)識(shí)別、情感識(shí)別等多項(xiàng)交互任務(wù),讓交互過(guò)程更加豐富且高效。與此同時(shí),可
視化的寫實(shí)形象也賦予了 AI 數(shù)字人獨(dú)特的情感溫度,有助于建立人性化的情感紐帶。
其次,在價(jià)值層面,深度學(xué)習(xí)是 AI 數(shù)字人的“創(chuàng)造力”。
每一個(gè) AI 數(shù)字人背后都有一個(gè)“智慧的大腦”,可以基于語(yǔ)音語(yǔ)義理解等技術(shù),結(jié)合不同領(lǐng)域的知識(shí)庫(kù)和海量數(shù)據(jù)訓(xùn)練,進(jìn)行深度學(xué)習(xí)和迭代升級(jí),讓自己變得越來(lái)越“聰明”,越來(lái)越專業(yè),從而能夠快速適應(yīng)瞬息萬(wàn)變的市場(chǎng)變化和細(xì)分化的場(chǎng)景需求,不斷打破即有的應(yīng)用邊界,為用戶持續(xù)創(chuàng)造新價(jià)值和新體驗(yàn)。
第三,在制作層面,AIGC 是 AI 數(shù)字人的“生產(chǎn)力”。
高制作成本和長(zhǎng)制作周期掣肘數(shù)字人產(chǎn)業(yè)規(guī)模化發(fā)展。傳統(tǒng)數(shù)字人生產(chǎn)過(guò)程中,從人物建模到動(dòng)畫設(shè)計(jì)和制作等各個(gè)環(huán)節(jié)幾乎都依賴人工“雕琢”而成。譬如,以人物建模為例,傳統(tǒng)建模環(huán)節(jié)大概要花費(fèi)數(shù)月時(shí)間。此外,要讓模型動(dòng)起來(lái),前面的準(zhǔn)備工作(蒙皮、BlendShape 等)以及后續(xù)的動(dòng)畫制作及優(yōu)化環(huán)節(jié)也需要花費(fèi)數(shù)月時(shí)間,無(wú)論是時(shí)間成本還是人工成本都是一個(gè)相對(duì)較大的投入。
AIGC 重塑生產(chǎn)流程,在人物模型的重建、動(dòng)畫準(zhǔn)備和制作等各個(gè)環(huán)節(jié)輔助數(shù)字人自動(dòng)化生成,大幅加速數(shù)字人生產(chǎn),降低制作門檻和成本投入,是 AI 數(shù)字人生產(chǎn)力之本。以人物建模環(huán)節(jié)為例,例如,商湯科技為軟銀大會(huì)打造的軟銀 COO 今井康之的 AI 數(shù)字人形象,即是基于少量照片的面部掃描,結(jié)合 AI 算法快速生成數(shù)字人高精度 3D 模型,將傳統(tǒng)以月計(jì)算的制作周期縮短至數(shù)天內(nèi)完成。
三、AI數(shù)字人的三大應(yīng)用方向
根據(jù)使用目的和底層邏輯不同,AI 數(shù)字人可大致分成三大應(yīng)用方向。
方向一:主要以創(chuàng)建 IP 影響力或打造粉絲經(jīng)濟(jì)為目的的 AI 數(shù)字人應(yīng)用,包括虛擬偶像、虛擬 KOL、虛擬演員、虛擬主播等。
基于“IP 孵化 + 內(nèi)容運(yùn)營(yíng)”,賦予 Ta 們獨(dú)特的人設(shè)和人格特質(zhì),以此來(lái)吸引不同受眾群體的關(guān)注,從而形成一定規(guī)模的流量基礎(chǔ)和情感鏈接,再通過(guò)諸如直播帶貨、跨界品牌代言、IP 授權(quán)周邊衍生品、娛樂演藝等多種手段來(lái)實(shí)現(xiàn)價(jià)值閉環(huán)或進(jìn)行商業(yè)化變現(xiàn)。
方向二:主要以替代真人服務(wù)、實(shí)現(xiàn)降本增效為目的的 AI 數(shù)字人應(yīng)用,包括虛擬客服、虛擬前臺(tái)、虛擬導(dǎo)游、虛擬主持人等。
Ta 們根據(jù)各自領(lǐng)域所長(zhǎng),能夠“7×24 小時(shí)”在崗不間斷的提供服務(wù)支持,尤其針對(duì)標(biāo)準(zhǔn)化、重復(fù)性高的真人服務(wù)可以實(shí)現(xiàn)數(shù)字化替代,并結(jié)合業(yè)務(wù)流程自動(dòng)化,幫助企業(yè)進(jìn)一步提高生產(chǎn)效率、降低人工服務(wù)成本,為企業(yè)數(shù)字化轉(zhuǎn)型提供新路徑。
方向三:隨著人工智能、虛擬現(xiàn)實(shí)等相關(guān)技術(shù)的逐步成熟,通過(guò)深度學(xué)習(xí)和認(rèn)知泛化,AI數(shù)字人將會(huì)全面突破應(yīng)用邊界,升級(jí)成為數(shù)字世界的“超級(jí)助手”。
與前兩個(gè)應(yīng)用方向不同,AI 數(shù)字人的第三大應(yīng)用方向不再僅遵循真實(shí)世界的“替代”邏輯,初衷更在于滿足用戶與數(shù)字世界的連接和交互需求,實(shí)現(xiàn)對(duì)于數(shù)字世界的直接操作。正如《元宇宙”破壁人“:做虛實(shí)融合世界的賦能者》白皮書中所描繪的圖景一樣,“這些數(shù)字人將成為我們?cè)跀?shù)字世界的 AI 代理人”。通過(guò)與 Ta們的直接交互,可以“隨機(jī)應(yīng)變”的針對(duì)用戶個(gè)性化、多樣化需求,提供全天候、全方位的人性化陪伴和智能化服務(wù),成為人們通向虛實(shí)融合世界的超級(jí)入口。
四、AI數(shù)字人的八大應(yīng)用場(chǎng)景
場(chǎng)景1:金融網(wǎng)店“新窗口”
商湯為寧波銀行上海分行打造的超寫實(shí)型 AI 數(shù)字人大堂經(jīng)理“小寧”,以栩栩如生的客服形象為銀行客戶提供各類業(yè)務(wù)咨詢和服務(wù)辦理。
生動(dòng)的形象和擬真的交互體驗(yàn),AI 數(shù)字人讓銀行客戶倍感新鮮,有效提升了客戶關(guān)注時(shí)間,不僅能為銀行創(chuàng)造更多業(yè)務(wù)推廣機(jī)會(huì),在網(wǎng)點(diǎn)“智能化、無(wú)人化”的趨勢(shì)下,成為銀行服務(wù)線下客群的“新窗口”,以及提升服務(wù)效率、提高服務(wù)質(zhì)量和標(biāo)準(zhǔn)的重要載體。
場(chǎng)景2:在線互金“新入口”
基于手機(jī)銀行在線服務(wù)問(wèn)題,渤海銀行與商湯合作開發(fā) AI 數(shù)字人“小海豚”,以生動(dòng)、可愛的 3D 卡通形象,為渤海銀行的線上用戶提供全程“貼身服務(wù)”,包括自助式業(yè)務(wù)引導(dǎo)和辦理、金融知識(shí)的專業(yè)講解,以及理財(cái)產(chǎn)品的智能推薦等,為客戶創(chuàng)造全新的交互觸達(dá)式體驗(yàn),成為手機(jī)銀行提供在線互金服務(wù)的“新入口”。
例如,在自助業(yè)務(wù)辦理上,小海豚可以正確“理解”客戶需求,并快速定位到客戶所需辦理的業(yè)務(wù)界面,大大縮減了繁瑣的操作流程,幫助客戶高效完成業(yè)務(wù)辦理,為客戶提供了一個(gè)親切交互、快捷便利的無(wú)障礙金融體驗(yàn)。
場(chǎng)景3:商場(chǎng)交互“新觸點(diǎn)”
廣州新塘的永旺夢(mèng)樂城與商湯聯(lián)合打造了超寫實(shí)型 AI 數(shù)字人“小糖”,主要承擔(dān)商場(chǎng)內(nèi)客服咨詢、導(dǎo)航導(dǎo)購(gòu)等多項(xiàng)服務(wù)工作。
例如,作為虛擬客服人員,“小糖”可以隨時(shí)隨地為顧客提供準(zhǔn)確、快速的店鋪位置導(dǎo)覽、停車路線指引、積分兌換等問(wèn)詢服務(wù)。當(dāng)遇到“超綱”問(wèn)題時(shí),后臺(tái)管理人員可以及時(shí)進(jìn)行遠(yuǎn)程接管。作為虛擬導(dǎo)購(gòu)員,“小糖”通過(guò)與顧客的自然交互和意圖理解,判斷顧客的實(shí)地需求,將新品上線、新店開業(yè)、優(yōu)惠活動(dòng)等商場(chǎng)或店鋪信息更有效的向顧客進(jìn)行精準(zhǔn)推薦,有助于營(yíng)銷轉(zhuǎn)化效果的提升。
場(chǎng)景4:文博講解“新體驗(yàn)”
中共一大紀(jì)念館與商湯合作,于 2021 年建黨 100 周年之際在展館內(nèi)推出 001 號(hào) AI 數(shù)字人講解員“申小伊”。Ta 不僅能夠主動(dòng)迎接和問(wèn)候,還能為來(lái)自全國(guó)各地的參觀群眾和黨員干部講解中共一大黨史。
在形象設(shè)計(jì)上,“申小伊”達(dá)到了超寫實(shí)級(jí)別精度,嚴(yán)格遵循紀(jì)念館內(nèi)制服標(biāo)準(zhǔn)著裝“上崗”;在講解專業(yè)性上,“申小伊”基于中共一大相關(guān)的黨史典籍建立知識(shí)庫(kù)體系進(jìn)行深度學(xué)習(xí),并通過(guò)知識(shí)泛化覆蓋上萬(wàn)條黨史問(wèn)題,不僅能夠熟練講解黨史內(nèi)容,還能輕松解答各類黨史相關(guān)問(wèn)題。
場(chǎng)景5:品牌營(yíng)銷“新代言”
商湯基于 AIGC,僅結(jié)合幾張真人照片即快速生成超寫實(shí) AI 數(shù)字人“大真”。Ta 不僅可以充當(dāng)活動(dòng)虛擬主持,與同臺(tái)真人主持一起與觀眾進(jìn)行實(shí)時(shí)互動(dòng),還可以登錄直播間 24 小時(shí)不間斷直播帶貨,與用戶“面對(duì)面”進(jìn)行彈幕互動(dòng),自助解答品牌相關(guān)問(wèn)題。
場(chǎng)景6:企業(yè)前臺(tái)“新形象”
根據(jù)企業(yè)形象定制的 AI 數(shù)字人,不僅擁有符合企業(yè)文化氣質(zhì)的外觀形象,還能替代真人前臺(tái)根據(jù)員工預(yù)約信息,對(duì)已預(yù)約的到訪客戶進(jìn)行主動(dòng)式的迎賓接待,并基于豐富的企業(yè)知識(shí)庫(kù)體系,為到訪客戶進(jìn)行企業(yè)介紹、發(fā)展歷程的講解,并能與訪客進(jìn)行實(shí)時(shí)對(duì)話,親切耐心地解答企業(yè)相關(guān)問(wèn)詢。
場(chǎng)景7:指揮車艙“新助手”
車機(jī)大屏已成為新一代智能終端,承載著載具內(nèi)人機(jī)交互、調(diào)用軟件服務(wù)等功能,也影響著智慧車艙的交互體驗(yàn)。將車機(jī)系統(tǒng)功能進(jìn)行集成,并通過(guò)生動(dòng)的 AI 數(shù)字人形象作為人機(jī)交互的主要媒介,相對(duì)傳統(tǒng)語(yǔ)音或觸屏等方式,為車主帶來(lái)更具個(gè)性化、人格化的行車體驗(yàn)。
場(chǎng)景8:虛擬活動(dòng)“新服務(wù)”
在沉浸式活動(dòng) / 會(huì)議系統(tǒng)中,AI 數(shù)字人可以作為活動(dòng)隨行助手,全程“陪伴”參會(huì)者左右,隨時(shí)隨地提供咨詢服務(wù),回答活動(dòng)相關(guān)問(wèn)題,并提供活動(dòng)接待、講解、導(dǎo)覽、記錄、推介等各類服務(wù)和支持。一方面減少活動(dòng)主辦方人工客服投入,提升用戶體驗(yàn);另一方面可以通過(guò)對(duì) AI 數(shù)字人交互數(shù)據(jù)的收集和分析,幫助主辦方掌握參會(huì)人員實(shí)際需求,更好的實(shí)現(xiàn)活動(dòng)效果的轉(zhuǎn)化,達(dá)到主辦活動(dòng)的目的。