TA活躍在各種聚光燈下,有著無可挑剔的精致容顏和完美比例的身材,從不畏懼歲月風霜而永葆青春;TA有著無懈可擊的甜美嗓音,每個動作都經(jīng)過精心設計,儼然成為元宇宙里萬人矚目的驕傲寵兒。TA的名字,就叫做數(shù)字人。

隨著元宇宙的風潮席卷全球,千姿百態(tài)的數(shù)字人浮現(xiàn)在紛繁多元的應用場景里,他們的形象或者萌趣可愛,或者酷炫超寫實,整體規(guī)模蔚為壯觀。不過,這些數(shù)字人究竟是從何處而來,他們又如何獲得“生命”的呢?
畫龍點睛:人工智能驅(qū)動數(shù)字人
數(shù)字人沒有實體,如同來自于計算機軟件編程創(chuàng)造的比特空間,而數(shù)字人的誕生過程,經(jīng)歷了人物建模、人物驅(qū)動、人物渲染和感知交互等各個階段。其中人物驅(qū)動作為關鍵環(huán)節(jié),在不同的技術路線驅(qū)動下,數(shù)字人真正“動了起來”。
根據(jù)中國傳媒大學主流融媒體研究中心發(fā)布的《2022虛擬數(shù)字人商業(yè)化發(fā)展報告》顯示,虛擬數(shù)字人的主流技術驅(qū)動路線分為人工智能驅(qū)動和動作捕捉驅(qū)動。無論是人工智能驅(qū)動還是動作捕捉驅(qū)動,數(shù)字人都會不可避免地直面數(shù)不勝數(shù)的交互場景,具有不同的反應模式。
元宇宙場景下,數(shù)字人魚龍混雜。在一些虛擬演唱會和虛擬現(xiàn)實的游戲之中,有些數(shù)字人只能作為靜態(tài)展示,就像玻璃櫥窗里精美的玩偶,無法與觀眾形成互動,空有一副靚麗的外殼,缺少了一些“人味兒”。
而另外一些數(shù)字人,可以完成一些簡單的互動,但只能按照設定好的程序來做出反應,對于設定程序以外的指令束手無策,難以達到實時性和交互性的要求,看起來有互動,但是還不夠“聰明”。
小i的新一代數(shù)字人
真正能夠解決數(shù)字人交互問題的,就是人工智能技術,特別是以自然語言處理為核心的認知智能技術。AI技術讓數(shù)字人的圖騰在元宇宙的石壁上騰躍而起,進入更為廣袤的想象空間。
作為以認知智能為核心的全球AI產(chǎn)業(yè)化賦能者,小i機器人綜合運用自然語言處理、語音處理、計算機視覺、機器學習、情感計算、數(shù)據(jù)智能和超級自動化等六大核心技術,打造了新一代數(shù)字人。
小i的新一代數(shù)字人,可以對詞、短語、句子、篇章進行抽取分析,具有靈活多樣的會話管理和上下文處理技術,以及深度學習和增強學習的技術,進而實現(xiàn)深層次的場景會話處理、意圖識別和復雜邏輯的推理。
在此基礎上,可實現(xiàn)數(shù)字人的智能問答,根據(jù)需求搭建數(shù)字人語料庫,并且提供問答交互能力,從而廣泛應用于文旅講解、企業(yè)服務、電商直播、政務大廳和展廳講解等多種場景,讓元宇宙虛擬數(shù)字人向虛擬數(shù)智人邁出了關鍵性的一步。
數(shù)字人不能只有精美的外形,TA更需要的是有趣的靈魂,以及充滿智慧的頭腦,具有實時性和交互性的新一代數(shù)字人——數(shù)智人,才是元宇宙未來的風向標。在小i機器人,新一代數(shù)字人的故事還在繼續(xù)。