圖片來源@視覺中國

文|AI產(chǎn)業(yè)研究中心

在杭州舉辦的第19屆亞運會,剛剛拉下帷幕。如果說與往屆亞運會相比,本屆亞運會最大的亮點是什么?那非是數(shù)字人技術(shù)在亞運會期間的廣泛應用莫屬。

先是在開幕式上,首次出現(xiàn)了“數(shù)字人點火”,由全球超過1億位線上用戶參與,共同組成的一個巨大的“數(shù)字火炬手”,如蜻蜓點水般跑過錢塘江江面,奔進主會場,跟現(xiàn)場火炬手一同點燃主火炬,引發(fā)了廣大網(wǎng)友的贊嘆和好奇。

作為人工智能、裸眼3D和現(xiàn)實增強技術(shù)的完美合體,這一次“數(shù)字人點火”,不僅開了大型運動會點火儀式數(shù)字化的先例,同時也讓數(shù)字人技術(shù)成為近期全球業(yè)內(nèi)外各界熱議的話題。

“數(shù)字人”并非新事物,降本增效是“老江湖”

雖說近幾年,數(shù)字人才大量出現(xiàn)在人們生活中,但其本身并不是近幾年才出現(xiàn)的新事物。其實,世界上第一個數(shù)字人問世,距今已有近60年了,而且在這幾十年時間里,它們一直在為我們服務。

早在上世紀60年代,波音公司就在飛機設計領域,開始使用一款名為“波音人”的數(shù)字人來充當人體工程學研究的人體模型。“波音人”不僅擁有人類的外形和常見的行為舉止,而且還能在人類設計的場景中模擬人的動作,甚至能跟外界進行交互并生成數(shù)據(jù)。基于這些數(shù)據(jù),設計師們可以對飛機駕駛艙設計做人體工程優(yōu)化,以便飛行員在駕駛飛機時,能操縱得更加得心應手。

此外,在汽車行業(yè),數(shù)字人也很早就得到了應用。其中,很多車企就在汽車碰撞安全測試中引入了數(shù)字人技術(shù)。比如,豐田汽車就曾經(jīng)開發(fā)過一款人體建模軟件“THUMS”。通過這款軟件,能夠構(gòu)建出非常接近人類外形、行為和反應,且具有不同性別、年齡、體型的“數(shù)字人”司機或乘客。用其做碰撞測試,不僅能收集到更加全面的信息,還能在確保測試效率和準確性的同時,最大限度降低測試成本。

可見,對于產(chǎn)業(yè)界而言,數(shù)字人本身并不新鮮,真正新鮮的是隨著成熟人工智能技術(shù)的加持,數(shù)字人實現(xiàn)了智能化。而今天的數(shù)字人,也已經(jīng)從早期的對于人類外形和行為動作的單向模仿,升級為對于人類思維模式的模仿、內(nèi)容生成和交互輸出。

今“數(shù)字人”非彼“數(shù)字人”

近兩年,隨著生成式AI技術(shù)的高速發(fā)展和應用普及,我們已然走進了與數(shù)字人共同生活的時代。從技術(shù)層面來講,今天的數(shù)字人跟早期的類似于“波音人”的數(shù)字人相比,還是有很大的區(qū)別的。

波音和豐田所開發(fā)的數(shù)字人,基于應用角度來看,只能算是用來做數(shù)據(jù)采集的模擬人體,頂多算是一種簡單的人的數(shù)字孿生,說是數(shù)字人就顯得有點牽強。

就定義而言,按照中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟發(fā)布的《2020虛擬數(shù)字人白皮書》中的描述,虛擬數(shù)字人必須要滿足以下三個標準,即一要擁有2D或3D的人類外觀;二要擁有如語言、表情、動作等的人類行為;三要擁有人類的思想,比如識別、交互等能力。

而按照這個標準,像“波音人”、用豐田“THUMS”軟件打造的數(shù)字人,就不能算作數(shù)字人,因為它們不僅沒有人的外觀和行為,也不能識別外部環(huán)境且與人交互。而今天的數(shù)字人,則能夠具備逼真人類形象和人工智能。

比如,利用AI語音生成技術(shù)和逼真的表情、動作生成技術(shù),能讓數(shù)字人在交流、演講和播報中更富有表情和感染力,另外通過大語言模型的加持,也讓數(shù)字人具備了可以根據(jù)用戶留言而給予相應回應的能力,而“數(shù)字患者”、“數(shù)字健康顧問”的出現(xiàn),也讓數(shù)字人能為用戶提供仿真的醫(yī)療場景。

自2022年起,國內(nèi)很多企業(yè)就已經(jīng)成為智能客服技術(shù)應用的“弄潮兒”,開始“雇傭”數(shù)字人員工了。當你在線跟企業(yè)客服人員溝通,或者登錄企業(yè)線上營業(yè)廳,辦理各項業(yè)務的時候,在另一邊跟你對話打交道的,就很有可能是一個數(shù)字人。

在今年7月舉辦的“2023世界人工智能大會”期間,上海市經(jīng)信委、上海市產(chǎn)業(yè)技術(shù)創(chuàng)新促進會聯(lián)合深蘭科學院共同發(fā)布了國內(nèi)第一份《2023數(shù)字智能產(chǎn)業(yè)系列報告:個人數(shù)字化》白皮書。該白皮書就提出了數(shù)字人的發(fā)展分為內(nèi)容數(shù)字化、人的數(shù)字化和生命數(shù)字化三個階段,并從個人的數(shù)字交互、數(shù)字孿生、數(shù)字存儲這三個維度,展望了數(shù)字人產(chǎn)業(yè)發(fā)展的前景。

由此可見,今天的數(shù)字人產(chǎn)業(yè),儼然已經(jīng)站在了數(shù)字經(jīng)濟產(chǎn)業(yè)舞臺的C位。

近階段爆火的“數(shù)字人”,你都知道哪些?

在AI科技迅速發(fā)展的大環(huán)境下,數(shù)字人作為典型代表產(chǎn)物,其商業(yè)化也進入了快車道,眾多科技企業(yè)紛紛入局。根據(jù)企查查數(shù)據(jù)顯示,目前國內(nèi)與數(shù)字人產(chǎn)業(yè)相關的企業(yè),數(shù)以十萬計。產(chǎn)品大致可以按應用、技術(shù)、呈現(xiàn)方式三個層面劃分,總計七大類;如按屬性劃分,則可分為

從應用層面,數(shù)字人主要分為服務型、表演型和身份型三大類。

其中服務型數(shù)字人強調(diào)的是功能屬性,主要是為大眾提供各種服務,如虛擬客服、主播、導游等,也包括具有陪伴、關懷價值的虛擬助理、顧問等,基本面向B端客戶,主要起降本增效、助力營銷的作用。

如2022年,商湯科技為寧波銀行專門打造的數(shù)字員工“小寧”,就屬于這一類數(shù)字人。據(jù)介紹,“小寧“是基于商湯原創(chuàng)的“虛擬IP解決方案”及多種領先的AI技術(shù)打造的,可以自主從事直播、運營及互動,實現(xiàn)了全天候的“用戶觸達”。而深蘭科技為武漢江漢路步行街智慧化升級項目打造的數(shù)字主理人“江妮”也屬于這一類。

表演型數(shù)字人強調(diào)的是偶像屬性,當前主要是被應用在娛樂、社交、辦公場景中,如各類虛擬偶像、明星虛擬分身等,相較于服務型數(shù)字人,其更具流量吸引力和商業(yè)想象空間。

在今年大年初一《廣東衛(wèi)視春節(jié)晚會》上,與鐘鎮(zhèn)濤、炎明熹一同演唱歌曲《財神到》的陳水若,就是基于AI平臺“小冰框架”生成的一位擅長中國風曲目的AI數(shù)字歌手。

而身份型數(shù)字人則是強調(diào)身份屬性,即現(xiàn)實世界中的“真人”在虛擬空間、元宇宙中的ID,也被稱為個人數(shù)字分身。不同于前兩種數(shù)字人,身份型數(shù)字人主要面向個人用戶,其瞄準的也是最具市場想象力的個人數(shù)字化產(chǎn)業(yè),當前主要用于社交、辦公等場景,未來具有廣闊的應用場景和發(fā)展前景。

在前不久召開的“ 2023‘科創(chuàng)的力量‘無疆首屆高新科技產(chǎn)業(yè)資本峰會”上,宣布在全國范圍內(nèi)招募合伙人的“深蘭硅基大腦SaaS平臺”,就是深蘭科技基于硅基知識大模型開發(fā)的一款服務于個人數(shù)字化的數(shù)字人生成產(chǎn)品,它可以記錄個人的日常數(shù)據(jù),并用于數(shù)字人的領域知識和個性化人設等高維定制化訓練。用戶通過該平臺快速構(gòu)建的ChatGPT級別AI數(shù)字人,就屬于身份型數(shù)字人。

從技術(shù)層面,數(shù)字人則可以分為真人驅(qū)動型和智能驅(qū)動型兩大類。

真人驅(qū)動型數(shù)字人是采用“CG建模+真人動作捕捉”方式構(gòu)建,在完成建模和關鍵點綁定后,數(shù)字人可以通過設備捕捉真人的動作、表情、語言等,并以此為驅(qū)動,完成相應表演、互動。其可以看作是傳統(tǒng)影視制作CG技術(shù)的延續(xù),強調(diào)“人機耦合”,技術(shù)相對成熟,尤其隨著近些年算法進步以及高清動作捕捉設備的使用,攻克了在穩(wěn)定流暢地捕捉和展示真人微表情、微動作上的技術(shù)難點,這使其成為當前最常用數(shù)字人。如使用騰訊智影視頻生成平臺塑造的數(shù)字人,就是屬于這一類。

智能驅(qū)動型數(shù)字人,則是依托多模態(tài)大模型技術(shù)來驅(qū)動眼、眉、嘴等人體部位,以此讓數(shù)字人展現(xiàn)出比肩真人的動作、表情乃至記憶、思想等,形成獨特“人設”和技能,自主完成內(nèi)容輸出以及與外界互動。該類數(shù)字人主要基于知識圖譜進行服務,目前大都以“工具人”身份出現(xiàn),例如虛擬客服、虛擬助手、虛擬導游等。

單就技術(shù)而言,由于完全智能驅(qū)動型數(shù)字人在人設、思想、記憶及主動互動與輸出等方面,有著很高的技術(shù)要求,因此開發(fā)這一類數(shù)字人的平臺,大都還處于技術(shù)攻堅階段,只有少數(shù)企業(yè)取得了突破性進展,而那些真正有部分認知能力且可實現(xiàn)智能交互的數(shù)字人,也是最近才開始商用的。前面提到的通過“深蘭硅基大腦SaaS平臺”打造的數(shù)字人,如果按技術(shù)層面來劃分,也可以劃歸這一類。

從呈現(xiàn)方式層面,虛擬數(shù)字人主要分為卡通型和超寫實兩類。

卡通型數(shù)字人突出的是虛擬屬性,其雖然具有語言、動作、表情等人的行為模式,但它的一切皆為虛構(gòu),在現(xiàn)實世界中根本不存在。這一類數(shù)字人其實從動畫影視出現(xiàn)那天,就已經(jīng)出現(xiàn)了,它的優(yōu)勢主要體現(xiàn)在易制作、產(chǎn)量大、成本低上。因此,目前這一類數(shù)字人主要還是出現(xiàn)在二次元、游戲、卡通動畫中。

而超寫實數(shù)字人突出的則是數(shù)字資產(chǎn)屬性。作為當前數(shù)字人主流發(fā)展方向和未來個人鏈接元宇宙場景的重要工具,其從一開始就繞開了“二維”和“卡通”,通過精細設計并由技術(shù)合成,且自帶高清人物建模以及專屬服飾和場景,為的就是盡可能貼合現(xiàn)實世界中的真人形象。

如在2月召開的“2023全球人工智能開發(fā)者先鋒大會”上,以AIGC首席架構(gòu)師身份發(fā)表演講的百度AI數(shù)字人希加加;使用商湯“如影”平臺打造的個人數(shù)字分身;用戶通過每經(jīng)科技自主研發(fā)的“雨燕智宣”平臺生成的數(shù)字主播等,都屬于超寫實數(shù)字人。

而如果按照產(chǎn)品屬性來劃分的話,則可以分為成品和工具平臺兩大類。像AI歌手陳水若、百度AI數(shù)字人希加加、寧波銀行數(shù)字員工“小寧”等屬于成品類產(chǎn)品,而像“商湯如影”、“深蘭硅基大腦SaaS平臺”、每經(jīng)“雨燕智宣”這樣的,則屬于是工具平臺類產(chǎn)品。

數(shù)字人和數(shù)字人生成平臺舉例

“數(shù)字人”脫胎換骨,“數(shù)智人”呼之欲出

總的來說,國內(nèi)數(shù)字人產(chǎn)業(yè)目前正處于加速發(fā)展期,越來越多的科技企業(yè)在這一領域布局,越來越多的數(shù)字人產(chǎn)品在各行各業(yè)落地,整個產(chǎn)業(yè)呈現(xiàn)出一片欣欣向榮的發(fā)展局面。據(jù)前瞻經(jīng)濟學人預計,2027年市場體量或達到300億元,2022-2027年行業(yè)整體年復合增速或達到30%。

當前,AI技術(shù)驅(qū)動多模態(tài)輸入感知、多模態(tài)交互能力不斷完善,ASR、NLP、TTS、STA、情感計算等技術(shù)已經(jīng)取得突破,數(shù)字人已經(jīng)開始擔負起連接人與AI的新型交互接口的角色,成為元宇宙中各類“人”與事物之間產(chǎn)生聯(lián)系或發(fā)生孿生關系的新介質(zhì)。

因此,像虛擬IP與虛擬化身這兩類身份型數(shù)字人,它們在內(nèi)容創(chuàng)新空間和應用開發(fā)潛力上的優(yōu)勢將更加明顯,有望在電商、直播、營銷等領域得到廣泛應用。

未來,隨著數(shù)字人所具備的人的形象、性格、行為特征以及類人的互動能力不斷提升,大模型技術(shù)的不斷加持,數(shù)字人將進一步向具有人類意識的“數(shù)智人”方向發(fā)展。在不改變業(yè)務邏輯的情況下,“數(shù)智人”可以與更多的行業(yè)場景進行深度結(jié)合,產(chǎn)生千行千面的數(shù)字人業(yè)態(tài),從而向用戶提供更好的陪伴。

總而言之,雖說現(xiàn)階段數(shù)字人產(chǎn)業(yè)仍處于發(fā)展初期,但未來隨著技術(shù)的突破、應用門檻的降低,市場體量的增大,數(shù)字人必將走進我們的生活,走進千家萬戶。

正所謂:一切皆有可能,萬事皆可期待。

本文系作者 AI產(chǎn)業(yè)研究中心 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • AI主播是數(shù)字人主播嗎,他倆的概念一樣嗎,如果不一樣怎么區(qū)分

    回復 2023.10.13 · via iphone
  • 數(shù)字人不是一個大的同質(zhì)群體。每個人都應該擁有一個與眾不同的好看的數(shù)字人形象

    回復 2023.10.13 · via pc
  • AI科技發(fā)展會使21世紀的人們擁有更多的空閑時間,說明科技的進步,如自動化,智能化等,可以提高工作效率

    回復 2023.10.13 · via pc
  • 作為一個communist,我樂見AI無人化大生產(chǎn)成型,這將為社會主義打下堅實的基礎

    回復 2023.10.12 · via h5
  • 我覺得通用大模型后期可能也會發(fā)展到術(shù)業(yè)有專攻

    回復 2023.10.12 · via pc
  • 數(shù)字化時代是發(fā)展的必然趨勢

    回復 2023.10.12 · via h5
  • 在虛構(gòu)的數(shù)字世界里,我們可以實現(xiàn)“身份變換”和“角色扮演”

    回復 2023.10.12 · via h5
  • 沒有辦法實現(xiàn)智能交互的都是廣播員

    回復 2023.10.11 · via pc

快報

更多

2026-03-31 22:59

靖因藥業(yè)遞表港交所

2026-03-31 22:54

Snap股價漲10%

2026-03-31 22:53

振江股份:擬定增募資不超10億元

2026-03-31 22:49

康美藥業(yè):擬1元轉(zhuǎn)讓全資子公司股權(quán)及相關資產(chǎn)

2026-03-31 22:49

伊朗稱將打擊中東地區(qū)與美高科技公司有關的企業(yè),包括蘋果、谷歌、特斯拉、微軟等公司

2026-03-31 22:39

LME倫銅漲1.0%,報12346.11美元/噸

2026-03-31 22:32

美股光通信、存儲板塊走高,閃迪漲超5.4%

2026-03-31 22:29

美股鋁業(yè)股續(xù)漲,世紀鋁業(yè)大漲超13%

2026-03-31 22:26

國家數(shù)據(jù)局:完善低空算力供給體系,加強低空領域算法研發(fā)

2026-03-31 22:20

國內(nèi)貴金屬期貨夜盤走高

2026-03-31 22:17

國家數(shù)據(jù)局:要加強低空數(shù)據(jù)資源體系建設,擴大公共數(shù)據(jù)資源供給

2026-03-31 22:14

奇瑞重啟 QQ 產(chǎn)品線:全新QQ3上市,起售價5.89萬元起

2026-03-31 22:11

TOP TOY國際集團有限公司遞表港交所

2026-03-31 22:07

焦點國際有限公司遞表港交所

2026-03-31 22:04

現(xiàn)貨白銀日內(nèi)漲幅擴大至5%,報73.64美元/盎司

2026-03-31 22:02

美國2月份的招聘人數(shù)降至480萬,創(chuàng)2020年4月來新低

2026-03-31 22:01

美國3月消費者信心指數(shù)91.8,預期87.9

2026-03-31 22:00

利弗莫爾中概股龍頭指數(shù)跌幅擴大至1.2%,文遠知行漲12%

2026-03-31 21:59

2025重慶公積金繳存超626億元,同比增4.28%

2026-03-31 21:59

美股高開高走,納斯達克指數(shù)漲超2%

8

掃描下載App