圖片來源@視覺中國
鈦媒體注:本文來源于微信公眾號TopKlout克勞銳(ID:TopKlout),作者 | 白羊,鈦媒體經(jīng)授權發(fā)布。
今年,數(shù)字人在直播電商行業(yè)徹底火了。
伴隨著數(shù)字人主播大規(guī)模應用,國內上演起了“百模大戰(zhàn)”,低至百元的數(shù)字人也成了一門火熱的生意。而數(shù)字人的另一面,是不確定的使用效果、平臺不斷加強的監(jiān)管、被割韭菜的追風者、市場的質疑聲等。
數(shù)字人為何能夠成為一種風潮?數(shù)字人的發(fā)展前景究竟如何?未來數(shù)字人行業(yè)的發(fā)展將走向何方?
今年,數(shù)字人在短視頻平臺涌現(xiàn)。
短視頻中的虛擬形象往往會出現(xiàn)在一個精致的虛擬場景中,構建一個炫酷的內容宇宙,通過技術發(fā)掘了短視頻內容新的呈現(xiàn)方式。最具代表性的就是會捉妖的美妝達人“柳夜熙”,她的一條視頻容納了懸疑、劇情、美妝及后期特效等多種熱門的內容分類。各種圍繞柳夜熙的仿妝、cosplay等二次創(chuàng)作內容在平臺爆發(fā),她也一度成為了當時最具話題度的虛擬形象。
目前,抖音與快手是數(shù)字人應用較多的平臺,但兩個平臺對數(shù)字人的態(tài)度不同。
抖音對數(shù)字人有一定的管控,據(jù)抖音發(fā)布的《關于人工智能生成內容的平臺規(guī)范暨行業(yè)倡議》,使用人工智能技術輔助創(chuàng)作是被允許的行為,不違反平臺規(guī)范,并不會限制虛擬人直播技術。而快手目前沒有任何關于數(shù)字人方面官方性的說明,因此不少數(shù)字人供應商將主要聚焦在抖音直播賽道。
從內容角度來講,數(shù)字人直播領域分為兩個方向,一個是娛樂直播,一個是電商直播,而電商直播根據(jù)是否發(fā)快遞又分為本地生活直播和常規(guī)帶貨直播。
娛樂直播背后的載體是人與人之間情感的鏈接,目前2D數(shù)字人主播很難實現(xiàn)這一需求,而3D虛擬數(shù)字人已有A-SOUL等案例出現(xiàn)。在電商直播領域,本地生活直播間更多的是電子核銷券,用戶在直播間下單后到店消費。而帶貨直播則主要聚焦在品類較為單一的爆品直播間。
目前數(shù)字人主播驅動模式主要分為“純智能驅動模式”和“半真人驅動模式”。“純智能驅動模式”主要靠關鍵詞喚醒以及在線答疑實現(xiàn)用戶交互,針對直播中的常規(guī)高頻問題,關鍵詞喚醒不需要數(shù)字人主播回復,便可解決用戶問題。而在線答疑則是在數(shù)字人產(chǎn)品講解結束后,對此進行解答,雖然有一定的延時,但對用戶體驗并沒有太大影響。
而“半真人驅動模式”則在真人輔助下結合虛擬人技術實現(xiàn)互動。半真人驅動直播間前端是虛擬形象,背后是中之人,可以做到實時在線交互,與真人直播間的觀看體驗比較接近。此外,半真人驅動直播間另一種形式是使用中控,由運營在背后操控直播間。
例如去年,胡兵在抖音以自身的虛擬人形象上演了一場虛擬走秀,在不斷變換的場景下不間斷地展現(xiàn)了服裝的賣點和特征,通過深度的帶入,呈現(xiàn)了一場沉浸式的帶貨直播。
![]()
圖源抖音截圖
值得一提的是,按照當前技術的發(fā)展,數(shù)字人直播間通過調用大語言模型,在沒有真人輔助的情況下也能實現(xiàn)實時交互,但受制于平臺規(guī)則,這種類型的直播間并不被允許。
在短視頻領域,數(shù)字人應用的場景相對廣泛。比如在TOG方面,一些國企、央企內部有大量需要去視頻宣發(fā)的內容,但實際上很多地方容易重復性勞動。如果使用數(shù)字人,無需使用場地搭建團隊,也不用攝影、剪輯、編導等人員,在建模的時候可以批量的去輸出大量的內容,提高工作效率。
數(shù)字人同樣適用有個人IP的博主,博主復制數(shù)字分身后,便可以快速追熱點,不用受制于拍攝環(huán)境。
針對直播間與短視頻這兩個場景,2D數(shù)字人有著不同的收費標準。銀翼未來創(chuàng)始人熊大表示“我們公司應用在短視頻場景中的數(shù)字人使用費為每年8000元,其中包括真人形象克隆與一年的使用權益”,不過銀翼科技視頻場景中的數(shù)字人以時長收費,前半年期限內有500分鐘的免費時長,后半年則按照一分鐘20元收費。
而在直播場景,數(shù)字人的使用成本有所上升。通常而言,數(shù)字人供應商的主播形象分為公有庫和私有庫。如果使用公有庫的模板主播是6萬元一年,不過公有庫的主播會出現(xiàn)被多個客戶使用的情況,而平臺一但檢測到同一個faceID出現(xiàn)在不同的城市或直播間,那么數(shù)字人直播間可能會面臨被封控或者限流的情況。
![]()
圖源抖音截圖
為了規(guī)避主播“撞臉”給直播間帶來的風險,不少客戶會花費8000元進行形象克隆,這歸屬于客戶的私有庫,其他客戶不能被調用,一年的使用費用基本上為68000元。
降本是數(shù)字人最顯著的價值之一。對于數(shù)字人的應用第一節(jié)省了人員的成本,第二節(jié)省了一部分的培訓的成本。
舉例來看,在杭州一個主播每個小時的費用是300元至500元,再加上運營以及場控,單個直播間的一個月費用至少5萬元。如果算上采購燈光、相機等設備,以及租場地和布景的費用,還有其他的一些物料,直播間的成本還會更高。
而數(shù)字人直播間大大降低了成本。數(shù)字人供應商通過輸出一路信號,這路信號里面包括場景、主播、話術等,直播間通過窗口捕捉的形式,用OBS推流到抖音、快手、或者淘寶等平臺后就立馬可以開播,每個月的價格僅為2000塊錢左右。
在直播能力上,數(shù)字人可以實現(xiàn)超過真人的平均水平。但前提是優(yōu)質算力作為技術支撐,能做到聲畫同步,并且能夠與用戶互動。此外,運營的作用也十分關鍵,話術也是影響數(shù)字人直播效果的因素。優(yōu)質算力加上成熟運營才能構成高質量直播間。
魯班七號副總裁劉洋在采訪中表示:“與真人主播相比,數(shù)字人直播間的成本僅為它的1/25,本質上來講,只要數(shù)字人直播間的效果能夠達到真人主播的1/25,就不算差。”并且實測下來,數(shù)字人的效果能達到是真人主播的1/3或1/2,甚至比真人主播還要好,這就是當下的一個機遇,它以較低的成本解決了商家不能開播以及播不好的情況。
值得一提的是,魯班七號也布局了自己的本地生活直播間,每天的銷售額能達到幾萬元,雖然核銷率只有百分之二三十,再乘以15%左右的傭金,一個直播間每天也能賺千元,一個月的收入就是3萬。實際上它投入成本也就只有一臺電腦和軟件的使用費,綜合來看數(shù)字人有著較高的性價比。
目前數(shù)字人集中在品牌廣告客戶這一角色類型上。對于數(shù)字人直播帶貨的這個需求,品牌廣告客戶的購買力更強,接受度也更高,溝通成本也會更低一點。對于部分品牌來說,直播帶貨已經(jīng)成為了日常銷售渠道,無需進入頭部主播直播間,普通帶貨主播就能滿足品牌需求,而數(shù)字人主播可以起到平替的作用。
數(shù)字人的價值還體現(xiàn)在主播職業(yè)增強方面。對于頭部主播而言,數(shù)字分身可以填補主播休息時段,進一步提高時間利用率。
在數(shù)字人技術的加持下,直播間的場景能有更大的想象空間。通常情況下,真人直播間受制于物理條件因素,主播能夠展示的空間比較局限,場景比較單一。而數(shù)字人直播間可以做到近景遠景隨意切換,場景也更加多元化,給用戶沉浸式的觀看體驗。
在短視頻的場景,數(shù)字人能夠大大節(jié)省時間成本,它的工具價值已經(jīng)被驗證。劉潤的視頻號和分眾傳媒江南春已經(jīng)使用數(shù)字人技術。相較于真人錄音,數(shù)字人單個短視頻創(chuàng)作時間大約可以減少一個小時。而在還原度方面,通過聲音克隆訓練之后,只需要輸入文本就可以復刻真人的音色。值得一提的是,目前數(shù)字分身視頻制作時需要真人錄一小段音頻,以達到更好的音畫同步效果。
雖然數(shù)字人的價值正在被驗證,但數(shù)字人對行業(yè)各個參與方的影響不容忽視。
從主播的角度來看,在直播帶貨行業(yè),主播處于一個相對優(yōu)勢的位置,不管直播間的銷售額如何,主播薪資也有一定的保障。而如果數(shù)字人復制了主播的形象,對于公司而言,成本能夠降低,但主播則可能面臨收入縮減或者失業(yè)的風險,因此成熟的主播并不會積極參與建模。
具體來看,對于頭部主播而言,數(shù)字分身主播雖然能夠持續(xù)占據(jù)用戶視線,充分發(fā)揮主播的個人影響力,但在去頭部主播趨勢下,頭部主播一般會通過培養(yǎng)助播的方式加強直播間影響力,規(guī)避單一主播帶來的風險。對于腰尾部主播而言,有行業(yè)人士提到,“小主播剛入行不久,都希望通過自身的努力獲得更大的發(fā)展,更加愛惜自己的羽毛,基本上也不會使用數(shù)字分身”。
不過目前在直播帶貨領域,已有直播間通過明星肖象授權的方式進行帶貨。有網(wǎng)友發(fā)現(xiàn)在辰亦儒、朱梓驍?shù)让餍鞘跈嗟闹辈ラg,明星本人不出鏡,明星的數(shù)字形象進行效果展示,這也引起不少網(wǎng)友的不滿。有網(wǎng)友表示“明星賺錢本就相對容易,這樣更相當于躺著數(shù)錢,實在是難以接受。”可見,數(shù)字分身的應用價值在理論上可行,但只有經(jīng)歷市場的考驗才能真正發(fā)揮實際意義。
![]()
圖源抖音截圖
從平臺的角度來看,數(shù)字人主播一旦大規(guī)模應用,會大大降低平臺的內容質量。數(shù)字人直播間風格千篇一律,甚至很多主播的形象都相同,平臺的內容質量難以保障。如果平臺的內容不具有吸引力,就會造成用戶流失,不管是平臺的廣告還是電商業(yè)務都會受到影響,營收更難以保證。因此短視頻平臺會對數(shù)字人直播間進行一定的限制,主要針對劣質的直播內容,當數(shù)字人的直播水平在自然人的平均線之下,就容易觸碰平臺底線。
從技術的角度來看,數(shù)字人的制作在行業(yè)并非難點,國內外不少大廠都有數(shù)字人模型的開源代碼,而數(shù)字人供應商只需要API接口就能使用。為了加強自身的競爭力,行業(yè)已經(jīng)開始卷向4K清晰度,以實現(xiàn)更逼真的效果。
不過,數(shù)字人目前難以與用戶之間建立較強的情感鏈接,這主要在于數(shù)字人主播與用戶之間的互動是單向的,數(shù)字人雖然能夠回復用戶的問題,但這種回復是機械的,數(shù)字人不能站在用戶的角度去思考和發(fā)問,因此難以產(chǎn)生持續(xù)性的互動。
從行業(yè)的角度來看,有行業(yè)人士表示,有一些數(shù)字人的廠家其實沒有認真在做產(chǎn)品,可能有割韭菜的嫌疑。他們利用一些人的知識盲區(qū),把數(shù)字人生意包裝成財富密碼,然后用發(fā)展代理的形式,收“追風者”五十萬甚至百萬的代理費,把數(shù)字人產(chǎn)品賣給一些從來沒有從事過短視頻生產(chǎn)和直播的這些人,本質上就是一個“擊鼓傳花”的游戲。
很多代理商交錢之后,找不到客戶,或者客戶沒有直播經(jīng)驗,應用起來比較困難,并要求代理商退款。而代理商發(fā)現(xiàn)數(shù)字人生意并非那么容易,并認為自己被數(shù)字人廠家欺騙,走上維權的道路,這也讓行業(yè)蒙塵。
實際上,數(shù)字人看起來成本低,不用太多資源,但還是需要較高的門檻。數(shù)字人直播間同樣需要“人、貨、場”匹配,并且有著各式各樣的玩法。對于沒有行業(yè)經(jīng)驗的人來說,通過直播間起號是比較困難的事情,如果沒有流量,直播間的存在就沒有意義。
并且目前市場上沒有爆款數(shù)字人直播間出現(xiàn),很多數(shù)字人直播間的在線人數(shù)可能一直都是在十個人左右,這并不利于行業(yè)的長久發(fā)展。因為數(shù)字人廠商在拓展市場時,需要有優(yōu)質案例作為支撐,而客戶看不到預期效果,就會對數(shù)字人持懷疑態(tài)度。甚至有客戶表示,不期望能賺多少,能不能收回投入的成本是最先考慮的問題。數(shù)字人在推廣落地時的困難很大程度上影響了行業(yè)的發(fā)展。
有行業(yè)人士透露“不少數(shù)字人供應商認為市場已經(jīng)成熟,還擴大團隊規(guī)模準備大干一場,但現(xiàn)實情況卻重重受阻,不得不進行戰(zhàn)略收縮,某頭部數(shù)字人供應商的團隊人數(shù)已經(jīng)從六百多人縮減到三百多人。”
在數(shù)字人供應商與客戶之間,需要更多服務商出現(xiàn),不管是提供代運營還是培訓業(yè)務,服務商能夠解決應用時的困難,也是推動行業(yè)向前發(fā)展的關鍵一環(huán)。
數(shù)字人的應用是越來越明顯的趨勢。體現(xiàn)在行業(yè)側,越來越多的相關方參與其中,數(shù)字人更加多元化。就比如硅基智能與謙尋成立了一個合資公司。硅基智能作為技術提供方,謙尋作為直播電商運營服務方,在一定程度上解決了數(shù)字人技術與實際運營情況之間割裂的問題。
而硅基智能還與樂華成立了一個合資公司,進行明星虛擬形象授權業(yè)務,并投入到直播帶貨領域。目前,樂華旗下的一些藝人已經(jīng)試水。在抖音也能看到一些明星虛擬形象授權的直播間。
而在3D數(shù)字人領域,阿里達摩院和京東技術已經(jīng)成熟,更多聚焦在本地生活和文旅類目。而在2D真人領域,硅基智能屬于頭部,食品類目和生活類目應用較多。
數(shù)字人目前面臨最大的挑戰(zhàn)就是平臺的規(guī)則。比如像抖音、淘寶、視頻號這些平臺,相對來說規(guī)則束縛比較多,這其實會限制探索數(shù)字人的價值。比如虛擬人直播間要去官方報白名單,不然大概率會被限流,甚至被封禁,這個也是市場里許多參差不齊的數(shù)字人供應商會遇到的問題。
數(shù)字人雖然是“主播”的角色,但與主播性質完全不同,數(shù)字人的本質是SaaS軟件,考量的標準是數(shù)字人供應商穩(wěn)定服務的能力,對銷售額不用負責。而主播的考核與銷量、銷售額、場觀等指標密切相關。
并且數(shù)字人解決不了直播全鏈路的問題。因為直播間“人、貨、場”是一個很復雜的場景,數(shù)字人今年只是解決了人的這個部分,貨盤以及直播間的運營策略,每一個團隊需要各顯神通,各自解決自己的問題。
總的來看,數(shù)字人看似十分火熱,但應用場景相對固定,需求市場仍未成熟,行業(yè)還處于初步發(fā)展期。并且數(shù)字人主播脫離現(xiàn)實生活,沒有背景支撐以及鮮明的性格特色,難以與用戶之間建立信任關系,直播間很難脫穎而出并擴大影響力。未來,數(shù)字人能否在交互方面有創(chuàng)新性的突破?最終會以什么角色融入短視頻和直播帶貨行業(yè)?這些都值得期待。
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論
這玩意玩玩還行,真帶貨不行吧
它們具有真人無法比擬的優(yōu)勢,比如可以24小時不間斷工作、隨時隨地與觀眾互動
雖然數(shù)字人的制作成本較高,但是隨著技術的不斷進步和普及,制作成本也在逐漸降低
其實數(shù)字人有點沒有誠意
隨著科技的進步,數(shù)字人已經(jīng)成為直播電商行業(yè)的一種新趨勢。