板塊內(nèi)短劇游戲、手機游戲、多模態(tài)AI等多個板塊關聯(lián)公司都曾出現(xiàn)了股價的快速拉升。

一些公司在投資者互動平臺上回應了在文生視頻賽道的投入和動作,也引發(fā)了市場關注。比如因賽集團3月中旬在投資者互動平臺上表示,該公司正加大各項資源投入,推動文生視頻相關營銷應用產(chǎn)品于3月底、4月初開放體驗。

去年12月該公司宣布推出營銷行業(yè)的多模態(tài)垂直模型InsightGPT。據(jù)其提供信息,該模型的能力除了文生圖外,還具備文生文、視頻智能剪輯、圖生視頻等功能,并已在開發(fā)文生視頻功能。

此外,上市公司萬興科技也宣布其推出的聚焦數(shù)字創(chuàng)意垂類創(chuàng)作場景的音視頻多媒體大模型具有文生視頻能力。易點天下則稱,旗下的AIGC數(shù)字營銷創(chuàng)作平臺KreadoAI,基于文生視頻的數(shù)字人口播視頻制作功能,創(chuàng)意營銷短視頻,已被廣泛應用于廣告營銷多種場景。

大熱概念下,這些公司的股價飆升。以因賽集團為例,它的股價2月8日最低點僅為21.12元,經(jīng)過一個多月狂飆,3月25日收盤價達到了64.52元。

互聯(lián)網(wǎng)大廠也有動作。不同于一些上市企業(yè)從數(shù)字營銷領域來挖文生視頻技術的潛力,短視頻平臺的動向更偏重于對自身平臺能力和生態(tài)角度出發(fā)動作。

2月初,字節(jié)旗下剪映海外版Capcut的AI生成視頻功能開放公測。另一平臺快手也于近日透露了在文生視頻技術的布局。

快手首席執(zhí)行官程一笑在幾天前的業(yè)績電話會上稱,快手已于去年底推進專項研發(fā),“我們認為對短視頻生態(tài)是巨大的機會,未來會把生成模型和生產(chǎn)者工具結合起來,幫助創(chuàng)作者降低創(chuàng)作門檻,提升短視頻制作質(zhì)量和效率。”

平臺企業(yè)和上市公司之外,創(chuàng)業(yè)公司中則有玩家打出了國產(chǎn)版Sora概念產(chǎn)品。3月6日七火山發(fā)布了其結合Sora路線迭代的Etna文生視頻模型。據(jù)介紹,這個模型支持生成8~15秒時長的視頻,視頻質(zhì)量每秒60幀。

而3D數(shù)字人創(chuàng)業(yè)公司魔琺科技也于近期舉行了AI戰(zhàn)略分享會。

去年8月,魔琺科技在其3D虛擬人AIGC消費級產(chǎn)品發(fā)布會上就推出過魔琺有言視頻AIGC平臺 。

魔琺科技創(chuàng)始人兼CEO柴金祥介紹,目前有言的AIGC能力包含三維動畫、 三維超寫實形象、三維運鏡和聲音,能夠一鍵生成場景、運鏡、動畫、聲音等元素,已在培訓、電商、金融、快消、廣電等多個行業(yè)場景里有落地應用。

總體來看,不同于Sora在創(chuàng)業(yè)類場景里的挖掘,目前國內(nèi)企業(yè)的動向偏向已有產(chǎn)品的能力升級和ToB場景的應用挖掘。

視頻AIGC的不同路徑

從公開資料看,國內(nèi)企業(yè)目前入局視頻AIGC賽道的,多數(shù)與OpenAI的Sora的技術路線并不一致

OpenAI在官網(wǎng)透露過Sora的技術實現(xiàn)——“通過一次性為模型提供多幀的預測,我們解決了一個具有挑戰(zhàn)性的問題。我們正在教AI理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現(xiàn)實世界交互的問題。”

業(yè)界認為這種方法與之前ChatGPT的Scaling Law是一致的。360創(chuàng)始人周鴻祎點評,OpenAI實現(xiàn)了用一個架構對文字、圖片、視頻、音頻進行統(tǒng)一處理。他認為,過去很多多模態(tài)模型是縫合怪,一個模型處理圖片,一個模型處理視頻,模型之間互相不能打通。而OpenAI的Sora則依然和之前的ChatGPT是一種路線,他認為這種大力出奇跡的方式,通過大量提升訓練參數(shù)的量級,實現(xiàn)了令人驚艷的效果

此前海外的玩家Pika和Runway基本也走的是利用大規(guī)模語料素材去訓練,而后預測生成的路線,國內(nèi)的玩家里目前七火山也走了這條路。

有媒體分析,Etna和Sora同樣采用了Diffusion+Transform架構,同時Etna加入了處理高分辨率視頻時更高效,有助于減少計算資源和內(nèi)存的需求的卷積神經(jīng)網(wǎng)絡層。

觀察人士分析,七火山是從算力投入和商業(yè)層面考量,追求更高的分辨率和幀數(shù),舍去了生成更長視頻的可能。因而它在對外公開的特色上強調(diào)生成視頻的幀數(shù)和分辨率超過了Sora。

多數(shù)國內(nèi)的文生視頻玩家走的不是這一條路。比如因賽集團,從此前因賽集團對外釋放出的信息來看,他們的做法偏向從素材查找、內(nèi)容管理和視頻剪輯等核心環(huán)節(jié),利用AIGC技術解決傳統(tǒng)視頻處理方式費時繁瑣等難題,而非預測生成。

魔琺科技創(chuàng)始人柴金祥則從2D視頻和3D視頻的應用場景角度來區(qū)分了該公司的AIGC視頻產(chǎn)品有言和Sora之間的差異。

柴金祥介紹,目前,Sora生成的內(nèi)容雖然有些場景看上去很立體,但他認為Sora并沒有嵌入游戲引擎,知識訓練時學習了一些3D場景的數(shù)據(jù),這些視頻的類型還是2D場景。

而魔琺有言生成的視頻,通過物理引擎渲染完成,放在vision Pro里,直接能看3D內(nèi)容。未來隨著空間計算時代的到來,三維內(nèi)容相比2D視頻內(nèi)容能帶來更好的沉浸感和體驗。

同時,目前Sora生成的視頻,更偏創(chuàng)意類的視頻,這一類視頻容錯率高,同樣的文本可以生成出100個版本的內(nèi)容。

但柴金祥認為,除了創(chuàng)意類視頻,視頻生成類場景當下還有大量的需求來自以高密度信息傳遞為主的企業(yè)級場景。

例如,企業(yè)內(nèi)外部信息傳達的視頻制作需求,其中涉及到企業(yè)形象和產(chǎn)品信息傳遞。這些視頻里的信息密度特別大,同時企業(yè)通常要求輸出的內(nèi)容高度可控,能編輯和調(diào)整,目前他們的產(chǎn)品有言也是從這個場景切入市場。

產(chǎn)品化和落地潛力

Sora最新釋出的創(chuàng)意短片看起來已經(jīng)能表達出完整的創(chuàng)意內(nèi)容,但一些業(yè)內(nèi)人士認為,這個產(chǎn)品仍處于Demo和完善階段。

一位AIGC創(chuàng)業(yè)者點評稱,以黃氣球代替人臉可能是取巧的做法,Sora現(xiàn)在可能還不能很好支持人物面部的一致性,因為現(xiàn)階段模型依然很難完全理解現(xiàn)實物理世界的時空規(guī)律

還有人判斷,片子看起來像經(jīng)過了后期剪輯,不過由于它完整呈現(xiàn)了文字內(nèi)容的意義,整體看起來很有視覺沖擊力。

相比OpenAI從創(chuàng)意激發(fā)層面強調(diào)Sora的能力,國內(nèi)視頻AIGC領域里創(chuàng)業(yè)者們則非常重視和強調(diào)落地性。

柴金祥認為,國內(nèi)的大模型落地探索,對企業(yè)來說非常重要的一件事是PMF(Product Market Fit,指產(chǎn)品和市場達到最佳的契合點),要看企業(yè)能否找到與市場更契合的產(chǎn)品。

內(nèi)容生產(chǎn)工具賽道,過去十年,B端市場里有Canva、 Figma這樣的產(chǎn)品一旦到了產(chǎn)品和市場匹配,增長就很快。

目前,在國內(nèi)企業(yè)級市場的視頻生成場景里,柴金祥認為,能精準控制從人物形象、輸出的內(nèi)容和場景等各種信息,最終能生成高質(zhì)量的視頻的AIGC模式,更適合在企業(yè)端去落地,這些場景里信息密度一般比較高,信息需要精準。

柴金祥提及,國內(nèi)電商、短視頻和直播的應用生態(tài)領先全球,因此許多視頻AIGC場景也是從這些場景出發(fā),來尋找空間。

以他們此前服務B端客戶為例,一個超寫實虛擬人實現(xiàn)成本在幾十萬上下,幫客戶制作一條視頻成本往往要幾十萬元,并且時間周期要一兩個月,超寫實虛擬人直播成本就更高。因此市場就非常希望有更低成本來做信息傳達和營銷類視頻,魔琺科技目前的產(chǎn)品端也是在這個方向延伸。

“技術如果沒有轉(zhuǎn)變成產(chǎn)品,沒有給用戶帶來很突出的價值,很難獲得生存空間”,柴金祥說,目前視頻AIGC賽道規(guī)?;拈T檻很高,而技術做到產(chǎn)品化后,未來企業(yè)的成本可能更多是GPU成本,更容易實現(xiàn)規(guī)?;鲩L。

本文系作者 數(shù)智前線 授權鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

掃描下載App