《巨蛇怪談》劇照

吉星快速切換到AI短劇創(chuàng)作背后,是一場圍繞AI影視創(chuàng)作在快速進行的技術迭代和產(chǎn)品更新。

2024年,Sora的橫空出世,可靈的跟進截胡,真正開啟了AI視頻賽道的競爭。截止2024年底,國內(nèi)已經(jīng)出現(xiàn)了20多款視頻大模型產(chǎn)品,阿里、騰訊、字節(jié)都參與其中。海外市場,Google、Meta等巨頭,還有Runway、Luma AI、Midjourney等創(chuàng)業(yè)公司也紛紛加入戰(zhàn)局。

在這一年,我們看到了《山海奇鏡之劈波斬浪》、《新世界加載中》等AI短劇的出現(xiàn)。雖然以現(xiàn)在的眼光來看,當時出現(xiàn)的這些作品都還存在諸多瑕疵,但是,從探索的角度已經(jīng)能夠讓人們用AI來講故事、創(chuàng)作影視作品了。

同時,我們還看到了更野心勃勃的探索,比如,Runway與獅門影業(yè)合作,要利用后者的影視作品資料庫定制視頻生成大模型。

也正是這些對技術可能性的初步驗證,讓人們對視頻大模型保持了更強的信心和期待。

進入2025年,視頻大模型的能力加速進化,人物一致性、細節(jié)效果上都有了明顯進步,從一開始的嘗鮮,向具備實際效果的生產(chǎn)工具過渡??伸`2.1、Google的Veo 3、字節(jié)的Seedance 1.0 pro等模型,在生成效果上都各有優(yōu)勢。生數(shù)科技最新發(fā)布的Vidu Q2模型則已經(jīng)開始強調(diào)對復雜表情的生成能力。

未來,當我們回顧AI技術對影視行業(yè)的影響時,Sora 2的發(fā)布一定會讓2025年成為有重要意義的節(jié)點。它就像此前爆火的Nano Banana一樣,讓人們看到了AI能夠理解真實世界,并在生成的視頻內(nèi)容中進行模擬的可能性。Sora 2不但生成的內(nèi)容更有真實感,還能連續(xù)生成復雜鏡頭。

P端是商業(yè)模式的重要支柱

視頻大模型的商業(yè)化落地也在隨技術能力的提升而加速,但這更多集中在B端和P端。

快手在9月公布的最新數(shù)據(jù)顯示,自今年4月推出2.0模型以來,可靈AI的月度付費流水持續(xù)突破1億元人民幣。新上線的可靈2.5 Turbo,價格降低了30%,以進一步提升對創(chuàng)作者的吸引力?;鹕揭嬉苍诤筒┘{影業(yè)等伙伴共創(chuàng),用AI技術解決行業(yè)痛點。

OpenAI推出的Sora App面向C端用戶,目前獲得邀請碼的用戶可以免費使用,但只能生成10秒、360P畫質(zhì)的視頻。一旦進行商業(yè)化,Sora App的付費用戶很有可能也會集中在P端,將生成的內(nèi)容面向全平臺分發(fā),更具工具屬性。

視頻大模型在包括影視行業(yè)內(nèi)的多個領域的落地應用、創(chuàng)造價值,進一步激發(fā)了資本的押注。9月,已經(jīng)有Vidu和愛詩科技兩家國內(nèi)的視頻大模型廠商拿到了融資。其中,Vidu完成了由博華資本領投的數(shù)億人民幣A輪融資,愛詩科技則拿到了阿里巴巴領投的6000萬美元B輪融資。

在Vidu、愛詩科技背后分別站著百度和阿里巴巴,這在一定程度上也可以理解為,巨頭們在發(fā)起AI視頻領域的代理人戰(zhàn)爭。Sora 2的刺激下,巨頭和資本可能會給視頻大模型廠商提供更多資源,使其能夠在更長時間內(nèi)維持模型能力迭代、創(chuàng)新探索扶持,并且可能會加速視頻大模型向影視、營銷等垂直行業(yè)的滲透。

同時,首尾幀、參考生視頻、靈動畫布等功能的更新,也讓視頻生成大模型更貼合P端創(chuàng)作者對視頻生成內(nèi)容的一致性和可控性的更高要求。

在此基礎上,我們看到,影視行業(yè)出現(xiàn)了更多追求商業(yè)化變現(xiàn)的AI短劇作品。吉星就是影視行業(yè)中被這波技術浪潮影響到,并選擇快速擁抱的一員。珀樂互動聯(lián)合Vidu創(chuàng)作的AI漫劇《明日周一》在全平臺上線后,也已經(jīng)收獲了超過1億觀看。

「今年大家都卯著勁想要有各自的商業(yè)化落地。」珀樂互動CEO楊晟表示,「我們今天最看重的東西其實是,能不能有更多的人去相信它,然后去嘗試。這個嘗試不怕失敗,試過之后才能慢慢培養(yǎng)出感覺?!?/p>

AI「煉丹」的效率提升了

影視行業(yè)積極擁抱視頻生成大模型的一個核心原因就是,AI「煉丹」的效率提升了。

利用AI創(chuàng)作視頻,往往需要先根據(jù)文字生成圖片,然后再利用圖片來生成視頻,這個不斷嘗試生成的過程,會被稱作「煉丹」或「抽卡」。提升煉丹效率,就是要追求用更低的嘗試次數(shù)生成自己需要的視頻。

「煉丹」效率的提升,有助于降低試錯成本。AIpai創(chuàng)始人、《山海奇鏡之劈波斬浪》導演陳坤印象中,去年Sora發(fā)布后,奧特曼在線上接單,根據(jù)網(wǎng)友提出的要求來生成視頻。確認一個要求后,過40分鐘才能發(fā)出生成結(jié)果。

「他不展示生成過程,我們不知道背后是跑了多少條才選出了最好的一個。作為用戶,我們是不能這么來做的?!龟惱け硎?。

楊晟的「勇于嘗試」,也是建立在視頻大模型有了更高的「煉丹」效率基礎上的。在《明日周一》制作過程中,團隊會先手繪原畫,然后再利用其生成視頻內(nèi)容。這樣做的「煉丹」效率是在1:1.3~1:1.5。楊晟期待,在第二季的創(chuàng)作過程中,能夠?qū)ⅰ笩挼ぁ沟男侍嵘?:1.1或1:1.2。

《明日周一》海報

對于楊晟和他的團隊來說,總結(jié)和復用之前的創(chuàng)作經(jīng)驗,讓團隊成員都能具備AI視頻生成的經(jīng)驗和手感,可以在一定程度上實現(xiàn)「煉丹」效率的提升,帶來產(chǎn)能的進一步爆發(fā)。

但放到全行業(yè)來看,「煉丹」效率的提升,還是需要依賴視頻大模型的能力和產(chǎn)品的提升。

一方面,視頻大模型的基礎能力影響生成效果,決定了「煉丹」效率的下限。如果下限太低,即便是有經(jīng)驗豐富的成員,團隊也難以高效生成相應的內(nèi)容。

在一年多前Sora和可靈發(fā)布時,我們讓AI生成一個吃面條的畫面都很困難,面條往往不是自然地通過咀嚼被吃進去的,而是會直接被無形的手塞進嘴里。

到了現(xiàn)在,我們再讓AI去生成吃面條的視頻時,畫面和動作的呈現(xiàn)已經(jīng)比之前更加自然。還有Veo 3引爆的切水果視頻,AI已經(jīng)能夠生成一個用刀切開橙子,然后汁水四濺的視頻效果了。

OpenAI發(fā)布的Sora 2的樣片中,有維京戰(zhàn)士乘著戰(zhàn)艦登陸冰面,還有一對情侶在煙花下交談。雖然這些樣片和用戶真正生成的效果之間還是有一定的差距,但也讓我們看到了用AI講出更好故事的可能性。原來生成一個5秒的視頻,可能只有0.5秒能用,現(xiàn)在可能可以直接生成一個復雜鏡頭構(gòu)成的橋段了。

另一方面,視頻大模型的工具生成的一致性和穩(wěn)定性,決定了「煉丹」效率的上限。影視行業(yè)在生成視頻時常用的工具就是「參考生視頻」與「首尾幀」。前者可以在生成打斗場面時,讓AI參考給出的動作分鏡來生成視頻,首尾幀則是確定了視頻的開頭和結(jié)尾,讓AI在這個過程中發(fā)揮更多創(chuàng)作性。

生數(shù)科技CEO駱怡航認為,參考生視頻其實是整個AI創(chuàng)作范式的底層功能,是從線下拍攝視頻到線上AI創(chuàng)作的一個本質(zhì)的創(chuàng)作流程和方式的轉(zhuǎn)變。Vidu在7月上線了Vidu Q1 參考生功能,支持用戶上傳七個主題,用其將人物、道具、場景等都定下來,無需經(jīng)過生圖、圖再生成視頻,直接一鍵根據(jù)參考圖直出視頻。

楊晟覺得參考生視頻功能的上線,是「科學家們開始傾聽行業(yè)的聲音了?!?/p>

他的印象中,最初的大模型廠商愛強調(diào)自身模型生成視頻的時長,但現(xiàn)實拍攝的長鏡頭其實是一個帶有復雜運動調(diào)度的鏡頭組合,這跟「時長」是兩個概念。時長增加是炫技,可能會生成很多不合用的素材;參考生視頻才真正滿足創(chuàng)作者的需求,給到了穩(wěn)定的生成。

被Adobe選擇的Ray3,則選擇了與參考生視頻不同的優(yōu)化邏輯。Ray3賦予了視頻大模型思維鏈推理能力,使其能夠思考指示、評估生成效果、規(guī)劃復雜場景的生成。用戶可以看到模型的工作步驟,并通過可視化的標注工具進行標注,告知其需要調(diào)整的具體細節(jié)。

影視工作流在出現(xiàn)新變化

視頻大模型基礎能力提升的基礎上,傾聽更多行業(yè)的需求聲音,是提升場景滲透率的有效路徑。

一個是我們上文提及的——將行業(yè)需要的基礎功能融入到視頻大模型的生成思路中,另一個則是尋找AI生成能力與原有行業(yè)流程相結(jié)合后,能夠產(chǎn)生怎樣的新變化。相較營銷廣告、社交娛樂小視頻,影視行業(yè)能夠在視頻領域沉淀出更廣泛適用的工作流。

首先,是影視創(chuàng)作界面的創(chuàng)新。

可靈在世界人工智能大會(WAIC)上發(fā)布的靈動畫布功能,就是在這個方向上的探索。與ComfyUI的形態(tài)相似,可靈也支持創(chuàng)作者在一塊畫布上添加不同的創(chuàng)作節(jié)點。這些節(jié)點會包含圖片生成、視頻生成、音樂生成等環(huán)節(jié),不同環(huán)節(jié)又可以同時生成多個分支,讓創(chuàng)作者更直觀地進行對比和挑選。

據(jù)可靈AI產(chǎn)品及運營負責人李楊的介紹,可靈團隊在調(diào)研中發(fā)現(xiàn),一位可靈的超級創(chuàng)作者在創(chuàng)作過程中會在電腦上打開無數(shù)頁面,在不同的AI工具之間來回切換游走,通過網(wǎng)盤和團隊伙伴互傳文件。然后可靈團隊就推出了靈動畫布,來一站式實現(xiàn)AI視頻的全鏈路創(chuàng)作和團隊協(xié)作。

Luma AI的最新模型Ray3則被應用在Adobe的AI產(chǎn)品Firefly中,期望借此讓好萊塢制片廠和電影制作人使用其創(chuàng)作AI畫面。這也是在結(jié)合一個新的影視創(chuàng)作場景。OpenAI則計劃在Sora界面中提供故事版(Storyboard)功能,讓用戶能夠逐個鏡頭的去生成和調(diào)整內(nèi)容。

其次,則是對傳統(tǒng)影視創(chuàng)作鏈路的優(yōu)化。

《明日周一》的創(chuàng)作過程會參考動畫的制作過程進行。整個團隊有10個人,用45天時間創(chuàng)作出50集AI漫劇,10個成員中,有2人負責AI視頻生成,剩下8人負責傳統(tǒng)動畫制作中的設定、分鏡等工作。具體的制作標準會追求接近頭部動畫作品,做到每分鐘內(nèi)容有80幀畫面。

AI的應用,首先減少了原畫師的工作量。《明日周一》中的空鏡畫面基本都有AI生成;在參考生視頻功能下,很多視頻內(nèi)容的尾幀也是不需要畫出來的。楊晟表示,《明日周一》的后半部分可能比原計劃少畫了三分之一的原畫。在《永恒宇航員》(The Eternaut)中,Netflix也實現(xiàn)了業(yè)內(nèi)首次對AI生成特效的大規(guī)模使用。

AI的應用,還省掉了中間環(huán)節(jié)?!缸鐾攴昼R之后就要進團隊,在導演和原畫師的帶領下開始畫具體的畫面,我們等于跳過了這個環(huán)節(jié),分鏡上色之后就直接生成視頻了?!箺铌山榻B道。

在真人影視內(nèi)容的創(chuàng)作中,AI也在提升一些環(huán)節(jié)的效率。導演薛曉路在可靈活動的分享中指出,傳統(tǒng)的拍攝模式下,要經(jīng)歷確定演員、確定分鏡頭、確定場景的流程。一個造型設計可能需要出多個版本的方案,花費十天時間來完成。用AI來做,在速度和有效性上都能有很大提升。

AI技術真正融入到影視行業(yè),可能會帶來新的想象力表達方式。「從最早前的煉丹、拆解Prompt,包括尋找三維和傳統(tǒng)影視當中的解決路徑,然后再到論文和算法,我會發(fā)現(xiàn)AIGC對于視聽行業(yè)的影響不僅是工具和流程上的變革,更是一種創(chuàng)作思路的牽引?!笰I短劇《新世界加載中》導演陳翔宇表示。

一鍵成片的時代還遠嗎

Agent能力的應用應該會是推動這種創(chuàng)作思路變化的關鍵一環(huán)。

愛詩科技在最新的更新中就推出了一項Agent能力。這個Agent很模版化,用來幫助用戶撰寫提示詞。用戶找到想要生成的模版,按要求填空,就能讓AI自動完成視頻生成過程。Ray3的推理能力一定程度上也可以被認為是具備一定的Agent屬性。

還有一些創(chuàng)業(yè)團隊想要打造一站式生成視頻內(nèi)容的Agent產(chǎn)品,讓用戶更低門檻地去講故事。

陳坤的AIpai和好耶科技推出的FilmAction都是這類產(chǎn)品。具體使用中,這兩個產(chǎn)品都支持選用不同的大模型,都可以完成腳本、分鏡到視頻、配樂的一整個流程。不同之處是,AIPai會先進行比較詳細的前期溝通,在溝通基礎上完成視頻,F(xiàn)ilmAction則會先生成視頻,再進行調(diào)整。

這類產(chǎn)品想要踩中兩個痛點:一個是普通用戶沒有傳統(tǒng)影視創(chuàng)作的經(jīng)驗和知識,在提示詞中往往不能講清楚自己的準確需求,也不擅長剪輯、寫劇本;另一個是,當下視頻大模型很難出現(xiàn)一家獨大的情況,創(chuàng)作者們都會按需選擇大模型來使用,但不是所有人都清楚地了解視頻大模型的最新技術進展。

「原來你可能只能生成單鏡頭的視頻,自己再去剪輯。但是這件事情對于普通人來講太難了。我們的產(chǎn)品會在一開始和你聊要做一個什么樣的東西,然后能做出來一個有故事性的片子,做更多自我表達?!龟惱け硎荆?strong>未來希望用戶能夠只關心自己如何生成內(nèi)容,而不必關心過程中會調(diào)用哪些模型。

AIpai界面

這種低門檻的視頻創(chuàng)作方式很容易讓用戶擁有一鍵成片的期望。好耶科技創(chuàng)始人吳杰茜告訴我們,Agent能力上線的一個月內(nèi),F(xiàn)ilmAction的用戶月活增長相當于過去一年的。在FilmAction的用戶作品中也能看到用戶蓬勃的表達欲,里面會有各種不同的題材。

吳杰茜認為,這樣的智能體現(xiàn)階段已經(jīng)能夠被用于AI短劇的創(chuàng)作。但如果想要創(chuàng)作更好的短劇內(nèi)容,還是需要具備專業(yè)經(jīng)驗的人來調(diào)教和使用AI。好耶科技目前也在做自己的短劇項目,在保證一定質(zhì)量的前提下,團隊成員人均一天能夠制作一到兩集的短劇。

FilmAction界面

真正AI創(chuàng)作流程比影視創(chuàng)作流程有時候還要來得慢一些,因為你面對的不是成熟的制作工業(yè)已有的制片體系,而是一組組不確定性很高的模型算法,所以你必須根據(jù)已有的或者自研技術去建立階段性的、不斷更新的AI制作體系,腳本、美術、動畫、算力儲備還有算法測試再到最終成片。」陳翔宇表示。

在一鍵成片的時代到來之前,AI在影視行業(yè)中會存在兩個相對獨立卻有交叉的進化路徑:一條是從創(chuàng)作者的層面來看,不斷加深對AI技術的理解,在AI技術與傳統(tǒng)經(jīng)驗中找到最佳結(jié)合點;另一條則是從技術層面來看,技術需要繼續(xù)走向成熟,讓AI生成的人物能夠有豐富的表情,做出特定的調(diào)度。

從Sora 2身上,我們看到了OpenAI在第二條進化路徑上的領先性,這給國內(nèi)的可靈、即夢、Vidu、通義等都帶來了一定的壓力。與其說人們在期待Sora衍生出一個AI抖音,不如說人們在擔憂字節(jié)在技術上沒有拿出與其行業(yè)地位相匹配的AI視頻技術和產(chǎn)品。

至于做出一個AI抖音,影響C端用戶的社交和表達習慣,可能真的需要等待一鍵成片的成熟。抖音已經(jīng)從手勢舞走向抖音精選,人們對AI視頻的起始期待就會是講好一個故事,僅靠客串這樣的模仿性功能,很難長時間維持用戶的新鮮感。

同時,也需要解決好視頻大模型的版權問題。有媒體通過測試認為,OpenAI的Sora的訓練數(shù)據(jù)包含了電影、Tiktok內(nèi)容和Netflix的節(jié)目內(nèi)容。華納兄弟、迪士尼和環(huán)球影業(yè)都以AI產(chǎn)品侵犯版權為由向Midjourney發(fā)起了訴訟。

目前業(yè)內(nèi)通行的方式,是通過原畫、定妝照等來盡量保證AI生成內(nèi)容的原創(chuàng)性。OpenAI在客串功能中增加了用戶授權的流程。但這都不是最好的方案。前者還是有很高的創(chuàng)作門檻,后者已經(jīng)暴露出了一定的短板。楊晟認為,當技術平權之后,決勝的將是內(nèi)容質(zhì)量,擁有ip和合規(guī)化數(shù)字形象變得格外重要。

未來服務于影視創(chuàng)作的一定是AI化的工具。不同于專業(yè)相機和傻瓜相機的區(qū)別,這個工具可能同時適用于C端、P端和B端用戶,帶來一種工具層面的普惠。但也會因需求不同、創(chuàng)作者能力不同,選擇不同的套餐,產(chǎn)生出不同的結(jié)果。很難實現(xiàn)創(chuàng)作沖動的普及,即便AI工具足夠好用,也不會是人人都有創(chuàng)作欲和表達欲。

一鍵成片如果實現(xiàn),那給影視行業(yè)帶來的可能不是人人都有攝像機的作品大爆炸,而是一套新的內(nèi)容生產(chǎn)體系和行業(yè)權力架構(gòu)。

本文系作者 窄播 授權鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

掃描下載App