今年9月,阿里率先在國(guó)內(nèi)發(fā)布音畫同步的視頻生成模型萬(wàn)相2.5,極大提升視頻創(chuàng)作的效率,在權(quán)威大模型評(píng)測(cè)集LMArena上,萬(wàn)相圖生視頻位居國(guó)內(nèi)第一。

此次發(fā)布的萬(wàn)相2.6進(jìn)一步提升了畫質(zhì)、音效、指令遵循等能力,單次視頻時(shí)長(zhǎng)實(shí)現(xiàn)國(guó)內(nèi)最高的15s,萬(wàn)相2.6新增了角色扮演和分鏡控制功能,不僅能一鍵完成單人、多人、人與物合拍的視頻,還能自動(dòng)實(shí)現(xiàn)多鏡頭切換等專業(yè)任務(wù),滿足專業(yè)影視級(jí)場(chǎng)景需求。

萬(wàn)相2.6是國(guó)內(nèi)首個(gè)支持角色扮演功能的模型,能參考輸入視頻中的角色外觀和音色、實(shí)現(xiàn)角色扮演,按照提示詞生成單人、多人、人與物合拍的視頻

據(jù)介紹,通義萬(wàn)相在模型結(jié)構(gòu)上集成了多項(xiàng)創(chuàng)新技術(shù),可對(duì)輸入?yún)⒖家曨l進(jìn)行多模態(tài)聯(lián)合建模與學(xué)習(xí),參考具有時(shí)序信息的主體情緒、姿態(tài)和多角度全面視覺特征,同時(shí)提取音色、語(yǔ)速等聲學(xué)特征,在生成階段作為參考條件控制,實(shí)現(xiàn)從畫面到聲音的全感官全維度一致性保持與遷移,目前萬(wàn)相可支持單人和多人的表演。

萬(wàn)相2.6可將用戶簡(jiǎn)單的提示詞轉(zhuǎn)換為多分鏡腳本,生成包含多個(gè)鏡頭的連貫敘事視頻,并且保持多鏡頭間的主體、場(chǎng)景等關(guān)鍵信息的一致性

在分鏡控制上,通義萬(wàn)相能通過高層語(yǔ)義理解,將原始輸入構(gòu)建為具備完整故事線與敘事張力的專業(yè)級(jí)多鏡頭段落,在多鏡頭絲滑切換的過程中保持核心主體、場(chǎng)景布局和環(huán)境氛圍統(tǒng)一建模,確保全片在內(nèi)容、節(jié)奏和氛圍上的高一致性。

萬(wàn)相2.6的角色扮演功能讓普通用戶也能在影視級(jí)畫面里表現(xiàn)精湛的演技。例如,用戶上傳一段個(gè)人視頻,并輸入一段科幻懸疑風(fēng)格的提示詞,萬(wàn)相2.6能快速完成分鏡設(shè)計(jì)、角色演繹、畫面配音等環(huán)節(jié)工作,生成一段鏡頭敘事完整、電影級(jí)運(yùn)鏡的短片,僅需幾分鐘就能幫用戶圓電影主角夢(mèng)。

面向廣告設(shè)計(jì)、短劇制作等專業(yè)場(chǎng)景,通過輸入連續(xù)提示詞,萬(wàn)相還能生成一段完整敘事的短片,讓人人都能當(dāng)導(dǎo)演。例如,輸入一段廣告創(chuàng)意的提示詞,萬(wàn)相2.6能生成一段包含人物角色和商品的廣告視頻,并且在多鏡頭切換的情況下保持主體、場(chǎng)景等關(guān)鍵信息的一致性。

即日起,所有人可直接在萬(wàn)相官網(wǎng)體驗(yàn)萬(wàn)相2.6,企業(yè)用戶還能通過阿里云百煉調(diào)用模型API,據(jù)悉,千問APP也將于近期上線該模型,并提供更豐富的玩法。目前,萬(wàn)相模型家族已支持文生圖、圖像編輯、文生視頻、圖生視頻、人聲生視頻、動(dòng)作生成、角色扮演及通用視頻編輯等10多種視覺創(chuàng)作能力,已廣泛應(yīng)用于AI漫劇、廣告設(shè)計(jì)和短視頻創(chuàng)作等領(lǐng)域。

轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接
聲明:文章內(nèi)容僅供參考、交流、學(xué)習(xí)、不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 生成視頻時(shí)環(huán)境氛圍也能統(tǒng)一,不會(huì)鏡頭切了感覺變場(chǎng)景

    回復(fù) 2025.12.17 · via pc
  • 多鏡頭切換時(shí)節(jié)奏把控得不錯(cuò),不會(huì)顯得突兀

    回復(fù) 2025.12.17 · via iphone
  • 聲音驅(qū)動(dòng)功能也好用,能讓生成的角色跟著聲音做動(dòng)作

    回復(fù) 2025.12.17 · via iphone
  • 能處理人聲生視頻、動(dòng)作生成這些,功能覆蓋得很全面

    回復(fù) 2025.12.17 · via pc
  • 現(xiàn)在萬(wàn)相官網(wǎng)就能體驗(yàn) 2.6,企業(yè)用戶還能通過阿里云百煉調(diào) API

    回復(fù) 2025.12.17 · via android
  • 多鏡頭敘事能構(gòu)建完整故事線,還有敘事張力,像專業(yè)團(tuán)隊(duì)做的

    回復(fù) 2025.12.17 · via iphone
  • 萬(wàn)相 2.6 還支持音畫同步和多鏡頭生成,說(shuō)是現(xiàn)在全球功能最全的

    回復(fù) 2025.12.17 · via iphone
  • 普通用戶傳段自己的視頻,輸入提示詞就能當(dāng)電影主角,幾分鐘搞定

    回復(fù) 2025.12.17 · via iphone
  • 萬(wàn)相模型家族能文生圖、文生視頻這些,有 10 多種視覺創(chuàng)作能力

    回復(fù) 2025.12.17 · via android
  • 多鏡頭生成時(shí)能保持主體場(chǎng)景一致,還能絲滑切換,很專業(yè)

    回復(fù) 2025.12.17 · via iphone
更多評(píng)論

快報(bào)

更多

12:30

IEA協(xié)同行動(dòng),釋放4.26億桶原油平抑伊戰(zhàn)油價(jià)

12:28

摩根大通和高盛向?qū)_基金提供做空私募信貸的工具

12:26

OpenAI再出手:計(jì)劃收購(gòu)Python工具初創(chuàng)公司Astral

12:18

長(zhǎng)達(dá)一年看空后,摩根大通宣布:戰(zhàn)術(shù)性轉(zhuǎn)為看漲美元

12:13

消息人士:馬斯克團(tuán)隊(duì)采購(gòu)光伏設(shè)備預(yù)計(jì)將在5月第一周發(fā)貨

12:11

也門胡塞武裝稱可能封鎖曼德海峽

12:10

港股午評(píng):科指大跌1.71%,小米、阿里領(lǐng)跌,黃金股反彈

11:55

高盛:預(yù)計(jì)英國(guó)央行今年不降息,明年逐步降至3%

11:54

星網(wǎng)宇達(dá):因投資收益列報(bào)錯(cuò)誤收監(jiān)管函

11:53

港股黃金股反彈,靈寶黃金、紫金黃金國(guó)際漲超7%

11:48

工商銀行提醒做好貴金屬市場(chǎng)風(fēng)險(xiǎn)防控

11:46

港股光伏太陽(yáng)能板塊走強(qiáng),鈞達(dá)股份拉升漲超10%

11:45

特斯拉計(jì)劃采購(gòu)中國(guó)光伏設(shè)備?企業(yè)回應(yīng):確有此事

11:43

A股午評(píng):創(chuàng)業(yè)板指半日漲3.3%刷新年內(nèi)新高,光伏、CPO概念股爆發(fā)

11:31

島上供電能力超4倍增長(zhǎng),220千伏潿洲島跨海聯(lián)網(wǎng)工程投運(yùn)

11:30

創(chuàng)業(yè)板指刷新階段高點(diǎn)

11:23

儲(chǔ)能概念持續(xù)走強(qiáng),首航新能、德業(yè)股份漲停續(xù)創(chuàng)歷史新高

11:19

創(chuàng)業(yè)板指漲逾3%,寧德時(shí)代等權(quán)重股大幅走高

11:15

中國(guó)人均體育場(chǎng)地面積達(dá)3.11平方米

11:14

美國(guó)白宮據(jù)稱不會(huì)實(shí)施原油出口禁令

37

掃描下載App