近期,生成式人工智能(AIGC)領(lǐng)域又涌現(xiàn)出多款創(chuàng)意十足的新應(yīng)用。

今天,鈦媒體AGI梳理了免費(fèi) AI “神器”系列第十四彈,共五款,其中不少產(chǎn)品再一次拓寬了我們對(duì)AI的想象力。

1、120秒超長(zhǎng)AI視頻模型——StreamingT2

產(chǎn)品信息:StreamingT2是由Picsart AI Research、UT Austin和Shi Labs的研究團(tuán)隊(duì)共同開(kāi)發(fā)的一款文生視頻模型,該模型突破了以往AI視頻長(zhǎng)度限制,可生成長(zhǎng)達(dá)2分鐘的長(zhǎng)視頻。StreamingT2的發(fā)布將視頻生成技術(shù)推向了新高度,也被稱(chēng)為Sora的強(qiáng)勁對(duì)手。

產(chǎn)品功能: StreamingT2V可以根據(jù)用戶的文字提示生成長(zhǎng)達(dá)120秒的長(zhǎng)視頻,同時(shí),StreamingT2V將條件注意力模塊(CAM)和外觀保持模塊(APM)核心構(gòu)架結(jié)合,使得生成的視頻與文本描述緊密相關(guān)且動(dòng)態(tài)連續(xù),展現(xiàn)高動(dòng)態(tài)效果和時(shí)間一致性。

此外,StreamingT2V的實(shí)現(xiàn)方法分為初始化、Streaming T2V生成和Streaming Refinement三個(gè)階段,保證了視頻生成的高質(zhì)量和高分辨率,并且StreamingT2V的高效能并不局限于特定的模型,這意味著隨著技術(shù)的進(jìn)步,視頻質(zhì)量還有進(jìn)一步提升的空間。

項(xiàng)目及演示:https://streamingt2v.github.io

論文地址:https://arxiv.org/abs/2403.14773

2、即插即用的視頻轉(zhuǎn)視頻框架——AnyV2V

產(chǎn)品信息:AnyV2V是一款無(wú)需訓(xùn)練,即插即用的AI視頻編輯框架,該框架由滑鐵盧大學(xué)、Vector Institute 和 Harmony.AI 團(tuán)隊(duì)共同開(kāi)發(fā),旨在幫助用戶簡(jiǎn)化視頻創(chuàng)作流程,提高視頻制作效率。

產(chǎn)品功能:AnyV2V不僅支持對(duì)源視頻進(jìn)行深度編輯與修改,還能按照輸入文本提示,主題或風(fēng)格等,生成對(duì)應(yīng)新視頻。

具體來(lái)看,AnyV2V將視頻編輯簡(jiǎn)化為了兩個(gè)主要步驟:首先,AnyV2V 可以插入任何現(xiàn)有的圖像編輯工具,從而支持多個(gè)視頻編輯任務(wù)。其次,AnyV2V 可以插入任何現(xiàn)有的圖像視頻模型,執(zhí)行 DDIM 反轉(zhuǎn)和中間特征注入,從而保持與源視頻的外觀和運(yùn)動(dòng)一致性。

此外, AnyV2V 還可以支持視頻編輯任務(wù),包括基于參考的風(fēng)格轉(zhuǎn)換、主題驅(qū)動(dòng)編輯和身份處理。

項(xiàng)目地址:https://tiger-ai-lab.github.io/AnyV2V/

論文地址:https://huggingface.co/papers/2403.14468

3、谷歌圖生視頻模型——Vlogger

產(chǎn)品信息:Vlogger是谷歌推出的一款圖生視頻技術(shù)框架,該框架是基于 MENTOR 數(shù)據(jù)庫(kù)訓(xùn)練而來(lái),數(shù)據(jù)庫(kù)中包含超過(guò) 80 萬(wàn)名人物肖像,以及累計(jì)超過(guò) 2200 小時(shí)的影片,使得VLOGGER可以生成不同種族、不同年齡、不同穿著、不同姿勢(shì)的人物視頻。

產(chǎn)品功能:用戶只需上傳一張人物圖片+音頻文件,就能實(shí)現(xiàn)讓人物開(kāi)口說(shuō)話,生成一段人像與音頻完美貼合且流暢的視頻,并能做到視頻中人物面部表情及肢體動(dòng)作都相當(dāng)自然且生動(dòng)。

團(tuán)隊(duì)成員表示,和業(yè)內(nèi)此前的同類(lèi)方法相比,VLOGGER最大的優(yōu)勢(shì)體現(xiàn)在不需要對(duì)每個(gè)人進(jìn)行訓(xùn)練、也不依賴于面部檢測(cè)和裁剪,并且生成的視頻很完整(既包括面部和唇部,也包括肢體動(dòng)作)等等。此外,Vlogger 還具有視頻編輯和翻譯等應(yīng)用,能夠讓人物閉嘴、閉眼,甚至進(jìn)行視頻翻譯。

項(xiàng)目地址:https://enriccorona.github.io/vlogger

4、文本轉(zhuǎn)視頻模型——Hotshot ACT-1

產(chǎn)品信息:Hotshot - ACT 1是一款由Hotshot Research開(kāi)發(fā)的文本生成視頻模型,該模型基于大規(guī)模高分辨率文本視頻語(yǔ)料庫(kù)訓(xùn)練,注重空間對(duì)齊、時(shí)間對(duì)齊和審美質(zhì)量,旨在為視頻創(chuàng)作者提供高質(zhì)量的視頻創(chuàng)作體驗(yàn)。

產(chǎn)品功能:用戶只需輸入文本描述,即可生成動(dòng)畫(huà)風(fēng)格的視頻。同時(shí)可以根據(jù)自身需求選擇不同的寬高比和分辨率輸出,定制化自己的視頻內(nèi)容。

體驗(yàn)地址:https://hotshot.co/act-one

5、AI視頻生成模型——Motion-I2V

產(chǎn)品信息: Motion-I2V是一款A(yù)I視頻生成模型,能夠根據(jù)一張靜態(tài)圖片生成連貫且可控制的視頻。

產(chǎn)品功能:能實(shí)現(xiàn)圖像到視頻的自動(dòng)轉(zhuǎn)換,能夠?qū)㈧o態(tài)圖像自動(dòng)轉(zhuǎn)換成連貫的動(dòng)態(tài)視頻,通過(guò)模擬圖像中對(duì)象的自然運(yùn)動(dòng),使靜態(tài)圖像動(dòng)起來(lái)。同時(shí)支持用戶精確控制視頻中的運(yùn)動(dòng)軌跡和運(yùn)動(dòng)區(qū)域,使得生成的視頻不僅流暢連貫,而且用戶可以通過(guò)簡(jiǎn)單的操作控制視頻內(nèi)容。

此外,基于其先進(jìn)的運(yùn)動(dòng)增強(qiáng)和時(shí)間注意力技術(shù),無(wú)需額外的訓(xùn)練樣本,Motion-I2V就能實(shí)現(xiàn)視頻風(fēng)格轉(zhuǎn)換,比如從現(xiàn)實(shí)風(fēng)格轉(zhuǎn)換成漫畫(huà)風(fēng)格。

項(xiàng)目主頁(yè):https://xiaoyushi97.github.io/Motion-I2V/

論文地址:https://huggingface.co/papers/2401.15977

(本文首發(fā)于鈦媒體APP,作者|章橙,編輯|林志佳)

 

本文系作者 林志佳、章橙 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

12:55

吉爾吉斯斯坦駐伊朗使館宣布暫停工作

12:54

香港證監(jiān)會(huì):2025年香港證券業(yè)盈利及交易額均創(chuàng)五年新高

12:47

中國(guó)汽車(chē)流通協(xié)會(huì):3月中國(guó)汽車(chē)經(jīng)銷(xiāo)商庫(kù)存預(yù)警指數(shù)為57.5%

12:39

360智能體發(fā)現(xiàn)OpenClaw高危漏洞,或波及全球17萬(wàn)實(shí)例

12:36

巴基斯坦副總理兼外長(zhǎng)達(dá)爾來(lái)華

12:30

保利物業(yè):2025年公司擁有人應(yīng)占年內(nèi)溢利同比增加約5.1%

12:23

聯(lián)想控股:2025年凈利潤(rùn)97.99億元,同比增長(zhǎng)28%

12:23

西班牙禁止涉美以打擊伊朗飛機(jī)飛越領(lǐng)空 白宮、魯比奧回應(yīng)

12:20

市場(chǎng)監(jiān)管總局、民政部發(fā)布新規(guī)規(guī)范殯葬領(lǐng)域明碼標(biāo)價(jià)

12:20

中信金融資產(chǎn)、紫光集團(tuán)等成立私募股權(quán)投資基金,出資額25億

12:14

工信部等九部門(mén):到2028年,物聯(lián)網(wǎng)核心產(chǎn)業(yè)規(guī)模突破3.5萬(wàn)億元

12:03

港股午評(píng):恒生指數(shù)跌0.51%,恒生科技指數(shù)跌0.94%

12:01

高盛:到2026年底金價(jià)或?qū)⑦_(dá)到每盎司5400美元

11:59

鴻泉技術(shù)回應(yīng):為“張雪機(jī)車(chē)”提供智能座艙等產(chǎn)品,并為其設(shè)計(jì)APP

11:58

字節(jié)AI編程產(chǎn)品TRAE SOLO獨(dú)立端上線

11:52

三部門(mén):到2028年,制修訂紡織工業(yè)多元適配、數(shù)字轉(zhuǎn)型、綠色低碳、健康安全等標(biāo)準(zhǔn)300項(xiàng)以上

11:49

鮑威爾:中東戰(zhàn)事推高通脹預(yù)期,美聯(lián)儲(chǔ)應(yīng)對(duì)選項(xiàng)有限

11:46

飛豬與韓國(guó)旅游發(fā)展局簽署合作備忘錄

11:45

兩艘中國(guó)巨輪順利通過(guò)霍爾木茲海峽

11:44

A股午評(píng):創(chuàng)業(yè)板指跌超2%,CPO、煤炭、鋰礦等概念走弱

掃描下載App