近期,生成式人工智能(AIGC)領(lǐng)域又涌現(xiàn)出多款創(chuàng)意十足的新應(yīng)用。

今天,鈦媒體AGI梳理了免費(fèi) AI “神器”系列第九彈,共五款,其中不少產(chǎn)品再一次拓寬了我們對(duì)AI的想象力。

1、 字節(jié)版Sora:AnimateDiff-Lightning AI視頻模型

產(chǎn)品信息:AnimateDiff-Lightning是字節(jié)跳動(dòng)推出的文生視頻大模型,該模型是從AnimateDiff SD1.5v2中提煉出來(lái)的,包含了1步、2步、4步和8步提煉模型的版本。其中,2步、4步和8步模型的生成質(zhì)量非常好,為視頻創(chuàng)作者帶來(lái)更多了想象和助力。

產(chǎn)品功能:AnimateDiff-Lightning能夠根據(jù)文本描述生成視頻,比起原來(lái)的AnimateDiff模型,速度提升十倍以上。同時(shí)還可以與多種不同風(fēng)格的基礎(chǔ)模型結(jié)合使用,將現(xiàn)有視頻轉(zhuǎn)換成不同風(fēng)格的視頻。比如將現(xiàn)實(shí)風(fēng)格視頻轉(zhuǎn)換成動(dòng)漫卡通風(fēng)格,以滿足不同視頻風(fēng)格創(chuàng)作需要。此外,AnimateDiff-Lightning支持多步驟蒸餾模型,提供1步、2步、4步和8步的蒸餾模型,用戶可以根據(jù)自己的需求,在生成視頻的速度和質(zhì)量之間做出選擇,以平衡生成速度和視頻質(zhì)量。

體驗(yàn)地址:https://huggingface.co/ByteDance/AnimateDiff-Lightning?ref=top.aibase.com

論文地址: https://arxiv.org/html/2403.12706v1

2、開源SDXL動(dòng)漫模型——Animagine XL 3.1

產(chǎn)品信息:Animagine XL3.1是由海藝AI與Cagliostro Lab合作推出的一款開源動(dòng)漫文生圖模型。相較于V3.0版本,Animagine XL 3.1在各方面都進(jìn)行顯著的技術(shù)性提升,使其對(duì)動(dòng)漫作品和風(fēng)格的理解更加深入,為用戶提供更加強(qiáng)大的動(dòng)漫圖像生成體驗(yàn)。

產(chǎn)品功能:Animagine XL 3.1能夠根據(jù)文本提示生成高質(zhì)量動(dòng)漫風(fēng)格圖像。為了提高生成結(jié)果的準(zhǔn)確性,Animagine XL3.1采用了標(biāo)簽排序的方式,可以更準(zhǔn)確地根據(jù)輸入的標(biāo)簽進(jìn)行生成圖像,提高生成結(jié)果準(zhǔn)確性。同時(shí),Animagine XL 3.1擁有87萬(wàn)張圖片的數(shù)據(jù)集,極大增強(qiáng)了模型對(duì)各種動(dòng)漫角色的識(shí)別能力;引入全新概念“美學(xué)標(biāo)簽”,更新了質(zhì)量和年份標(biāo)簽,不僅提高了生成圖像的視覺(jué)吸引力,也確保圖像風(fēng)格一致性,符合更高要求的審美質(zhì)量標(biāo)準(zhǔn)。

此外,Animagine XL3.1還解決了3.0版本中的過(guò)曝問(wèn)題,提高了生成圖像的質(zhì)量。通過(guò)對(duì)算法和訓(xùn)練過(guò)程的優(yōu)化,該模型在生成圖像時(shí),能夠更好地控制圖像的亮度和色彩,從而避免過(guò)曝現(xiàn)象的出現(xiàn)。目前V3.0在Civitai的下載量超7萬(wàn)。

體驗(yàn)地址:https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1

模型下載地址:https://huggingface.co/cagliostrolab/animagine-xl-3.1?ref=top.aibase.com

3、視頻生成音效的AI工具——Optimizer AI

產(chǎn)品信息:Optimizer AI是一款可以為視頻自動(dòng)生成音效的AI工具,旨在提升游戲開發(fā)者、藝術(shù)家和視頻創(chuàng)作者工作效率,通過(guò)音效為視頻增添更多活力。

產(chǎn)品功能:首先,用戶輸入文字提示即可生成適用于視頻中各種場(chǎng)景的聲音和音效,包括游戲音效、動(dòng)畫背景音和視頻配樂(lè)。用戶還可以通過(guò)指定風(fēng)格標(biāo)簽(如卡通、恐怖等)來(lái)引導(dǎo)生成不同風(fēng)格的聲音。

其次,Optimizer AI支持聲音效果生成,包括變聲功能,能夠基于一個(gè)參考聲音生成多個(gè)類似的聲音。

再次,Optimizer AI可以生成用于背景音樂(lè)或創(chuàng)建特定氛圍的聲音,并能夠處理和理解文本的信息,保持生成的一致性的同時(shí)還可以生成時(shí)長(zhǎng)更長(zhǎng)的聲音效果。

最后,即將推出的視頻到聲音全面生成功能將允許用戶從視頻中直接生成聲音效果,進(jìn)一步擴(kuò)展聲音創(chuàng)作的可能性。

官網(wǎng)地址: https://www.optimizerai.xyz/

體驗(yàn)地址: https://discord.com/invite/bgfnVaaU2n

4、通過(guò)攝像頭追蹤在紙上就能彈鋼琴的AI應(yīng)用——Paper Piano 紙鋼琴

產(chǎn)品信息: Paper Piano(紙鋼琴)是一款通過(guò)攝像頭追蹤就能實(shí)現(xiàn)在任何一張白紙上彈鋼琴的AI應(yīng)用。Paper Piano(紙鋼琴)的工作原理是通過(guò)在紙上預(yù)定義不同區(qū)域來(lái)代表鋼琴鍵,當(dāng)攝像頭捕捉到手指觸摸特定區(qū)域時(shí),相應(yīng)的音符將被生成。

產(chǎn)品功能: 用戶只需準(zhǔn)備兩張A4大小的白紙模擬鋼琴鍵盤,Paper Piano(紙鋼琴)通過(guò)攝像頭跟蹤和手指識(shí)別技術(shù)捕捉用戶的手指移動(dòng),從而實(shí)現(xiàn)在紙上模擬鋼琴鍵按壓,奏出美妙音樂(lè)。值得注意的是,為了確保手指追蹤的準(zhǔn)確性,系統(tǒng)要求在網(wǎng)絡(luò)攝像頭的設(shè)置上注意角度、高度和距離,同時(shí)光線越強(qiáng),性能也會(huì)越好。

不過(guò),目前該項(xiàng)目尚處于支持最多兩根手指的階段,未來(lái)將支持更多手指和更高敏感度的訓(xùn)練模型,為用戶提供更豐富的演奏體驗(yàn)。這一技術(shù)的發(fā)展可能帶來(lái)更多有趣的音樂(lè)應(yīng)用,使用戶無(wú)需購(gòu)買真正的鋼琴即可享受演奏的樂(lè)趣。

體驗(yàn)地址:https://github.com/Mayuresh1611/Paper-Piano?ref=top.aibase.com

5、截圖轉(zhuǎn)代碼應(yīng)用——screenshot-to-code

產(chǎn)品信息:screenshot-to-code是一種基于人工智能技術(shù)的創(chuàng)新工具,旨在幫助開發(fā)人員將圖像或界面設(shè)計(jì)截圖轉(zhuǎn)換成可執(zhí)行的代碼。用戶只需上傳截圖,即可獲得整潔的網(wǎng)頁(yè)代碼,如HTML、Tailwind CSS和JavaScript等。

產(chǎn)品功能:首先是智能生成代碼,通過(guò)集成GPT-4Vision,該應(yīng)用程序能夠智能地分析截圖并生成相應(yīng)的HTML、Tailwind CSS和JavaScript代碼,提高用戶寫代碼效率。

其次是DALL-E3生成相似圖像,應(yīng)用程序不僅能生成代碼,還可以利用DALL-E3生成與原始截圖相似的圖像,增強(qiáng)用戶體驗(yàn)。

最后是實(shí)時(shí)代碼更新,用戶可以直接在應(yīng)用程序中查看生成的代碼,并在需要時(shí)通過(guò)與AI互動(dòng)指令,調(diào)整樣式或更新缺失的部分,以滿足其需求。

因其簡(jiǎn)單、高效的圖轉(zhuǎn)代碼功能,screenshot-to-code深受開發(fā)者和設(shè)計(jì)者歡迎,截至發(fā)稿,該應(yīng)用在GitHub平臺(tái)已累計(jì)超35000顆星。

體驗(yàn)地址:https://screenshottocode.com/

(本文首發(fā)于鈦媒體APP,作者|章橙,編輯|林志佳)

 

本文系作者 章橙 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

16:09

國(guó)投集團(tuán)納米級(jí)微振動(dòng)實(shí)驗(yàn)室投運(yùn)

16:05

美股中概股盤前漲跌不一,百度漲0.7%

15:57

國(guó)足無(wú)緣兩連勝

15:55

靈心巧手變更為股份公司,增資至9.2億元

15:45

中金普洛斯REIT 2025年總收入4.23億元

15:44

極智嘉2025年?duì)I收31.71億元,經(jīng)調(diào)整凈利潤(rùn)轉(zhuǎn)正

15:41

近5萬(wàn)美國(guó)人排隊(duì)申請(qǐng)入籍加拿大

15:29

上期所:4月3日(星期五)晚上不進(jìn)行夜盤交易

15:27

鄭商所:4月3日(星期五)當(dāng)晚不進(jìn)行夜盤交易

15:26

崔東樹:2026年1-3月新能源車免稅目錄共有19977款,其中3月有391款新車型

15:14

長(zhǎng)安汽車獲批L4級(jí)Robotaxi測(cè)試牌照

15:13

恒生指數(shù)公司與韓國(guó)交易所推出首個(gè)聯(lián)名港韓跨市場(chǎng)指數(shù)系列

15:12

國(guó)行版蘋果AI突然上線后又被撤回,蘋果回應(yīng):正在積極推進(jìn)落地中國(guó)

15:11

優(yōu)信二手車天津倉(cāng)儲(chǔ)大賣場(chǎng)試運(yùn)營(yíng),全國(guó)線下網(wǎng)絡(luò)擴(kuò)展至第六座

15:10

A股3月收官:三大指數(shù)集體下跌,軌道交通、交運(yùn)設(shè)備板塊走強(qiáng)

15:05

歐洲主要股指開盤多數(shù)下跌,歐洲斯托克50指數(shù)跌0.15%

15:05

國(guó)內(nèi)商品期貨多數(shù)收跌,碳酸鋰跌近8%

14:54

提高準(zhǔn)入門檻,強(qiáng)制性產(chǎn)品認(rèn)證管理辦法征求意見(jiàn)

14:48

張雪機(jī)車銷售稱奪冠后兩三天內(nèi)訂單大漲,已排至6月

14:48

法國(guó)3月CPI同比增長(zhǎng)1.7%,環(huán)比增長(zhǎng)0.9%

掃描下載App