近期,生成式人工智能(AIGC)領(lǐng)域又涌現(xiàn)出多款創(chuàng)意十足的新應(yīng)用。

今天,鈦媒體AGI梳理了免費(fèi) AI “神器”系列第六彈,共五款,其中不少產(chǎn)品再一次拓寬了我們對AI的想象力。

1、Stability AI三連發(fā):Stable Diffusion 3、Stable Video、Creative Upscaler

繼OpenAI發(fā)布的視頻生成模型Sora風(fēng)靡全球之后,AI 文生圖和視頻領(lǐng)域競爭加速,行業(yè)“鼻祖”、生成式 AI 技術(shù)公司Stability AI 2月22日-23日連續(xù)推出三款新產(chǎn)品:Stable Diffusion 3、Stable Video、Creative Upscaler,迎戰(zhàn)Sora。

產(chǎn)品信息:首先,Stable Diffusion 3是目前全球最強(qiáng)大的文生圖模型,生圖質(zhì)量有很大改進(jìn),支持多主題提示,參數(shù)量從 800M 到 8B 不等,支持手機(jī)、電腦等便攜式設(shè)備使用,大大降低AI大模型的使用門檻。

其次,Stable Video是基于Stable Video Diffusion技術(shù)推出的 AI 視頻生成平臺,支持生成高質(zhì)量視頻,新增了鏡頭控制等功能,用戶可以通過該工具快速創(chuàng)建高質(zhì)量的視頻內(nèi)容,無需專業(yè)技能和復(fù)雜的軟件,隨時(shí)用 AI 生成視頻。

最后,Creative Upscaler是該公司新推出的 AI 圖像提升增強(qiáng)工具,可以將圖像升級到4k分辨率,并創(chuàng)造以前沒有的新細(xì)節(jié)等,從而賦予圖像新生命。

產(chǎn)品功能:Stable Diffusion 3與之前版本一致,采用了與Sora一樣的Diffusion Transformer架構(gòu),直接生成逼真的 AI 圖片,不過目前還沒有全面開放,權(quán)重也沒有公布。團(tuán)隊(duì)提到,他們正在采取一些安全措施,防止不法分子濫用。想要嘗鮮的用戶可以通過https://stability.ai/stablediffusion3申請。

Stable Video支持基于 AI 的圖生視頻和文生視頻,比上一代升級優(yōu)化了畫面穩(wěn)定性、運(yùn)動幅度、畫面細(xì)節(jié)處理等功能,以及新增鏡頭控制能力。如今,用戶可以將記憶轉(zhuǎn)化為動態(tài)影像,或通過文字創(chuàng)造全新的故事,可用于商業(yè)宣傳視頻、教學(xué)視頻、產(chǎn)品展示等更多場景。

Stable Video付費(fèi)方面,公測期間,用戶每日登錄都有150的積分,可免費(fèi)用來生成15個(gè)視頻,若用戶有制作大量視頻需求也可按需購買。目前主要有兩種付費(fèi)標(biāo)準(zhǔn):一是10美元購買500積分,可制作50個(gè)視頻,二是50美元購買3000積分,可制作300個(gè)視頻。

最后是Creative Upscaler應(yīng)用工具。其擁有分辨率提升、細(xì)節(jié)創(chuàng)造、創(chuàng)造力調(diào)整、面向高質(zhì)量轉(zhuǎn)換、原始圖像保留、生命注入等獨(dú)特的 AI 技術(shù)功能。與大多數(shù)同類 AI 產(chǎn)品不同,Creative Upscaler結(jié)合文本提示和圖像,能創(chuàng)造出原本不存在的新細(xì)節(jié),為圖像賦予新的生命和可能性。

體驗(yàn)地址:https://www.stablevideo.com/

https://creator.nightcafe.studio/stability-ai-creative-upscaler

2、實(shí)時(shí)人臉互換直播工具——SwapStream

產(chǎn)品信息:SwapStream是一款基于 AI 與云技術(shù)的實(shí)時(shí)人臉互換直播工具,用戶無需下載,可直接通過瀏覽器實(shí)現(xiàn)人臉互換直播。

產(chǎn)品功能:SwapStream可將任意人臉實(shí)時(shí)互換到直播視頻中,同時(shí)支持多個(gè)直播平臺同步,還可添加自定義RTMP直播通道等。使用簡單、擴(kuò)展性強(qiáng),適用于各類直播場景,主要受眾人群包含需要進(jìn)行人臉互換的直播、需要快速設(shè)置直播環(huán)境的用戶以及需要擴(kuò)展直播范圍的主播等。

體驗(yàn)地址:https://www.swapstream.ai/

3、跨模態(tài)大語言模型——AnyGPT

產(chǎn)品信息:AnyGPT是由復(fù)旦大學(xué)、上海人工智能實(shí)驗(yàn)室等機(jī)構(gòu)聯(lián)合推出的一款多模態(tài)大語言模型,該模型采用離散表示技術(shù),通過在各模態(tài)輸入上進(jìn)行離散標(biāo)記,實(shí)現(xiàn)了多模態(tài)信息的統(tǒng)一處理。

產(chǎn)品功能:首先AnyGPT可進(jìn)行任何模態(tài)的輸入和輸出,無論是文本、圖像、音頻或是視頻都支持輸入,并可生成任何模態(tài)的輸出。

其次,AnyGPT可進(jìn)行多模態(tài)理解和生成,能從一個(gè)模態(tài)接收輸入并在另一個(gè)或多個(gè)模態(tài)中生成輸出。如它可以從文本生成音樂,從語音生成圖片等。

最后,AnyGPT可實(shí)現(xiàn)任意模態(tài)轉(zhuǎn)換,如將語音指令轉(zhuǎn)換成文本+圖片+音樂的響應(yīng),或?qū)⒄Z音+音樂轉(zhuǎn)換成圖像+文本的響應(yīng)。

項(xiàng)目及演示地址:https://junzhan2000.github.io/AnyGPT.github.io/

4、聲畫分離模型——PixelPlayer

產(chǎn)品信息:PixelPlayer 是一款聲畫分離模型,能通過分析大量未標(biāo)記的視頻,識別視頻中哪些區(qū)域在產(chǎn)生聲音,并將聲音分離成代表每個(gè)像素聲音的組件。該模型由麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室開發(fā)。

產(chǎn)品功能:PixelPlayer 能處理和識別人們演奏不同樂器的視頻,并對單聲道音頻輸入進(jìn)行音視頻源分離和定位,最終實(shí)現(xiàn)將聲音信號分割成多個(gè)通道,每個(gè)通道對應(yīng)一個(gè)樂器類別,并能為視頻中的每個(gè)像素指定一個(gè)獨(dú)立的音頻波形。

在PixelPlayer開發(fā)團(tuán)隊(duì)的演示視頻中,點(diǎn)擊視頻上的不同區(qū)域(對象:樂器或空氣),會發(fā)出不同的聲音。

在PixelPlayer開發(fā)團(tuán)隊(duì)的演示視頻中,點(diǎn)擊視頻上的不同聲源區(qū)域,會發(fā)出不同的聲音。

PixelPlayer為音視頻編輯、多媒體內(nèi)容制作、增強(qiáng)現(xiàn)實(shí)應(yīng)用等領(lǐng)域提供了強(qiáng)大的工具,使得獨(dú)立調(diào)整視頻中不同聲音源音量、去除或增強(qiáng)特定聲音源等操作成為可能。截至發(fā)稿,PixelPlayer在Github上已累積351顆星。

體驗(yàn)地址:http://sound-of-pixels.csail.mit.edu/

5、金融分析師的人工智能助手——Finpilot

產(chǎn)品信息:Finpilot是一款由西雅圖初創(chuàng)公司Finpilot推出、專門為金融分析師設(shè)計(jì)的 AI 助手應(yīng)用,以生成式 AI 技術(shù)為核心,旨在協(xié)助金融分析師進(jìn)行研究和解答金融問題。

產(chǎn)品功能:Finpilot可幫助分析師快速搜集和分析金融數(shù)據(jù),股票分析,編寫報(bào)告,以及進(jìn)行數(shù)據(jù)可視化。同時(shí),F(xiàn)inpilot提供可驗(yàn)證的信息來源,保證數(shù)據(jù)研究質(zhì)量。用戶只需與Finpilot對話,即可獲取對應(yīng)的金融或財(cái)務(wù)數(shù)據(jù),從而簡化金融分析工作流程,大幅提高工作效率。

例如,通過問答,用戶可獲取阿里巴巴、騰訊、HAL等公司分部過去五年的收入數(shù)據(jù),以及比較SNOW、CRWD等多個(gè)公司凈留存率等。

另外,2月23日,F(xiàn)inpilot還官宣完成由Madrona領(lǐng)投的400萬美元的融資。Finpilot表示,本輪融資的資金主要用于擴(kuò)大技術(shù)團(tuán)隊(duì)和升級軟件功能,包括引入更先進(jìn)的自然語言處理技術(shù)、提高ChatGPT在金融領(lǐng)域的應(yīng)用和智能水平,以及部分用于市場推廣,以增強(qiáng)軟件在金融行業(yè)的影響力。

體驗(yàn)地址:https://www.finpilotai.com/

(本文首發(fā)鈦媒體App,作者|章橙,編輯|林志佳)

 

本文系作者 章橙 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報(bào)

更多

14:30

3月31日全國農(nóng)產(chǎn)品批發(fā)市場豬肉平均價(jià)格為15.31元/公斤,比昨天下降1.0%

14:25

工信部:前2個(gè)月我國集成電路設(shè)計(jì)收入636億元,同比增長15.7%

14:23

工信部:前2個(gè)月我國軟件業(yè)務(wù)收入21534億元,同比增長11.7%

14:17

聯(lián)合利華與味可美就食品業(yè)務(wù)進(jìn)行深入談判,最早于今日達(dá)成協(xié)議

14:16

南向資金凈買入額達(dá)50億港元

14:02

英國第四季度GDP年率終值為1%

13:58

吉利旗下沃飛長空增資至3.6億

13:55

瑞銀:預(yù)計(jì)到年底金價(jià)將逐漸回落,未來幾年將走低

13:54

光纖概念震蕩回升,特發(fā)信息漲停

13:51

高盛:參考1990年石油危機(jī),美聯(lián)儲終將降息

13:50

創(chuàng)新藥概念午后再度活躍,海創(chuàng)藥業(yè)漲超11%

13:50

支付寶發(fā)布國內(nèi)首個(gè)“支付集成Skill”

13:46

騰訊WorkBuddy小程序上線,支持"云端+本機(jī)"雙模式運(yùn)行

13:39

寧波商業(yè)航天產(chǎn)業(yè)基地項(xiàng)目將于4月開啟招標(biāo),預(yù)計(jì)總投資額86.6億

13:39

滬深京三市成交額超1.5萬億元,較上日此時(shí)放量62億元

13:29

瑞銀:中國市場調(diào)整或已過度,優(yōu)質(zhì)AI股票迎來布局窗口

13:24

北京消費(fèi)品以舊換新政策持續(xù)落地,帶動銷售額約50億元

13:23

全國新能源汽車動力電池溯源信息平臺正式啟動

13:22

深圳:規(guī)模建設(shè)先進(jìn)級智能工廠

13:20

摩托車概念異動,宏昌科技走出20cm2連板

掃描下載App