中國(guó)兩大科技巨頭阿里巴巴和字節(jié)跳動(dòng)今日分別發(fā)布了各自最新的AI圖像生成模型——字節(jié)跳動(dòng)發(fā)布了主打智能理解和高分辨率輸出的Seedream 5.0 Preview,阿里巴巴則推出了集圖像生成與編輯于一體的Qwen-Image-2.0。

這兩款模型中,阿里巴巴通過(guò)阿里云百煉平臺(tái)開(kāi)放API邀測(cè),用戶可通過(guò)Qwen Chat免費(fèi)體驗(yàn);字節(jié)跳動(dòng)Seedream 5.0 Preview 目前則剛剛在即夢(mèng)、小云雀等平臺(tái)開(kāi)啟內(nèi)測(cè)。

阿里巴巴Qwen-Image-2.0的核心創(chuàng)新在于首次將圖像生成與編輯功能統(tǒng)一到單一模型架構(gòu)中,顯著提升了性能和靈活性。該模型支持長(zhǎng)達(dá)1000 token的復(fù)雜文本輸入,能夠生成高達(dá)2K分辨率的圖像,適合專(zhuān)業(yè)PPT、海報(bào)、多格漫畫(huà)等復(fù)雜場(chǎng)景。

Qwen-Image-2.0尤其在中文文字渲染方面表現(xiàn)卓越,能夠準(zhǔn)確生成多種字體和復(fù)雜文本內(nèi)容,如《蘭亭集序》全文配圖。AI Arena評(píng)測(cè)數(shù)據(jù)顯示,Qwen-Image-2.0在文本生成圖像任務(wù)中以1029分位列全球第三,圖像編輯能力得分1034,排名第二,接近頂尖水平。

相比之下,字節(jié)跳動(dòng)的Seedream 5.0 Preview 則支持2K及4K分辨率輸出,強(qiáng)調(diào)智能水平的提升,增強(qiáng)了對(duì)提示詞的理解能力,支持檢索生圖、多步邏輯推理和聯(lián)網(wǎng)知識(shí)整合,適合復(fù)雜知識(shí)驅(qū)動(dòng)的任務(wù),如生成詳細(xì)步驟說(shuō)明圖。

技術(shù)參數(shù)來(lái)看,Qwen-Image-2.0的長(zhǎng)文本輸入能力(1K token)遠(yuǎn)超行業(yè)平均,極大拓展了模型對(duì)復(fù)雜指令的理解和執(zhí)行能力,尤其適合需要精細(xì)文字排版和多元素組合的專(zhuān)業(yè)應(yīng)用。Seedream 5.0  Preview 則通過(guò)多步邏輯推理和聯(lián)網(wǎng)知識(shí)整合,提升了模型對(duì)復(fù)雜任務(wù)的適應(yīng)性,尤其在生成步驟說(shuō)明圖等知識(shí)密集型場(chǎng)景中表現(xiàn)優(yōu)異。

在使用體驗(yàn)方面,Qwen-Image-2.0通過(guò)阿里云百煉平臺(tái)和Qwen Chat提供開(kāi)放體驗(yàn),用戶反饋其生成圖像細(xì)膩,文字渲染精準(zhǔn),編輯功能靈活多樣,能夠?qū)崿F(xiàn)九宮格自拍、多風(fēng)格轉(zhuǎn)換等多樣化創(chuàng)作。

Seedream 5.0 Preview則依托字節(jié)跳動(dòng)生態(tài),預(yù)計(jì)將會(huì)深度整合進(jìn)剪映、CapCut等視頻及內(nèi)容創(chuàng)作工具,用戶可便捷調(diào)用模型完成高質(zhì)量圖像生成和精準(zhǔn)編輯,尤其適合內(nèi)容創(chuàng)作者和知識(shí)工作者

兩款模型的發(fā)布反映了中國(guó)AI圖像生成領(lǐng)域的多元化發(fā)展趨勢(shì)。阿里巴巴側(cè)重于模型架構(gòu)的統(tǒng)一與性能提升,強(qiáng)調(diào)中文文字渲染和多場(chǎng)景應(yīng)用,推動(dòng)AI圖像生成的實(shí)用化和普及化。字節(jié)跳動(dòng)則聚焦智能理解和知識(shí)驅(qū)動(dòng),強(qiáng)化模型的推理能力和高分辨率輸出,滿足更復(fù)雜的專(zhuān)業(yè)需求和內(nèi)容創(chuàng)作場(chǎng)景。

未來(lái),隨著AI圖像生成技術(shù)的不斷演進(jìn),模型的多模態(tài)融合能力、長(zhǎng)文本理解深度以及高分辨率細(xì)節(jié)表現(xiàn)將成為競(jìng)爭(zhēng)關(guān)鍵。

阿里巴巴和字節(jié)跳動(dòng)的這兩款模型分別代表了不同的技術(shù)路線和市場(chǎng)策略,預(yù)計(jì)將在專(zhuān)業(yè)設(shè)計(jì)、內(nèi)容創(chuàng)作、教育培訓(xùn)等多個(gè)領(lǐng)域展開(kāi)激烈競(jìng)爭(zhēng)。同時(shí),隨著API和應(yīng)用的開(kāi)放,更多開(kāi)發(fā)者和用戶將參與到AI圖像生成生態(tài)中,推動(dòng)技術(shù)的快速迭代和應(yīng)用創(chuàng)新。

(本文首發(fā)鈦媒體App , 作者|AGI-Signal,編輯|秦聰慧) 

作品聲明:內(nèi)容由AI生成
本文系作者 AGI-Signal 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

14:38

美國(guó)因天氣原因再次推遲“龍”飛船載人發(fā)射任務(wù)

14:32

韓國(guó)綜指收漲1%

14:30

天津海河產(chǎn)業(yè)基金等成立人工智能合伙企業(yè),出資額1億

14:28

硅片價(jià)格本周再次下跌,總庫(kù)存處于合理水位之上

14:25

車(chē)用固態(tài)電池第1部分國(guó)標(biāo)擬于2026年7月發(fā)布

14:24

國(guó)家大基金三期旗下基金等入股芯原股份旗下公司

14:18

比特幣跌破67000美元,日內(nèi)跌超3%

14:12

騰訊與特斯拉聯(lián)合推出兩項(xiàng)座艙新功能,微信互聯(lián)及目的地服務(wù)正式上線

14:10

煤炭概念午后活躍,山西焦化漲停

14:05

德國(guó)商業(yè)銀行預(yù)計(jì)2026年凈利潤(rùn)超過(guò)32億歐元

14:02

1月份中國(guó)汽車(chē)行業(yè)保持平穩(wěn)運(yùn)行

14:00

油氣股午后拉升,海油工程漲停

13:58

螞蟻阿福開(kāi)啟春節(jié)支付寶紅包活動(dòng)

13:57

豆包將加入春節(jié)紅包大戰(zhàn)

13:56

科大訊飛正式發(fā)布基于全國(guó)產(chǎn)算力訓(xùn)練的星火X2大模型

13:56

OpenAI奧爾特曼:在ChatGPT中更新了GPT-5.2

13:55

上海:建立長(zhǎng)三角科技政策“互認(rèn)清單”、應(yīng)用場(chǎng)景“開(kāi)放清單”,組建長(zhǎng)三角重大科技基礎(chǔ)設(shè)施聯(lián)盟

13:54

上海:完善“滬港通”“債券通”“互換通”等機(jī)制安排

13:42

化纖概念走強(qiáng),泰和新材漲停

13:40

滬深京三市成交額超1.5萬(wàn)億元,較上日此時(shí)縮量1035億元

掃描下載App