圖片來(lái)源@視覺(jué)中國(guó)

鈦媒體注:本文來(lái)源于微信公眾號(hào)新浪科技(ID:techsina),作者 | 周文猛,鈦媒體經(jīng)授權(quán)發(fā)布。

市場(chǎng)期待許久的阿里“通義千問(wèn)”問(wèn)世,并于昨日開(kāi)啟測(cè)試體驗(yàn)。這是續(xù)百度、360之后,中國(guó)互聯(lián)網(wǎng)大廠的又一“玩家”首秀。

作為首批獲邀參與內(nèi)測(cè)的媒體,新浪財(cái)經(jīng)體驗(yàn)了“通義千問(wèn)”,并與文心一言、ChatGPT兩款產(chǎn)品進(jìn)行對(duì)比。

這次對(duì)比中,我們列舉了5個(gè)維度的問(wèn)題,分別為:生成代碼、中文理解、寫(xiě)作文章、提綱寫(xiě)作,以及熱點(diǎn)事件解讀。

三款產(chǎn)品,孰強(qiáng)孰弱?一測(cè)見(jiàn)分曉!

實(shí)測(cè)5問(wèn),性能如何?

生成代碼:請(qǐng)寫(xiě)一段冒泡排序算法?

作為助推ChatGPT成功出圈的主要功能,ChatGPT自動(dòng)生成代碼的能力最廣為稱道。那么,通義千問(wèn)的代碼生成能力如何呢?新浪財(cái)經(jīng)最先向它提出了“寫(xiě)一段冒泡排序算法”的請(qǐng)求。以下是回答:

通義千問(wèn)回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):從生成邏輯上來(lái)看,“通義千問(wèn)”先是簡(jiǎn)單地描述冒泡算法的實(shí)現(xiàn)邏輯,然后給出具體的Python代碼,最后給出代碼實(shí)現(xiàn)思路的講解。就具體的“代碼段”而言,實(shí)現(xiàn)邏輯與文心一言生成的代碼一致,整體較為簡(jiǎn)潔,但實(shí)現(xiàn)能力不分伯仲。

相對(duì)而言,ChatGPT生成的代碼更為簡(jiǎn)潔,僅為四行,但語(yǔ)言介紹內(nèi)容較多。

中文理解:洛陽(yáng)紙貴是什么意思?

作為一款國(guó)產(chǎn)AI大模型產(chǎn)品,通義千問(wèn)對(duì)于中文的理解能力,同樣是大眾關(guān)心的問(wèn)題。此前,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在發(fā)布文心一言時(shí),曾以洛陽(yáng)紙貴一詞演示文心一言對(duì)于中文語(yǔ)言的理解能力,同樣的問(wèn)題,通義千問(wèn)如何作答?

通義千問(wèn)回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):通義千問(wèn)給出的答復(fù)與文心一言有細(xì)微差異,但成語(yǔ)出處、基本語(yǔ)義等理解都已經(jīng)十分到位。需要指出的是,目前ChatGPT對(duì)于中文語(yǔ)義的理解能力也不弱,與前兩者的差距并沒(méi)有那么大。

提綱寫(xiě)作:請(qǐng)寫(xiě)5個(gè)對(duì)比爾·蓋茨進(jìn)行采訪的問(wèn)題?

自ChatGPT推出以來(lái),其對(duì)于文案創(chuàng)作、邀請(qǐng)函擬定等方面的功能引發(fā)了大量討論,由于極大地提升了工作效率,一些文員、記者也開(kāi)始運(yùn)用ChatGPT來(lái)擬定采訪問(wèn)題。

當(dāng)新浪財(cái)經(jīng)先后向通義千問(wèn)、文心一言以及ChatGPT提出寫(xiě)作“采訪比爾·蓋茨的問(wèn)題提綱”這一要求時(shí),三款產(chǎn)品給出的問(wèn)題各不相同。

通義千問(wèn)回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):整體看來(lái),提問(wèn)方向各有千秋之外,通義千問(wèn)在給出問(wèn)題方向的同時(shí)也給出了更為詳盡的寫(xiě)作思路,較后兩者更加用心、細(xì)致。

事件理解:張繼科最近為什么特別受關(guān)注?

對(duì)于熱點(diǎn)事件的回答質(zhì)量以及速度,是檢驗(yàn)一款A(yù)I問(wèn)答產(chǎn)品對(duì)于網(wǎng)絡(luò)內(nèi)容即時(shí)獲取能力的關(guān)鍵,而這背后代表的則是問(wèn)答產(chǎn)品知識(shí)更新以及獲取能力的關(guān)鍵。

近日,“網(wǎng)傳張繼科用前女友私照抵賭債”一事引發(fā)廣泛關(guān)注,三款大模型將如何作答?

通義千問(wèn)回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):當(dāng)新浪財(cái)經(jīng)將這一近乎全網(wǎng)皆知的事件提問(wèn)給通義千問(wèn)、文心一言以及ChatGPT時(shí),三款產(chǎn)品給出的答案對(duì)近期事件一概不提,但都展開(kāi)了大長(zhǎng)段的“忽悠”式分析。

寫(xiě)作文章:請(qǐng)以“AIGC變革內(nèi)容生產(chǎn)模式”為題寫(xiě)深度文章

通義千問(wèn)回答

文心一言回答

ChatGPT回答

點(diǎn)評(píng):在寫(xiě)“命題作文”方面,通義千問(wèn)和文心一言整體表現(xiàn)不分上下,但是ChatGPT卻因?yàn)閷⒅形沫h(huán)境下的“AIGC”理解為AI、區(qū)塊鏈、大數(shù)據(jù)和云計(jì)算,最終導(dǎo)致對(duì)于文章主旨理解的錯(cuò)誤,直接跑題了。

從這一點(diǎn)可以看出,雖然ChatGPT開(kāi)啟了生成式AI風(fēng)靡全球的序幕,但是由于不對(duì)中國(guó)市場(chǎng)開(kāi)放,這導(dǎo)致了他的數(shù)據(jù)存在不適應(yīng)中國(guó)語(yǔ)境的情況,已經(jīng)出現(xiàn)被國(guó)產(chǎn)GPT產(chǎn)品局部超越的情況。

總結(jié):回答各有千秋,通義千問(wèn)交互體驗(yàn)更優(yōu)

多輪次多維度對(duì)比測(cè)試之后,新浪財(cái)經(jīng)發(fā)現(xiàn),通義千問(wèn)與問(wèn)心一言、ChatGPT相比,在生成代碼、中文理解、寫(xiě)文章等方面各有千秋;在提綱寫(xiě)作方面更加細(xì)致貼心,能夠給出更加具體的內(nèi)容方向。不過(guò),在熱點(diǎn)解讀等方面,三款產(chǎn)品均存在望文生義,隨口胡謅的傾向。

在內(nèi)容的時(shí)效性以及畫(huà)圖等能力方面,文心一言有一定優(yōu)勢(shì)。不過(guò)作為后來(lái)者,通義千問(wèn)在回答問(wèn)題的響應(yīng)速度、人機(jī)交互的操作形式方面,均比問(wèn)心一言和ChatGPT有著大幅提升。

在輸入相同的問(wèn)題時(shí),通義千問(wèn)幾乎只需要3秒便可以開(kāi)始回答,然而文心一言和ChatGPT在回答部分問(wèn)題時(shí)可能提問(wèn)4—6秒后才能開(kāi)始回答。而這背后代表的,其實(shí)是算法效率、存儲(chǔ)訪問(wèn)速度等方面的技術(shù)底蘊(yùn)。

此外,從三款產(chǎn)品的用戶界面也可以看出,通義千問(wèn)的操作界面和窗口要顯得更加的簡(jiǎn)約大方,少了一些極客范兒,卻多了一些實(shí)用性和親民性。除首頁(yè)分別就寫(xiě)郵件、短文、電影腳本等進(jìn)行分類,點(diǎn)擊可直接進(jìn)入相應(yīng)的對(duì)話框提問(wèn)外,更是通過(guò)百寶袋將各種功能做了效率類、生活類、娛樂(lè)類分類,讓使用者有了更多體驗(yàn)的樂(lè)趣,交互引導(dǎo)性更強(qiáng)。

結(jié)語(yǔ):大模型時(shí)代,需要更多中國(guó)力量

需要承認(rèn)的是,相比于當(dāng)前的業(yè)界標(biāo)桿ChatGPT(GPT-4),通義千問(wèn)還有不少進(jìn)步空間。不過(guò)作為一款持續(xù)迭代的產(chǎn)品,快速迭代的通義千問(wèn)已不容小覷。憑借著阿里云的算力資源以及阿里巴巴集團(tuán)整體的數(shù)字、資源優(yōu)勢(shì),通義千問(wèn)的比較優(yōu)勢(shì)不言而喻。

可以預(yù)測(cè),隨著百度、360集團(tuán)以及阿里巴巴先后推出自己的“類ChatGPT”產(chǎn)品,一場(chǎng)新的大模型爭(zhēng)奪戰(zhàn)再次在國(guó)內(nèi)互聯(lián)網(wǎng)頭部企業(yè)之間打響。在市場(chǎng)規(guī)則的牽引之下,后續(xù)通義千問(wèn)、問(wèn)心一言等產(chǎn)品將會(huì)結(jié)合不同集團(tuán)公司的資源稟賦、技術(shù)特色,形成各自差異化的特征。

正在快速到來(lái)的大模型時(shí)代,需要中國(guó)企業(yè)的身影,而且不僅僅是一家企業(yè)的身影。

本文系作者 新浪科技 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

12:54

香港證監(jiān)會(huì):2025年香港證券業(yè)盈利及交易額均創(chuàng)五年新高

12:47

中國(guó)汽車流通協(xié)會(huì):3月中國(guó)汽車經(jīng)銷商庫(kù)存預(yù)警指數(shù)為57.5%

12:39

360智能體發(fā)現(xiàn)OpenClaw高危漏洞,或波及全球17萬(wàn)實(shí)例

12:36

巴基斯坦副總理兼外長(zhǎng)達(dá)爾來(lái)華

12:30

保利物業(yè):2025年公司擁有人應(yīng)占年內(nèi)溢利同比增加約5.1%

12:23

聯(lián)想控股:2025年凈利潤(rùn)97.99億元,同比增長(zhǎng)28%

12:23

西班牙禁止涉美以打擊伊朗飛機(jī)飛越領(lǐng)空 白宮、魯比奧回應(yīng)

12:20

市場(chǎng)監(jiān)管總局、民政部發(fā)布新規(guī)規(guī)范殯葬領(lǐng)域明碼標(biāo)價(jià)

12:20

中信金融資產(chǎn)、紫光集團(tuán)等成立私募股權(quán)投資基金,出資額25億

12:14

工信部等九部門(mén):到2028年,物聯(lián)網(wǎng)核心產(chǎn)業(yè)規(guī)模突破3.5萬(wàn)億元

12:03

港股午評(píng):恒生指數(shù)跌0.51%,恒生科技指數(shù)跌0.94%

12:01

高盛:到2026年底金價(jià)或?qū)⑦_(dá)到每盎司5400美元

11:59

鴻泉技術(shù)回應(yīng):為“張雪機(jī)車”提供智能座艙等產(chǎn)品,并為其設(shè)計(jì)APP

11:58

字節(jié)AI編程產(chǎn)品TRAE SOLO獨(dú)立端上線

11:52

三部門(mén):到2028年,制修訂紡織工業(yè)多元適配、數(shù)字轉(zhuǎn)型、綠色低碳、健康安全等標(biāo)準(zhǔn)300項(xiàng)以上

11:49

鮑威爾:中東戰(zhàn)事推高通脹預(yù)期,美聯(lián)儲(chǔ)應(yīng)對(duì)選項(xiàng)有限

11:46

飛豬與韓國(guó)旅游發(fā)展局簽署合作備忘錄

11:45

兩艘中國(guó)巨輪順利通過(guò)霍爾木茲海峽

11:44

A股午評(píng):創(chuàng)業(yè)板指跌超2%,CPO、煤炭、鋰礦等概念走弱

11:40

國(guó)內(nèi)期貨主力合約多數(shù)下跌,能化板塊跌幅居前

掃描下載App