免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

全村人都在等著DeepSeek上桌吃飯了

AGI
我在AI圈的朋友對(duì)DeepSeek V4仍然抱有很大希望,原因有二。

文 | 互聯(lián)網(wǎng)怪盜團(tuán)

上個(gè)周末,包括英國(guó)《金融時(shí)報(bào)》在內(nèi)的一些外媒報(bào)道稱(chēng):DeepSeek V4將在本周一(3月2日)發(fā)布。還有報(bào)道宣稱(chēng),V4將針對(duì)國(guó)產(chǎn)芯片進(jìn)行優(yōu)化,是該系列大模型當(dāng)中第一個(gè)完全基于國(guó)產(chǎn)算力生態(tài)的云云。這一消息很快被大量國(guó)內(nèi)媒體轉(zhuǎn)載,大家都期待著V4早日露出真容——可是什么都沒(méi)有發(fā)生。

大家盼望DeepSeek V4發(fā)布,已經(jīng)有一個(gè)多月了。之前很多人預(yù)測(cè)它將于春節(jié)期間發(fā)布,不過(guò)也有消息稱(chēng),春節(jié)還太早了一點(diǎn)。其實(shí),春節(jié)期間,豆包、千問(wèn)、GLM……等競(jìng)爭(zhēng)對(duì)手爭(zhēng)先恐后地發(fā)布新版本,在一定程度上可以視為對(duì)DeepSeek的一種“預(yù)防性競(jìng)爭(zhēng)行為”:只要V4發(fā)布,其光芒就會(huì)過(guò)于強(qiáng)大,遮蓋一切競(jìng)品;所以競(jìng)品必須趕緊也拿出高水平的新版本才行。

春節(jié)前不久,DeepSeek做了一次更新,擴(kuò)大了上下文窗口,并一度被誤傳為“V4已經(jīng)開(kāi)始灰度測(cè)試”。那段時(shí)間,我的朋友圈到處有人在問(wèn):“你被V4灰度到了嗎?怎么拿邀請(qǐng)碼?”事實(shí)證明那次更新并不是V4,雖然被廣泛稱(chēng)為"V4Lite",但畢竟不是正式版V4;它的跑分處于國(guó)產(chǎn)大模型的第一梯隊(duì),但更新尚未達(dá)到讓人眼睛一亮的程度。

我在AI圈的朋友,普遍對(duì)DeepSeek V4仍然抱有很大希望,其原因有二:

  1. 從梁文鋒署名的一系列論文看,DeepSeek團(tuán)隊(duì)在基礎(chǔ)研發(fā)方面是有想法的,正在力圖進(jìn)行創(chuàng)新,其站位高于大部分大模型創(chuàng)業(yè)團(tuán)隊(duì);

  2. 今年1月底,梁文鋒曾頗有自信地預(yù)告過(guò)不久后的新版本,“根據(jù)他的性格,沒(méi)有把握的事情是不會(huì)事先宣傳的”。

從DeepSeek團(tuán)隊(duì)發(fā)表的論文看,最近一段時(shí)間它的研發(fā)似乎聚焦于兩個(gè)方向:一個(gè)是編程,一個(gè)是多模態(tài)。前者非常自然,因?yàn)锳I編程是發(fā)展最快、成熟度最高的大模型應(yīng)用,今年以來(lái)發(fā)布的Claude Code with Opus 4.6以及ChatGPT-5.3-Codex再次刷新了AI編程的上限。這是一條已經(jīng)被證實(shí)的坦途,DeepSeek的前幾個(gè)小版本在這方面進(jìn)步也很大,V4再次取得巨大進(jìn)展是可以理解的。

后者則是在補(bǔ)齊軟肋——DeepSeek迄今最大的弱點(diǎn)就是沒(méi)有多模態(tài)功能,這一點(diǎn)不但限制了它的C端應(yīng)用,而且限制了它的B端應(yīng)用。因?yàn)锽端收入的來(lái)源是客戶(hù)對(duì)Token的消耗,多模態(tài)的Token消耗比傳統(tǒng)的文本生成高了一個(gè)、甚至好幾個(gè)數(shù)量級(jí)。不久前Seedance 2.0的發(fā)布,再次證明了優(yōu)秀的多模態(tài)大模型具備多高的用戶(hù)基礎(chǔ)和商業(yè)潛力。從已發(fā)表的論文看,DeepSeek肯定不滿足做一個(gè)“文生文”大模型,已經(jīng)在多模態(tài)方面下了不少工夫。

現(xiàn)在全村人都在等著DeepSeek V4上桌吃飯了,究竟什么時(shí)候才能真正開(kāi)飯呢?我認(rèn)為,這里有一個(gè)非常重要的因素:V3/R1是當(dāng)時(shí)全世界最出色的開(kāi)源大模型,尤其在推理成本控制方面取得了巨大進(jìn)展,所以震驚了世界;此時(shí)此刻,V4必須也成為全世界最出色的開(kāi)源大模型(至少是之一),才能再次震驚世界。這是成功者必須面臨的問(wèn)題:成功的標(biāo)桿越抬越高,每一次的挑戰(zhàn)都更大。

還有一個(gè)重要因素:當(dāng)初震驚世界的主要是R1,也就是深度推理大模型。如果沒(méi)有深度推理功能,至少對(duì)于一般用戶(hù)而言,DeepSeek不會(huì)顯得那么特殊。假設(shè)DeepSeek先推出“普通版本”的V4,過(guò)一段時(shí)間再推出“深度推理”的R2,市場(chǎng)是否會(huì)覺(jué)得解渴?當(dāng)然,有一種更穩(wěn)妥的方式,就是同時(shí)推出V4和R2,不過(guò)這需要更多的資源,對(duì)于一家仍處于創(chuàng)業(yè)級(jí)別的公司而言,未必合適。我相信,在決定新版本大模型上線節(jié)奏的時(shí)候,DeepSeek團(tuán)隊(duì)肯定考慮到了上述全部因素。

還有一個(gè)問(wèn)題:大模型開(kāi)發(fā),比拼的既是基礎(chǔ)研發(fā),也是工程執(zhí)行。我們目前能看到的公開(kāi)信息,主要是基礎(chǔ)研發(fā)層面的,例如DeepSeek團(tuán)隊(duì)發(fā)布的學(xué)術(shù)論文;我們對(duì)于背后的工程課題、工程瓶頸,知之甚少。迄今為止,關(guān)于DeepSeek新版本訓(xùn)練過(guò)程的一切媒體報(bào)道,其實(shí)都是捕風(fēng)捉影,沒(méi)有得到官方的任何承認(rèn),也缺乏第三方信源參考。舉個(gè)例子:谷歌在大模型基礎(chǔ)研發(fā)方面一直保持領(lǐng)先,但是在Bard以及Gemini早期,工程執(zhí)行方面犯下了很多錯(cuò)誤,直到2024年下半年才趕上來(lái)。如果DeepSeek過(guò)去一段時(shí)間致力于解決一些工程環(huán)節(jié)的細(xì)節(jié)問(wèn)題,我不會(huì)感到奇怪。

假設(shè)DeepSeek V4真的像英國(guó)《金融時(shí)報(bào)》報(bào)道的那樣,全面擁抱國(guó)產(chǎn)算力體系的話,在工程方面的挑戰(zhàn)就更大了。要知道,哪怕同樣是在英偉達(dá)框架之內(nèi),硅谷大廠把訓(xùn)練任務(wù)從Hopper架構(gòu)轉(zhuǎn)向Blackwell架構(gòu),也需要花一段時(shí)間;何況是在兩個(gè)完全不同的框架之間調(diào)整?這樣的工程問(wèn)題注定難以在短期內(nèi)得到解決,能解決就不錯(cuò)了,無(wú)法強(qiáng)求。

但是,需要強(qiáng)調(diào)的是:目前關(guān)于V4訓(xùn)練細(xì)節(jié)的報(bào)道,無(wú)論來(lái)自外媒還是國(guó)內(nèi)媒體,基本都是根據(jù)間接渠道的猜測(cè)、整合,從未得到官方的任何認(rèn)可。真正的訓(xùn)練細(xì)節(jié),只有在新版本發(fā)布的那一刻才會(huì)被外界得知,而且也不可能是全部細(xì)節(jié)。只能說(shuō):一切皆有可能,但不是每種可能性都值得現(xiàn)在就討論。

話說(shuō)回來(lái),哪怕在長(zhǎng)達(dá)一年多沒(méi)有大版本更新(中間有2-3次小版本更新)的情況下,而且是在極少做市場(chǎng)活動(dòng)的情況下,DeepSeek APP的MAU仍然超過(guò)1億,在國(guó)內(nèi)AI應(yīng)用中位居第四或第五名,哪怕是在春節(jié)期間砸了重金的元寶也無(wú)法超過(guò)它(這在一定程度上要感謝V4Lite的更新)。假如現(xiàn)在推出V4,那么DeepSeek仍然有希望一波沖到全國(guó)AI前三的水平;假如再晚一些,就不好說(shuō)了,因?yàn)榛ヂ?lián)網(wǎng)大廠圍繞AI的軍備競(jìng)賽愈演愈烈,DeepSeek在今年面對(duì)的競(jìng)爭(zhēng)密度遠(yuǎn)高于去年,國(guó)內(nèi)如此,國(guó)外也是如此。

不管怎么說(shuō),既然市場(chǎng)上頻繁傳出“DeepSeek V4即將發(fā)布”的消息,至少說(shuō)明新版本發(fā)布已經(jīng)不再遙遠(yuǎn)了。我非常希望能盡快看到V4,因?yàn)槠駷橹梗珼eepSeek仍是我使用頻率最高的四個(gè)大模型之一(另外三個(gè)是GPT、Gemini、Grok),也是我使用頻率最高的國(guó)產(chǎn)大模型。我一定會(huì)在發(fā)布之日立即嘗試,并且詢(xún)問(wèn)AI圈的朋友的使用體驗(yàn)。希望我們都不會(huì)失望!

本文沒(méi)有得到DeepSeek或其任何競(jìng)爭(zhēng)對(duì)手的資助或背書(shū)。

本文系作者 互聯(lián)網(wǎng)怪盜團(tuán) 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶(hù)分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

10:52

現(xiàn)貨黃金向上觸及4700美元

10:52

奢侈品股跌至2022年以來(lái)最低,受需求擔(dān)憂加劇影響

10:48

中央決定:姚來(lái)英任國(guó)家煙草專(zhuān)賣(mài)局黨組書(shū)記

10:47

美登月版圖巨變,NASA擬讓SpaceX替代波音核心職能

10:44

體育概念震蕩拉升,共創(chuàng)草坪漲停

10:43

小米汽車(chē):新一代SU7“準(zhǔn)現(xiàn)車(chē)”鎖單后預(yù)計(jì)1—5周即可交付

10:42

壓力大會(huì)加重皮炎,中國(guó)科學(xué)家首次發(fā)現(xiàn)科學(xué)證據(jù)

10:41

高盛擬4月啟動(dòng)績(jī)效裁員,規(guī)?;?yàn)?%-3%

10:38

今日MMLC電池級(jí)碳酸鋰(早盤(pán))價(jià)格較昨日上漲50元/噸

10:36

世貿(mào)組織:中東沖突或拖累全球貿(mào)易增長(zhǎng)前景

10:35

消息稱(chēng)英特爾本月底CPU漲價(jià)10%

10:34

籌資1000億美元,亞馬遜貝索斯擬設(shè)立基金收購(gòu)制造企業(yè)并引入AI

10:29

工信部部長(zhǎng)李樂(lè)成調(diào)研信息技術(shù)創(chuàng)新應(yīng)用和未來(lái)產(chǎn)業(yè)發(fā)展研究工作

10:28

滬深兩市成交額突破1萬(wàn)億,較上一日此時(shí)放量超400億

10:27

美國(guó)批準(zhǔn)部分俄羅斯原油的交付與銷(xiāo)售

10:24

預(yù)測(cè)市場(chǎng)Kalshi完成新一輪超10億美元融資,估值達(dá)220億美元

10:22

德國(guó)汽車(chē)半導(dǎo)體公司Elmos考慮出售,市值23億歐元

10:22

章源鎢業(yè)上調(diào)3月下半月長(zhǎng)單采購(gòu)報(bào)價(jià)

10:21

太空光伏概念震蕩走強(qiáng),拉普拉斯?jié)q近10%

10:20

聯(lián)邦快遞第三財(cái)季業(yè)績(jī)和展望均超預(yù)期,盤(pán)后股價(jià)大漲逾9%

掃描下載App