文 | 航通社,作者 | 書航
歲末年初,杭州的大模型創(chuàng)業(yè)公司“深度求索”DeepSeek 不斷放出大新聞。它所公布的一個(gè)開源模型DeepSeek-V3,在各種基準(zhǔn)測(cè)試等方面,能夠大致打平需要付錢的GPT-4o。
而一個(gè)更重要的問題是,這是中國公司在受到制裁,算力有限,不能購買足夠數(shù)量顯卡的基礎(chǔ)上,使用小數(shù)據(jù)集蒸餾等方法,而得到的一個(gè)更節(jié)省成本的模型。
官方技術(shù)論文披露,v3模型的總訓(xùn)練成本僅為557.6萬美元,相比之下GPT-4o等模型的訓(xùn)練成本約為1億美元。因此DeepSeek還被稱為“AI界拼多多”。
這條新聞的重大意義在于,它可能會(huì)減少人們對(duì)于“大模型的智能程度=英偉達(dá)提供的算力”這樣一個(gè)認(rèn)知的依賴。因此,消息還被認(rèn)為是間接影響了英偉達(dá)的股價(jià)。
在整個(gè)消息發(fā)酵的過程當(dāng)中,是非常有趣的“出口轉(zhuǎn)內(nèi)銷”然后再出去的,變來變?nèi)サ姆绞健?/p>
兔撕雞在即刻上總結(jié)說,國外的消息被引到國內(nèi)的時(shí)候,大家都看闌夕發(fā)的微博。但那條微博正確地指出了,DeepSeek 突破的真正意義在于GPU需求變小。“這標(biāo)志著美國對(duì)中國的AI封鎖戰(zhàn)略不算成功,也不需要搭建GPU萬卡集群,就能獲得不錯(cuò)的效果。”
這一層意思被重新譯介回Twitter/X上面,又讓硅谷的那幫人回過神來了,所以影響英偉達(dá)的股價(jià)。而且還需要對(duì)沖,the information說字節(jié)將會(huì)700億采購英偉達(dá)芯片,然后字節(jié)否認(rèn)。如果這個(gè)消息不是真實(shí)的,那么可以認(rèn)為,發(fā)出這個(gè)消息的,就是算力相關(guān)股票的護(hù)盤手。
總之,這種猜測(cè)甚是玄學(xué)。由此產(chǎn)生了兩個(gè)段子:
- 其一,杭州新四小龍:宇樹科技、DeepSeek、游戲科學(xué)、影視颶風(fēng);
- 其二,闌心一言,一個(gè)字近億美元。
12月27日,原先在DeepSeek的羅福莉加入小米的消息大范圍流傳,其實(shí)之前她早就自我官宣過,而且也在大模型業(yè)界小范圍流通。但是自從有媒體將羅形容為“95后天才少女”之后,情況就不一樣了。
這條消息獲得營銷加成,與其說利好小米,更不如說是加碼營銷了羅福莉的前東家DeepSeek,也就是證明了他們的團(tuán)隊(duì)確實(shí)有實(shí)力,足夠優(yōu)秀的人可以在團(tuán)隊(duì)內(nèi)做出非常厲害的事。
不得不說,在DeepSeek出圈前,AI業(yè)界對(duì)它的評(píng)價(jià)都非常高。因?yàn)椋词谷藗儼l(fā)現(xiàn)它的訓(xùn)練數(shù)據(jù)集有可能使用了來自ChatGPT的輸出結(jié)果——它曾在很多情況下都自稱為ChatGPT——這也只是無傷大雅的插曲。你行你也上啊,如果只要用ChatGPT輸出就能做這么好,你也可以試一試。
畢竟谷歌也在這么做。谷歌Gemini的事實(shí)核查人員是外包的,用來檢查雙子座模型所生成的結(jié)果是否屬實(shí)。而谷歌被曝光要放低人工核對(duì)的標(biāo)準(zhǔn),讓人員檢查跟自己本專業(yè)能力不相關(guān)的答案的準(zhǔn)確性,同時(shí)還允許他們借助類似Claude這樣的,其他模型生成的結(jié)果來核對(duì)。
當(dāng)某個(gè)階段你所做出的成績,是僅此一家別無分店的時(shí)候,那就說明潑天的富貴將會(huì)降臨到你的身上。
最近呢,當(dāng)然是快手的可靈,在Sora之前吸干了屬于它的關(guān)注度。之前另外一個(gè)華裔的作品Pika也類似。但Pika在初期版本比Runway強(qiáng)不少,之后就比較后勁乏力,連帶著聯(lián)合創(chuàng)始人郭文景,也不再繼續(xù)被稱作“天才少女”刷屏了。
但是這當(dāng)中最典型的案例則是月之暗面(Kimi)。
在差不多一年前。Kimi成為AI界當(dāng)紅炸子雞,因?yàn)樗趪鴥?nèi)外的競品當(dāng)中,最早提出了一個(gè)新的概念,就是“超長文本(tokens)”。長文本成為各大模型開始卷的領(lǐng)域,而Kimi依靠這個(gè)單獨(dú)概念對(duì)用戶心智的教育,牢牢的吸了一波粉絲和媒體關(guān)注。
自從長文本概念首倡以后,Kimi獲得融資的規(guī)模和頻次就像瘋了一樣,終于到達(dá)了需要老股東掐架的程度。在這一年當(dāng)中,Kimi的產(chǎn)品發(fā)布,包括智能體、深度思考、聯(lián)網(wǎng),以及尚未發(fā)布的視頻生成,都只能說是按部就班。
但是Kimi獲得了充足的彈藥,不僅在開發(fā)周期上面可以比較舒緩,沒有壓力,而且可以鉚足了勁兒,在B站砸錢營銷,使得大模型推廣的價(jià)格水漲船高。
在豆包積極跟進(jìn)廝殺之余,連騰訊都熬不住這么玩了。目前混元大模型的能力被植入微信、QQ、讀書、輸入法等具體的產(chǎn)品內(nèi),單行版元寶則處于放養(yǎng)狀態(tài),不再用力宣傳。
這就是為什么社長認(rèn)為,在今年,如果各家大廠還想要新的投資標(biāo)的的話,最合適的選擇就是DeepSeek。因?yàn)檫@一次輪到它提出新概念了,這個(gè)概念是“低成本訓(xùn)練”。
如果論資本市場(chǎng)的青睞程度,能跟月之暗面媲美的還有智譜。但智譜的融資輪數(shù)已經(jīng)太多了,從目前的發(fā)展來看,它也沒有持續(xù)領(lǐng)先。
其實(shí)就算是強(qiáng)如OpenAI,也不可能永遠(yuǎn)“炸裂顛覆嚇尿革命”。它可能只需要一次嬰兒的啼哭,向世界證明它此時(shí)此刻是領(lǐng)先的。對(duì)它來說這個(gè)概念叫“ChatGPT”。
這樣的機(jī)會(huì),這種對(duì)一個(gè)概念的定義權(quán),只要一個(gè)創(chuàng)業(yè)公司擁有一次,就已經(jīng)足夠幸運(yùn)。在此之后它是否還能定義第二個(gè)概念,或許不太重要;蜂擁而至的融資將會(huì)是對(duì)它之前定義概念的獎(jiǎng)賞。







快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論