AI 分為訓(xùn)練與推理兩大環(huán)節(jié)。

訓(xùn)練如同“學(xué)生學(xué)習(xí)知識”,需海量數(shù)據(jù)和超強(qiáng)算力;推理則像“學(xué)生考試答題”,要求快速響應(yīng)現(xiàn)實(shí)問題。隨著AI應(yīng)用場景的普及,推理算力需求不斷提升,據(jù)IDC數(shù)據(jù)顯示,2022年云端推理算力占比已達(dá)58.5%,預(yù)計2026年將升至62.2%。

如今,一家上市公司在11年間研發(fā)端側(cè)AI芯片之后,選擇發(fā)力大模型推理算力。

7月25日消息,2025年世界人工智能大會(WAIC)前夕,AI上市公司云天勵飛(688343.SH)對外發(fā)布深穹Edge200芯片,以及全新深穹X6000 Mesh推理計算卡等產(chǎn)品。

據(jù)悉,深穹X6000 Mesh推理加速卡的算力達(dá)256Tops,主要定位于AI推理計算,支持30fps的1080p 256路的視頻解碼,可實(shí)現(xiàn)千億參數(shù)大模型推理應(yīng)用。

同時,基于深穹X6000 Mesh加速卡,云天勵飛提供深目6203視頻高密2U推理一體機(jī)、天舟6408大模型4U推理一體機(jī),以及天舟680G大模型滿血版8U推理一體機(jī)等產(chǎn)品,最高可達(dá)4PFlops(每秒執(zhí)行4千萬億次浮點(diǎn)運(yùn)算)推理算力,助力AI模型商業(yè)落地。

云天勵飛董事長兼CEO陳寧對筆者表示,公司全面聚焦AI推理芯片。2025年是AI發(fā)展的重要轉(zhuǎn)折點(diǎn),大模型技術(shù)不斷成熟,模型調(diào)用成本顯著降低。同時,當(dāng)前AI推理芯片市場仍處于藍(lán)海階段,其市場規(guī)模相較于數(shù)千億美元的訓(xùn)練芯片市場尚顯微小,但預(yù)計未來三至五年內(nèi),AI推理芯片的增長速度將大幅超越訓(xùn)練芯片。這不僅意味著AI從訓(xùn)練時代邁入推理時代,也預(yù)示推理算力需求將迎來爆發(fā)式增長。

陳寧稱,未來五年(2030年),AI將重塑所有機(jī)器人、AI眼鏡等終端硬件產(chǎn)品,推理算力網(wǎng)絡(luò)將無處不在。而作為底層算力設(shè)施,AI推理芯片將貫穿端、邊、云,形成無處不在算力網(wǎng)絡(luò),從而讓各類Agent能夠服務(wù)人類的工作和生活。

陳寧強(qiáng)調(diào),未來云端推理算力會率先迎來爆發(fā),并不斷探索新的應(yīng)用場景。一旦新場景通過云服務(wù)形成價值閉環(huán),實(shí)現(xiàn)從1到100的大規(guī)模復(fù)制,同時在性價比提升、成本降低上取得突破,市場就有望向更大規(guī)模的邊緣推理計算拓展。最終,必然會形成終端、邊緣、云端全棧式的協(xié)同分工模式,推動AI大規(guī)模落地并具備最優(yōu)的性價比。

研發(fā)11年NPU之后,這次為何要發(fā)力模型推理算力卡?

云天勵飛成立于2014年,擁有大模型和AI芯片兩大技術(shù)平臺,打造了面向消費(fèi)級、企業(yè)級、行業(yè)級三大類場景的業(yè)務(wù)。

2023年,云天勵飛成功在上交所科創(chuàng)板上市,曾一度被稱為“深圳AI第一股”。

技術(shù)方面,云天勵飛自研“算力積木”架構(gòu),以及神經(jīng)網(wǎng)絡(luò)處理器核心IP和芯片,聚焦大模型高效推理,為AI的普惠應(yīng)用提供算力支撐,滿足多樣化應(yīng)用場景對AI算力的需求。

早在2020年,云天勵飛全面轉(zhuǎn)向國產(chǎn)工藝,成為首家采用國產(chǎn)Chiplet工藝的AI芯片公司。

2023年,云天勵飛正式發(fā)布基于“算力積木”架構(gòu)打造的DeepEdge10芯片平臺,并推出DeepEdge10C、DeepEdge10標(biāo)準(zhǔn)版、DeepEdge10Max和DeepEdge200四款芯片,提供算力范圍覆蓋8T至256T,可滿足從小型邊緣設(shè)備到智算中心高性能計算的需求。

2025年初,云天勵飛提供部署DeepSeek-R1全尺寸模型的大模型訓(xùn)推一體機(jī)。

經(jīng)過11年發(fā)展,云天勵飛已經(jīng)推出五代NPU(神經(jīng)網(wǎng)絡(luò)芯片),并推出產(chǎn)品矩陣。

其中,DeepEdge10芯片平臺已成功適配DeepSeek系列模型、QwQ-32B模型及國產(chǎn)鴻蒙操作系統(tǒng),可為客戶提供全國產(chǎn)的軟硬一體化產(chǎn)品和解決方案。基于自研 AI 推理芯片,云天勵飛聯(lián)合生態(tài)合作伙伴推出面向云、邊、端的 AI 推理產(chǎn)品系列,包括模組、邊緣智能盒子、AI 推理加速卡、大模型推理一體機(jī),以及智算服務(wù)器等。

隨著AI熱潮興起,云天勵飛業(yè)績持續(xù)向好。財報顯示,2024年,云天勵飛營業(yè)收入超9億元,同比增長81.3%。截至2025年第一季度,公司營收2.64億元,同比大增168.23%,創(chuàng)歷史同期新高。

今年上半年,云天勵飛公司與德元方惠簽署的約4000PFLOPS的AI訓(xùn)練及推理異構(gòu)算力服務(wù)協(xié)議(預(yù)計未來3年貢獻(xiàn)約16億營收)已于2025年4月完成全部驗(yàn)收工作并開始回款,預(yù)計上半年將貢獻(xiàn)約2億元營收;天府智算中心項(xiàng)目收益層面,公司已完成天府智算中心的交付,并于2024年第四季度確認(rèn)相關(guān)收入。

消費(fèi)級業(yè)務(wù)方面,2024年,云天勵飛消費(fèi)級場景業(yè)務(wù)通過岍丞技術(shù)的智能穿戴設(shè)備(已進(jìn)入華為、榮耀、OPPO等供應(yīng)鏈)和嚕咔博士的AI硬件產(chǎn)品線,預(yù)計2025年上半年消費(fèi)級業(yè)務(wù)將保持50%以上增速。

如今,研發(fā)11年NPU之后,云天勵飛再進(jìn)一步,全面發(fā)力大模型推理算力,發(fā)布針對于推理算力的AI芯片以及算力卡,布局一體機(jī)、智算中心等方案,產(chǎn)品將廣泛應(yīng)用于智算中心、智慧城市和具身智能等領(lǐng)域。

對于為何從邊緣AI計算戰(zhàn)略,轉(zhuǎn)變?yōu)锳I模型推理算力,陳寧表示,美國絕大部分90%以上的科技發(fā)明停留在實(shí)驗(yàn)室里面,但對于中國,AI推理芯片則是推動AI產(chǎn)業(yè)大規(guī)模落地的關(guān)鍵領(lǐng)域和關(guān)鍵技術(shù),中國一定要把握新機(jī)遇。

他提到,未來五年,大模型、算法和推理芯片為核心的AI技術(shù)將重新定義人類所有的電子產(chǎn)品;未來五到十年,以推理芯片為核心的AI算力網(wǎng)絡(luò)會無處不在。

“這種戰(zhàn)略轉(zhuǎn)變源于AI產(chǎn)業(yè)的發(fā)展:2014 至 2022 年小模型時代,需開發(fā)邊緣 AI 芯片解決細(xì)分場景問題,形成‘行業(yè)+AI’模式;2022年11月后,大模型重塑格局,推動AI+行業(yè),催生消費(fèi)類與企業(yè)級新賽道,產(chǎn)業(yè)進(jìn)入行業(yè)AI、企業(yè)AI、消費(fèi)者 AI并行階段。我們持續(xù)跟蹤技術(shù),2023 年推出兼容大模型部署的‘算力積木’,快速升級戰(zhàn)略聚焦 AI 推理芯片,經(jīng)過兩年多儲備,今年正式提出打造該領(lǐng)域領(lǐng)軍企業(yè)的核心戰(zhàn)略。”

“中國和歐美之間最大的差異,在于我們(中國)擁有人口的紅利,擁有更加豐富的應(yīng)用場景,這樣一個背景之下,云天勵飛是2014年我?guī)ьI(lǐng)一支海歸技術(shù)團(tuán)隊回到深圳創(chuàng)立了一家中國的AI推理芯片企業(yè)。如今,我們打造了一條應(yīng)用生產(chǎn)數(shù)據(jù),數(shù)據(jù)訓(xùn)練算法,算法定義芯片,芯片規(guī)?;瘧?yīng)用的數(shù)據(jù)飛輪,通過應(yīng)用數(shù)據(jù)算法芯片這樣一個數(shù)據(jù)飛輪,依托中國豐富的應(yīng)用場景,不斷推動著AI算法和大算力推理芯片技術(shù)發(fā)展動力。我們堅信,云天勵飛會進(jìn)一步加大在AI推理芯片領(lǐng)域的研發(fā)和投入,抓住這樣一個市場的機(jī)遇,尤其未來五年AI智能體應(yīng)用的爆發(fā),帶來國產(chǎn)AI推理芯片和算力市場機(jī)遇,推動中國搶占第四次工業(yè)革命的第一張入場券。”陳寧稱。

具體來說,相比其他算力卡,云天勵飛深穹X6000 Mesh加速卡有以下核心技術(shù)特點(diǎn):

陳寧對筆者表示,目前基于深穹X6000 Mesh推理加速卡的推理一體機(jī)正逐步量產(chǎn)落地。另外,云天勵飛在智算中心中也有布局。“智算中心會有四類客戶:城市級參與的智算中心建設(shè),科研院所對國產(chǎn)芯片需求,運(yùn)營商以及互聯(lián)網(wǎng)大廠,他們都在各地建設(shè)智算中心,這里面我們都有布局。”

陳寧強(qiáng)調(diào),DeepSeek一體機(jī)的本質(zhì)在于,打破各個行業(yè)最后一公里的AI應(yīng)用閉環(huán)。如今熱潮消退,并不一定代表一體機(jī)的“退場”,而是大家理性思考如何把一體機(jī)真正做到應(yīng)用閉環(huán)。他認(rèn)為,未來很長一段時間,一體機(jī)和云端推理集群將并行發(fā)展。

AI算力需求每年增超80%,云天下一代AI芯片2026年推出

2025年,隨著DeepSeek等開源模型大幅降低企業(yè)使用門檻,推理算力成本不斷降低,以及從智能客服到自動駕駛的AI應(yīng)用快速擴(kuò)展,推理算力需求也不斷增長。

今年6月,AMD CEO蘇姿豐(Lisa Su)表示,去年AMD預(yù)測,到2028年,全球數(shù)據(jù)中心 AI 加速芯片規(guī)模達(dá)到5000億美元,年增長速度超過60%。而如今隨著推理模型的興起,這個數(shù)字甚至更高。

蘇姿豐稱,未來幾年,AI 推理算力需求預(yù)計將每年增長超過80%,有望超過訓(xùn)練成為數(shù)據(jù)中心計算的主要驅(qū)動力。

顯然,AI推理算力需求正加速增長。

陳寧也同意這一觀點(diǎn)。他認(rèn)為,AI訓(xùn)練是一個確定性市場,英偉達(dá)已經(jīng)定義這一市場,但推理方面,云天勵飛從創(chuàng)業(yè)之初堅定不移定義AI推理,最近兩年很多企業(yè)正在從訓(xùn)練市場逐步轉(zhuǎn)型到訓(xùn)推一體的市場,探索未來推理成長空間,但這一過程中,“我們認(rèn)為云天勵飛有些差異化競爭力”。

針對于下一代“算力積木”架構(gòu)和AI推理芯片進(jìn)展,云天勵飛CTO李愛軍透露有五個方面的重要升級:

李愛軍表示,第二代“算力積木”通過上述五個創(chuàng)新,打造新型大模型推理計算平臺,滿足嵌入式物聯(lián)網(wǎng)、邊緣端、云推理對邊緣大模型、MoE大模型的極致推理效率、能效比、性價比需求。

據(jù)悉,基于第二代“算力積木”架構(gòu)的云天勵飛下一代AI推理芯片,預(yù)計將于2026年底陸續(xù)推出,包括深界、深擎、深穹三個系列將分別推出相應(yīng)的產(chǎn)品;到2028年,云天勵飛會推出第三代“算力積木”。

對于下半年業(yè)績預(yù)期和國產(chǎn)芯片發(fā)展,陳寧表示,基于AI推理算法、算力和AI應(yīng)用需求增長,公司相信會繼續(xù)保持一個高速增長趨勢。同時,云天勵飛用五年的時間迎接機(jī)遇和挑戰(zhàn),如今已實(shí)現(xiàn)全面國產(chǎn)芯片的商用量產(chǎn)。

陳寧表示,作為一家國產(chǎn)AI芯片公司,確實(shí)是面臨著巨大的挑戰(zhàn),主要是起步晚、生態(tài)不完善、國際復(fù)雜環(huán)境等一系列挑戰(zhàn),但很多機(jī)遇其實(shí)都是在挑戰(zhàn)之下的。云天勵飛一直在做基于矩陣類的并行計算芯片,團(tuán)隊有這樣一個基因、決心和信念,可以克服各種挑戰(zhàn)。同時,云天勵飛持續(xù)擁抱國產(chǎn)工藝,擁有市場差異化競爭優(yōu)勢。

“國產(chǎn)芯片公司最核心的‘財富’,其實(shí)就是你的團(tuán)隊,只要有了這個團(tuán)隊,這些問題我相信都可以解決。”陳寧稱。(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 陳寧對下半年有信心,看來訂單不少啊。

    回復(fù) 2025.07.26 · via h5
  • 推理芯片成藍(lán)海,就看誰能先搶占市場了。

    回復(fù) 2025.07.26 · via pc
  • 邊緣推理計算之后會火,云天勵飛提前布局了。

    回復(fù) 2025.07.26 · via h5
  • 云天勵飛從端側(cè)芯片轉(zhuǎn)向推理算力,這步轉(zhuǎn)型夠及時的。

    回復(fù) 2025.07.26 · via android
  • 下一代芯片 2026 年底出,還有五個大升級,期待。

    回復(fù) 2025.07.26 · via iphone
  • 智算中心布局加上推理產(chǎn)品,業(yè)務(wù)夠全的。

    回復(fù) 2025.07.26 · via iphone
  • 千億參數(shù)模型推理,對算力要求真不是一般高。

    回復(fù) 2025.07.26 · via iphone
  • 國產(chǎn)芯片的競爭優(yōu)勢,就看性價比和適配了。

    回復(fù) 2025.07.26 · via android
  • 推理算力網(wǎng)絡(luò)無處不在,這場景想想就帶勁。

    回復(fù) 2025.07.26 · via android
  • 邊緣到云端推理協(xié)同,這全棧模式挺有想法。

    回復(fù) 2025.07.26 · via android
更多評論
44

掃描下載App