DeepSeek AI新模型:搭載 MODEL1 全新架構(gòu),最快2月上線
鈦媒體App 1月21日消息,據(jù)報(bào)道,DeepSeek計(jì)劃于今年2月中旬,推出新一代旗艦AI模型DeepSeek V4。該模型將搭載全新技術(shù)架構(gòu),寫代碼能力有望實(shí)現(xiàn)顯著提升。根據(jù)DeepSeek官方GitHub倉(cāng)庫(kù)更新了一系列FlashMLA代碼,借助AI對(duì)全部總代碼文件數(shù):114個(gè)(包括.py, .md, .txt, .sh, .cpp, .cu, .h文件)進(jìn)行分析,發(fā)現(xiàn)了一個(gè)此前未公開的模型架構(gòu)標(biāo)識(shí)“MODEL1”,共被提及31次。FlashMLA是DeepSeek獨(dú)創(chuàng)的、針對(duì)英偉達(dá)Hopper架構(gòu)GPU深度優(yōu)化的軟件工具,專門加速大模型“推理生成”這一環(huán)節(jié)。MODEL1是DeepSeek FlashMLA中支持的兩個(gè)主要模型架構(gòu)之一,另一個(gè)是DeepSeek-V3.2。(廣角觀察)
本文內(nèi)容僅供參考,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論