小米總部園區(qū)

在小米公司CEO雷軍演講前夕,其研發(fā)的人工智能(AI)大模型產(chǎn)品悄然現(xiàn)身。

鈦媒體App獲悉,8月11日,小米公司開發(fā)的大規(guī)模預(yù)訓(xùn)練語言模型 MiLM-6B/1.3B登陸代碼托管平臺(tái)GitHub,參數(shù)規(guī)模最高達(dá)64億,而且現(xiàn)身在C-Eval、CMMLU基準(zhǔn)評(píng)測(cè)榜單。

截至當(dāng)前,小米大模型MiLM-6B在C-Eval總榜單排名第10、同參數(shù)量級(jí)排名第1,平均分為60.2分,超過了阿里云Qwen-7B、OpenAI研發(fā)的ChatGPT(今年5月數(shù)據(jù))等,而MiLM-1.3B排行第30名,平均分45.8分,接近谷歌投資的Anthropic公司的Claude 1.0版本大模型。

這是小米大模型產(chǎn)品的首次曝光,也是小米史上首個(gè)GPT大模型產(chǎn)品亮相。

事實(shí)上,隨著ChatGPT風(fēng)靡全球,今年4月14日,小米公司宣布成立小米 AI 實(shí)驗(yàn)室大模型團(tuán)隊(duì),由欒劍帶隊(duì)向王斌匯報(bào)。據(jù)悉,AI實(shí)驗(yàn)室是小米AI戰(zhàn)略的核心部門,而大模型負(fù)責(zé)人王斌曾在中科院從事了20多年NLP(自然語言處理)相關(guān)的研究和開發(fā)工作,2018年加入小米,2019年起負(fù)責(zé)AI實(shí)驗(yàn)室。

小米CEO雷軍當(dāng)時(shí)表示,公司正在研發(fā)一些技術(shù)和產(chǎn)品,等打磨好了再給大家演示。小米集團(tuán)總裁盧偉冰稱,小米目前擁有超過1200人的AI團(tuán)隊(duì),會(huì)積極擁抱大模型,與業(yè)務(wù)深度結(jié)合,但不會(huì)像OpenAI一樣。

今年6月,王斌對(duì)外透露,小米會(huì)去自研通用語言大模型,但不會(huì)單獨(dú)發(fā)布一款類ChatGPT產(chǎn)品。他表示,小米第一步的目標(biāo)基座模型參數(shù)在幾百億,而且小米大模型將會(huì)落地小愛同學(xué)、loT、自動(dòng)駕駛、機(jī)器人等現(xiàn)有場(chǎng)景中,并利用豐富的應(yīng)用場(chǎng)景反哺大模型能力。

成立僅僅四個(gè)月后的今天,小米公布了大模型產(chǎn)品——MiLM-6B,并在C-Eval和CMMLU基準(zhǔn)評(píng)測(cè)上均取得同尺寸較好效果。

其中,在C-Eval評(píng)估中,MiLM-6B的平均得分為60.2,在不同學(xué)科和難度級(jí)別(如STEM、社會(huì)科學(xué)、人文學(xué)科等)得分從42分到71.7分不等。在CMMLU評(píng)估中,MiLM-6B在零樣本和五樣本測(cè)試中的平均得分分別為60.37分和57.17分,表現(xiàn)出良好的知識(shí)和推理能力。

據(jù)悉,C-Eval榜單是清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)共同構(gòu)建的綜合漢語模型評(píng)估套件,而CMMLU則是綜合漢語模型基準(zhǔn)。

預(yù)計(jì)小米將會(huì)于8月14日舉行2023雷軍年度演講,但目前雷軍暫未透露是否會(huì)發(fā)布MiLM-6B大模型技術(shù)。

鈦媒體App向團(tuán)隊(duì)詢問關(guān)于MiLM-6B/1.3B是否開源、產(chǎn)品是否已經(jīng)落地內(nèi)測(cè)等問題,截至發(fā)稿前暫未得到小米官方回復(fù)。(本文首發(fā)鈦媒體App,作者|林志佳)

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 有當(dāng)年網(wǎng)盤大戰(zhàn)那味兒了

    回復(fù) 2023.08.17 · via android
  • 通用大模型的研發(fā)現(xiàn)在看來并不光明

    回復(fù) 2023.08.13 · via android
  • 還是個(gè)噱頭吧

    回復(fù) 2023.08.12 · via android
  • 目測(cè)應(yīng)該還不如文心一言

    回復(fù) 2023.08.12 · via pc
  • 小米現(xiàn)在也不平價(jià)了

    回復(fù) 2023.08.12 · via pc
  • 小米也搞大模型

    回復(fù) 2023.08.12 · via h5
  • 小米務(wù)實(shí),先干出來再說。

    回復(fù) 2023.08.12 · via netease

快報(bào)

更多

09:34

國家統(tǒng)計(jì)局:1-2月份全國規(guī)模以上工業(yè)企業(yè)利潤增長15.2%

09:30

天津臨港綜合保稅區(qū)今日正式封關(guān)運(yùn)行

09:29

A股開盤:三大指數(shù)低開近1%,CPO、先進(jìn)封裝、存儲(chǔ)芯片等概念走弱

09:26

港股黃金股走低,山東黃金跌近6%

09:26

對(duì)沖基金Millennium撤資,與Engineers Gate合作告終

09:23

央行開展1462億元7天期逆回購操作

09:22

港股開盤:恒生指數(shù)低開0.35%,恒生科技指數(shù)低開0.44%

09:17

人民幣兌美元中間價(jià)報(bào)6.9141,下調(diào)85點(diǎn)

09:15

日本政府通過2026財(cái)年臨時(shí)預(yù)算案

09:10

“無人機(jī)動(dòng)力系統(tǒng)第一股”即將上市,三瑞智能正式開啟創(chuàng)業(yè)板網(wǎng)上申購

09:03

美國法院駁回社媒公司X指控樂高、瑪氏等品牌“非法抵制”的訴訟

09:01

國內(nèi)商品期貨開盤,滬銀跌超5%

09:00

富時(shí)中國A50指數(shù)期貨在上一交易日夜盤收跌0.08%的基礎(chǔ)上低開,現(xiàn)跌0.19%

08:54

林俊旸離職后首發(fā)長文,預(yù)測(cè)“智能體式思考”將成為主流

08:53

兩市融資余額減少8.64億元

08:36

報(bào)道稱美國防部考慮向中東增派1萬人地面部隊(duì)

08:35

KKR出售數(shù)據(jù)中心冷卻業(yè)務(wù),交易價(jià)值47.5億美元

08:34

中信證券:2026年油運(yùn)企業(yè)利潤有望創(chuàng)新高

08:34

美聯(lián)儲(chǔ)理事米蘭:資產(chǎn)負(fù)債表縮減或需耗時(shí)數(shù)年

08:33

人工智能公司Anthropic考慮最早10月IPO

7

掃描下載App