鈦媒體App 2月6日消息,今日有報(bào)道稱李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員以不到50美元的云計(jì)算費(fèi)用訓(xùn)練了一個(gè)名叫s1的人工智能推理模型,該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn)與OpenAl的o1和Depsek的R1等尖端推理模型類似,引發(fā)廣泛關(guān)注。不過很快,該s1模型被指“并非從零開始訓(xùn)練”,其基座模型為“阿里通義千問(Qwen)模型”。對(duì)此,向阿里云方面求證,阿里云方面確認(rèn)了這一消息,并回應(yīng)稱:“他們以阿里通義千問Qwen2.5-32B-Instruct開源模型為底座,在16塊H100GPU上監(jiān)督微調(diào)26分鐘,訓(xùn)練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數(shù)學(xué)及編碼能力相當(dāng)?shù)男Ч踔猎诟?jìng)賽數(shù)學(xué)問題上的表現(xiàn)比o1-preview高出27%?!?/div>
本文內(nèi)容僅供參考,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
不是說是50萬美元訓(xùn)練出來的嗎?到底是50還是50萬美元?