量化機構九坤投資和微軟成功復現(xiàn)DeepSeek-R1
鈦媒體App 2月23日消息,九坤投資與微軟亞洲研究院近日刊文稱,首次成功復現(xiàn)了DeepSeek-R1,特別是其在強化學習領域的成果,同時在技術層面提出了創(chuàng)新性的見解。該學術文章名為Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning,為微軟亞洲研究院、Ubiquant及其他獨立研究人員共同撰寫。據(jù)悉,同為量化巨頭,九坤投資在數(shù)據(jù)、算法、算力方面有著強大的技術儲備和人才儲備,近年來持續(xù)在AI前沿技術領域展開系統(tǒng)且深入的研究,不僅長期探索通用技術并推動其場景應用,還在多個細分領域進行了多元化的研究拓展 ,力求構建更為全面的AI技術體系。在業(yè)內(nèi)看來,DeepSeek的模型全部開源,全球掀起復現(xiàn)DeepSeek-R1的熱潮,此前包括HuggingFace、伯克利大學、上海交大等機構均有相關復現(xiàn)研究,并取得一定的成果。(財聯(lián)社)
本文內(nèi)容僅供參考,不構成投資建議,請謹慎對待。
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論