搜狗創(chuàng)始人、百川智能創(chuàng)始人兼CEO 王小川(來源:受訪者提供)

隨著8月底百川大模型對外開放,王小川團隊加速研發(fā)新產(chǎn)品。

鈦媒體App獲悉,9月6日下午,人工智能(AI)大模型公司 百川智能在北京發(fā)布最新70億、130億參數(shù)的兩款Baichuan2系列開源大模型Baichuan2-7B、Baichuan2-13B,文科理科能力全面提升,支持中、英等數(shù)十種語言,應用于學術(shù)研究、互聯(lián)網(wǎng)、金融等領(lǐng)域。

相比一代,Baichuan2數(shù)學能力提升49%,代碼能力提升46%,安全能力提升37%,邏輯能力提升25%,語義理解能力提升15%,均處于開源模型最好水平。

百川智能創(chuàng)始人兼CEO 王小川表示,70億參數(shù)的Baichuan2-7B在中英文主流任務全面超越Meta研發(fā)的開源大模型Llama2-13B。隨著國內(nèi)Baichuan2開源大模型的發(fā)布,再用Llama 2作為大家一個開源模型的時代已經(jīng)過去了。

“我們現(xiàn)在可以獲得一個比Llama2更加友好、能力更強的這樣一個開源模型,能夠去幫助我們扶持中國整個大模型生態(tài)發(fā)展。那么除了開源模型之外,下次我們再閉源里面可能會有一個新的突破,希望能夠在大模型領(lǐng)域為中國社會經(jīng)濟發(fā)展帶來我們的貢獻。”王小川表示。

清華大學計算機系教授、中國科學院院士張鈸表示,盡管中國已經(jīng)發(fā)布了眾多參數(shù)規(guī)模從幾十億到幾百億的大型模型和相應的企業(yè),但這些模型大多應用于工業(yè)領(lǐng)域,學術(shù)研究的應用卻相對較少,尤其大模型幻覺問題嚴重。百川開源大模型在學術(shù)研究上的應用顯得尤為重要和緊迫,這有助于我們更深入地解釋和理解大模型技術(shù)。

“我們必須深入探討和明確這些(可解釋、幻覺)問題,只有這樣,我們才能更好地發(fā)展中國的大模型產(chǎn)品。”張鈸稱。

據(jù)悉,百川智能創(chuàng)立于今年4月10日,由搜狗創(chuàng)始人王小川、前搜狗COO茹立云聯(lián)合成立,旨在打造中國版的OpenAI,構(gòu)建中國最好的大模型底座,并在教育、醫(yī)療等領(lǐng)域應用落地。截至目前,百川智能已公布首輪5000萬美元融資。

過去149天,百川智能平均每28天發(fā)布一款大模型,已連續(xù)推出70億、130億參數(shù)的兩款開源大模型Baichuan-7B、Baichuan-13B,以及今年8月公布的530億參數(shù)、面向B端用戶的閉源通用大模型Baichuan-53B,在寫作、文本創(chuàng)作等領(lǐng)域能力已達到行業(yè)較好水平。

王小川此前對鈦媒體App表示,開源大模型里面,百川智能在中文領(lǐng)域現(xiàn)在就可以替代,在某些應用中已經(jīng)超越閉源的GPT模型,未來其開源模型能力一定會超越Meta Llama 2。他強調(diào),未來可能80%的場景會用到開源模型。而百川智能目前已完成了“開源+閉源”大模型并行布局,希望做到中國最好的、對標GPT的模型。

據(jù)悉,截至目前,百川開源大模型已經(jīng)在開源社區(qū)總下載量超越500萬。其中,Hugging Face首周下載量達百萬,近一個月的下載量337萬。而且在Github上,baichuan系列模型是星標月漲幅最快的中國大模型。

企業(yè)端,截至目前,已經(jīng)又超過200家企業(yè)已申請百川大模型開源和商業(yè)授權(quán),并已將百川模型投入實際生產(chǎn)場景。企業(yè)涵蓋互聯(lián)網(wǎng)、軟件和信息技術(shù)、金融、法律、教育、制造業(yè)、企業(yè)服務等眾多領(lǐng)域,客戶包括阿里云、騰訊、火山引擎、京東科技、順豐科技、浪潮、中國農(nóng)業(yè)銀行、蔚來汽車等。

今年8月31日,百川智能旗下產(chǎn)品“百川大模型”等10余款大模型產(chǎn)品完成備案,成為中國首批面向公眾提供類似ChatGPT服務的 AI 大模型產(chǎn)品。

此次,百川智能公布的最新開源大模型Baichuan2系列,文科理科全面提升,擁有2.6TB訓練的超大規(guī)模語料,數(shù)據(jù)方面規(guī)模大、覆蓋全、質(zhì)量優(yōu),篇章、段落、句子質(zhì)量打分,支持細顆粒采樣,訓練則是高效、穩(wěn)定、可預測,安全方面實施了安全價值觀對齊,實現(xiàn)了多階段多目標的強化學習。同時,百川Baichuan2系列開源大模型提供更透明、更開放,公布了3000億-2.6萬億tokens的模型訓練中間過程,助力大模型研究。

另外,王小川還宣布,中國計算機學會(CCF)和百川聯(lián)合成立大模型研究基金,旨在推動圍繞大模型不同階段、不同維度等相關(guān)技術(shù)研究,支持醫(yī)療、開放世界Agent。而且,百川智能還將與亞馬遜云科技成立AI黑客松活動,在醫(yī)療健康、游戲娛樂兩大賽道支持AI大模型研究,冠軍獎勵超過20萬元。

合作伙伴方面,百川智能與阿里云、高通、英博數(shù)科、瀚博半導體、火山引擎、寒武紀、華為等公司合作落地百川大模型。

王小川早前向鈦媒體App透露,百川智能將在今年第四季度發(fā)布千億參數(shù)模型,預計明年一季度前后推出 “超級應用”。

(本文首發(fā)鈦媒體App,作者|林志佳)

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 底座模型不會用人家的來微調(diào)的吧,要論知識產(chǎn)權(quán),論實干,國內(nèi)這群互聯(lián)網(wǎng)公司真是每一個能打

    回復 2023.09.06 · via netease
  • 意思就是,百川

    回復 2023.09.06 · via netease
  • 已經(jīng)在本地試過了,很不錯

    回復 2023.09.06 · via netease
  • 基于那個開源項目改沒說

    回復 2023.09.06 · via netease
4

掃描下載App