鈦媒體App 3月11日消息,李開(kāi)復(fù)博士創(chuàng)立的零一萬(wàn)物宣布,公司成功研發(fā)出基于全導(dǎo)航圖的新型向量數(shù)據(jù)庫(kù) “笛卡爾(Descartes)”,并已包攬權(quán)威榜單ANN-Benchmarks 6項(xiàng)數(shù)據(jù)集評(píng)測(cè)第一名。

零一萬(wàn)物表示,在國(guó)際權(quán)威評(píng)測(cè)平臺(tái)ANN-Benchmarks離線測(cè)試中,零一萬(wàn)物笛卡爾向量數(shù)據(jù)庫(kù)比之前榜單上同業(yè)第一名有顯著性能提升,部分?jǐn)?shù)據(jù)集上的性能提升甚至超過(guò)2倍以上,在gist-960-euclidean數(shù)據(jù)集維度更大幅領(lǐng)先榜單原TOP1 286%。

零一萬(wàn)物強(qiáng)調(diào),笛卡爾向量數(shù)據(jù)庫(kù)將應(yīng)用于公司即將正式發(fā)布的 AI 產(chǎn)品中,未來(lái)還將結(jié)合工具提供給廣大開(kāi)發(fā)者。

據(jù)悉,零一萬(wàn)物(01.AI)成立于2023年5月16日,致力于打造全新的 AI 2.0 平臺(tái)與AI-first生產(chǎn)力應(yīng)用的全球化公司,由創(chuàng)新工場(chǎng)董事長(zhǎng)兼CEO李開(kāi)復(fù)博士親自掛帥,擔(dān)任零一萬(wàn)物CEO。

2023年中關(guān)村論壇上,李開(kāi)復(fù)就對(duì)鈦媒體App等表示,以GPT-4等大模型為代表的生成式 AI 熱度在全球蔓延,意味著AI 2.0時(shí)代已經(jīng)到來(lái),它將帶來(lái)比移動(dòng)互聯(lián)網(wǎng)時(shí)代大十倍的機(jī)會(huì),穿透各行各業(yè)極大地提振生產(chǎn)力。“我們預(yù)測(cè),全新的 AI 2.0平臺(tái)將能有效幫助提升人類(lèi)生產(chǎn)力,創(chuàng)造巨大的經(jīng)濟(jì)價(jià)值及社會(huì)價(jià)值。”

2023年11月,零一萬(wàn)物發(fā)布首款研發(fā)的最強(qiáng)開(kāi)源 AI 大模型系列“Yi”,包括Yi-6B(數(shù)據(jù)參數(shù)量為60億)、Yi-34B(340億)兩款,均是雙語(yǔ)(英文/中文)、支持開(kāi)源。

其中,Yi-34B模型在多項(xiàng)評(píng)測(cè)基準(zhǔn)中全球領(lǐng)跑,基于超強(qiáng)Infra下模型訓(xùn)練成本實(shí)測(cè)下降40%,模擬千億規(guī)模訓(xùn)練成本可下降多達(dá)50%,并以更小模型尺寸的基準(zhǔn)結(jié)果超過(guò)LLaMA2-34B/70B、Falcon-180B等大尺寸開(kāi)源模型,以及百川智能(王小川創(chuàng)立)的Baichuan2-13B。

“隨著團(tuán)隊(duì)到位,2023年6、7月份開(kāi)始寫(xiě)第一行代碼,短短四個(gè)月做了非常自豪的產(chǎn)品。我們是‘不鳴則已,一鳴驚人’。所以‘一鳴驚人’之后,如果我們過(guò)半年甚至過(guò)一年回頭看,今天對(duì)我們來(lái)說(shuō)只是剛剛開(kāi)始,我們還會(huì)不斷的去開(kāi)發(fā)、推動(dòng)、宣布更多令人驚艷的成果。”李開(kāi)復(fù)當(dāng)時(shí)表示。

此次公布的向量數(shù)據(jù)庫(kù),又被稱(chēng)為AI時(shí)代的信息檢索技術(shù),是檢索增強(qiáng)生成(RAG)內(nèi)核技術(shù)之一。隨著大模型為代表的AI 2.0時(shí)代到來(lái),圖片、視頻、自然語(yǔ)言等多模態(tài)的非結(jié)構(gòu)化數(shù)據(jù)量陡增。區(qū)別于傳統(tǒng)數(shù)據(jù)庫(kù),向量數(shù)據(jù)庫(kù)專(zhuān)門(mén)用來(lái)存儲(chǔ)、管理、查詢(xún)和檢索向量化的非結(jié)構(gòu)化數(shù)據(jù),而ChatGPT模型進(jìn)一步強(qiáng)化了向量數(shù)據(jù)庫(kù)的作用。

截至目前,Google、微軟、Met 等大廠的相關(guān)向量大模型產(chǎn)品先后問(wèn)世,Zilliz、Pinecone、Weaviate、Qdrant等創(chuàng)業(yè)公司也異軍突起。2023年,OpenAI的向量數(shù)據(jù)庫(kù)合作方Pinecone完成了B輪1.38億美元融資,國(guó)內(nèi)初創(chuàng)企業(yè)Fabarta ArcNeural也完成了上億元Pre-A輪融資。

如今,李開(kāi)復(fù)帶領(lǐng)的團(tuán)隊(duì)也自主研發(fā)出全新的向量數(shù)據(jù)庫(kù)。

具體來(lái)說(shuō),零一萬(wàn)物笛卡爾主要聚焦于高性能向量數(shù)據(jù)庫(kù),采用領(lǐng)先的全導(dǎo)航圖技術(shù)、首創(chuàng)自適應(yīng)鄰居選擇策略等新功能,以及采用了兩級(jí)量化方案增強(qiáng)RAG,在處理復(fù)雜查詢(xún)、提高檢索效率、優(yōu)化數(shù)據(jù)存儲(chǔ)方面相比業(yè)界擁有顯著的比較優(yōu)勢(shì)。另外,零一萬(wàn)物還采用索引結(jié)構(gòu)優(yōu)化、連通性保障等全棧向量技術(shù)方案,從而提高笛卡爾向量數(shù)據(jù)庫(kù)的性能。

以電商推薦場(chǎng)景為例。上架商品數(shù)量可能千萬(wàn)級(jí),每個(gè)商品可以由一個(gè)向量表達(dá),即使庫(kù)中向量數(shù)不算很大,如果電商用戶(hù)基數(shù)非常龐大,高峰時(shí)每秒用戶(hù)請(qǐng)求數(shù)非常大,可能達(dá)到幾十萬(wàn)甚至上百萬(wàn)的吞吐量QPS(每秒內(nèi)處理的請(qǐng)求數(shù)),使用高性能向量數(shù)據(jù)庫(kù)可以有效提升電商場(chǎng)景里面搜索、廣告業(yè)務(wù)的推薦效果,促進(jìn)銷(xiāo)售額增長(zhǎng)。

零一萬(wàn)物表示,笛卡爾擁有超高精度、超高性能兩個(gè)優(yōu)點(diǎn):一、超高精度,基于多層縮略圖和坐標(biāo)系實(shí)現(xiàn)層間導(dǎo)航和圖上方位導(dǎo)航,以及圖連通性保障,實(shí)現(xiàn)精度大于99%,相同性能下,精度大幅領(lǐng)先業(yè)內(nèi)水平;二、超高性能,高效的邊選擇和裁剪技術(shù),千萬(wàn)數(shù)據(jù)庫(kù)ms(秒級(jí))響應(yīng)。

該公司指出,在兩級(jí)量化降低計(jì)算復(fù)雜方面,相比傳統(tǒng)PQ查表,笛卡爾向量數(shù)據(jù)庫(kù)的性能得到大幅提升到2-3倍;目標(biāo)向量層面,笛卡爾讓RAG向量檢索性能提高15%-30%,從而幫助企業(yè)客戶(hù)構(gòu)建私域知識(shí)庫(kù)、智能客服系統(tǒng);在自動(dòng)駕駛領(lǐng)域,使用高性能向量數(shù)據(jù)庫(kù)可來(lái)加速自動(dòng)駕駛模型訓(xùn)練等。

基準(zhǔn)測(cè)試層面,在glove-25-angular、glove-100-angular、sift-128-euclidean、nytimes-256-angular、fashion-mnist-784-euclidean、gist-960-euclidean六大數(shù)據(jù)集中,零一萬(wàn)物笛卡爾向量數(shù)據(jù)庫(kù)在6項(xiàng)數(shù)據(jù)集評(píng)測(cè)中都處于最高位。

零一萬(wàn)物強(qiáng)調(diào),笛卡爾向量數(shù)據(jù)庫(kù)是團(tuán)隊(duì)基于RAG的初步嘗試,將在近期發(fā)布的AI生產(chǎn)力產(chǎn)品中得到有效應(yīng)用。未來(lái)各家大模型優(yōu)化到一定程度后,向量數(shù)據(jù)庫(kù)的能力可能決定各家大模型的天花板。零一萬(wàn)物后續(xù)會(huì)持續(xù)專(zhuān)注研發(fā)和分享,為用戶(hù)帶來(lái)更好的技術(shù)和體驗(yàn)。

“零一萬(wàn)物的數(shù)據(jù)處理管線、算法研究、實(shí)驗(yàn)平臺(tái)、GPU資源和 AI Infra 都已經(jīng)準(zhǔn)備好,我們的動(dòng)作會(huì)越來(lái)越快”。李開(kāi)復(fù)表示,零一萬(wàn)物希望有更多的開(kāi)發(fā)者使用Yi系列模型,打造自己場(chǎng)景中的“ChatGPT”,引領(lǐng)下一代前沿創(chuàng)新和商業(yè)模型,探索走向通用 AI 時(shí)代。

鈦媒體App了解到,零一萬(wàn)物即將推出基于 AI 2.0 的超級(jí)應(yīng)用產(chǎn)品。

(本文首發(fā)鈦媒體App,作者|林志佳)

 

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶(hù)分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

17:56

西部材料:控股股東西北有色金屬研究院擬減持不超1%公司股份

17:55

葵花藥業(yè):投資1000萬(wàn)元設(shè)立全資子公司

17:54

海亮股份:控股子公司擬50.5億元投建年產(chǎn)6.75萬(wàn)噸銅箔生產(chǎn)線項(xiàng)目

17:51

阿里通義:CoPaw 1.0正式發(fā)布

17:45

上海國(guó)際能源交易中心對(duì)部分客戶(hù)采取限制開(kāi)倉(cāng)監(jiān)管措施

17:45

南向資金今日凈買(mǎi)入約7.03億港元

17:43

玻色量子獲10億元B輪融資

17:42

平高電氣:合計(jì)中標(biāo)約12.23億元國(guó)家電網(wǎng)采購(gòu)項(xiàng)目

17:38

鄭商所發(fā)布2026年清明節(jié)休市期間風(fēng)險(xiǎn)提示的函

17:34

美以襲擊致霍爾木茲海峽一海水淡化廠受損

17:33

4月3日-7日期間香港入境處預(yù)計(jì)約有644萬(wàn)人次進(jìn)出香港

17:30

神劍股份:公司商業(yè)航天業(yè)務(wù)相關(guān)收入占比較小

17:27

上海至塔什干直航航線成功首航

17:23

煌上煌:控股股東一致行動(dòng)人終止協(xié)議轉(zhuǎn)讓部分股份

17:23

國(guó)內(nèi)航線燃油附加費(fèi)4月5日起上漲5倍

17:22

建設(shè)銀行:首席財(cái)務(wù)官生柳榮因年齡原因辭任

17:21

滬深交易所公布2026年清明節(jié)休市安排

17:18

央行:外匯市場(chǎng)供求基本平衡,人民幣匯率在合理均衡水平上保持基本穩(wěn)定

17:17

央行:推動(dòng)中小銀行聚焦主責(zé)主業(yè),增強(qiáng)銀行資本實(shí)力

17:14

央行:要繼續(xù)實(shí)施適度寬松的貨幣政策,促進(jìn)經(jīng)濟(jì)穩(wěn)定增長(zhǎng)和物價(jià)合理回升

掃描下載App