在人工智能技術(shù)迅猛發(fā)展的今天,數(shù)據(jù)庫的角色正在經(jīng)歷深刻變革。
曾經(jīng)作為“數(shù)據(jù)倉庫”被動存儲信息的數(shù)據(jù)庫,如今正加速演變?yōu)轵?qū)動業(yè)務(wù)決策的“智能中樞”。這一轉(zhuǎn)變不僅帶來了技術(shù)層面的革新,更對數(shù)據(jù)庫系統(tǒng)的底層架構(gòu)和綜合能力提出了全新要求。但技術(shù)熱點(diǎn)的層出不窮往往容易讓人眼花繚亂,真正能夠穿越技術(shù)周期、支撐企業(yè)核心業(yè)務(wù)穩(wěn)定運(yùn)行的,是扎實(shí)的工程化能力。
這恰恰成為檢驗(yàn)數(shù)據(jù)庫廠商實(shí)力的試金石,也是決定企業(yè)AI戰(zhàn)略能否成功落地的關(guān)鍵所在。“OceanBase對于技術(shù)工程化的追求,是他們(客戶)選我們的重要原因。”在日前舉行的2025 OceanBase年度發(fā)布會上,CEO楊冰如此總結(jié)過去十五年贏得客戶信賴的原因。數(shù)據(jù)顯示,OceanBase當(dāng)前客戶數(shù)突破4000家,連續(xù)5年客戶數(shù)年均增長超100%。
![]()
延續(xù)工程化的理念,今年,針對AI應(yīng)用需求的爆發(fā),OceanBase重磅推出了首個AI原生混合搜索數(shù)據(jù)庫seekdb,想要推動數(shù)據(jù)庫從傳統(tǒng)“業(yè)務(wù)支撐系統(tǒng)”邁向“AI原生數(shù)據(jù)入口”。這是這家經(jīng)歷十五年長跑的國產(chǎn)數(shù)據(jù)庫,自啟動“Data×AI”戰(zhàn)略以來,幾經(jīng)打磨交出的一份新答卷。
OceanBase的十五年,是一部由真實(shí)業(yè)務(wù)壓力驅(qū)動的技術(shù)進(jìn)化史,并塑造了其獨(dú)特的工程化基因。
從支撐支付寶“雙11”單日6100萬次/秒的數(shù)據(jù)庫處理峰值,到服務(wù)全球4000余家企業(yè),OceanBase的每一步都踩在業(yè)務(wù)需求上,每一次架構(gòu)躍遷都源于對具體場景難題的攻堅(jiān)。而業(yè)務(wù)場景的特殊性,也給OceanBase提出了極高要求,“只有一次機(jī)會,一次就要做對。那就意味著從代碼設(shè)計(jì)、代碼規(guī)范、測試上線等一系列的環(huán)節(jié)都不能有大的失誤。”OceanBase CTO楊傳輝表示。
除了場景,據(jù)OceanBase內(nèi)部人士介紹,這種獨(dú)特的技術(shù)文化深深植根于創(chuàng)始人陽振坤的技術(shù)理念,并在團(tuán)隊(duì)中代代相傳。陽振坤博士從項(xiàng)目立項(xiàng)之初,就為OceanBase定下了“做世界級的數(shù)據(jù)庫”這一高遠(yuǎn)目標(biāo),并將“追求極致細(xì)節(jié)”的工匠精神融入團(tuán)隊(duì)血脈,這深刻影響了OceanBase對待技術(shù)和產(chǎn)品的態(tài)度。
![]()
不追求表面炫技,而是專注于解決實(shí)際問題,OceanBase內(nèi)部盛行“用benchmark說話”的風(fēng)氣,任何技術(shù)方案的優(yōu)劣都通過嚴(yán)謹(jǐn)?shù)臏y試和實(shí)際數(shù)據(jù)來驗(yàn)證。“如果你做的東西沒有辦法專注到細(xì)節(jié),就講一些泛泛的東西,在OceanBase的技術(shù)團(tuán)隊(duì)里面是得不到尊重的,大家會覺得你不太懂。”楊傳輝坦言。
對工程化近乎偏執(zhí)的堅(jiān)守,讓OceanBase這十五年的技術(shù)演進(jìn),經(jīng)歷了幾個關(guān)鍵的技術(shù)里程碑,它們逐步構(gòu)建起今日的一體化架構(gòu)能力。
首先是原生分布式架構(gòu)的奠基。OceanBase從一開始就選擇了兩條關(guān)鍵的技術(shù)路徑:基于LSM-Tree的存儲引擎和基于Multi-Paxos的數(shù)據(jù)一致性協(xié)議。LSM-Tree存儲引擎為海量數(shù)據(jù)的高效寫入與存儲提供了底層支撐,而Multi-Paxos協(xié)議則在分布式環(huán)境下保障了數(shù)據(jù)的強(qiáng)一致性。這兩項(xiàng)核心技術(shù)的選擇,展現(xiàn)了團(tuán)隊(duì)對分布式數(shù)據(jù)庫本質(zhì)的深刻理解,為后續(xù)所有能力的構(gòu)建奠定了基礎(chǔ)。
其次是單機(jī)分布式一體化架構(gòu)的突破(V4.0版本)。傳統(tǒng)認(rèn)知中,分布式數(shù)據(jù)庫往往意味著復(fù)雜的部署和一定的性能損耗,而單機(jī)數(shù)據(jù)庫則難以擴(kuò)展。OceanBase 4.0版本打破了這一固有認(rèn)知,首創(chuàng)單機(jī)分布式一體化架構(gòu),使得數(shù)據(jù)庫在單機(jī)環(huán)境下也能具備分布式能力,同時在分布式場景下保持極致性能。這一創(chuàng)新極大地降低了用戶的使用門檻,讓企業(yè)可以根據(jù)自身業(yè)務(wù)發(fā)展階段平滑演進(jìn),無需在架構(gòu)選擇上過早下注。
再次是這次新推出的TP/AP/AI融合的一體化內(nèi)核(V4.4版本)。面對AI時代的多模數(shù)據(jù)和混合負(fù)載需求,OceanBase 4.4版本首次將TP(事務(wù)處理)、AP(分析處理)與AI能力集成于單一內(nèi)核。這意味著,企業(yè)可以在一個數(shù)據(jù)庫中同時處理高并發(fā)交易、復(fù)雜數(shù)據(jù)分析以及AI驅(qū)動的混合搜索,無需維護(hù)多套系統(tǒng)。這種深度融合,是對數(shù)據(jù)庫架構(gòu)的一次重大重構(gòu),充分體現(xiàn)了OceanBase在工程化方面的深厚積累。
通過這三個關(guān)鍵技術(shù)節(jié)點(diǎn)的突破,OceanBase以工程化能力為驅(qū)動,不斷重新定義分布式數(shù)據(jù)庫的技術(shù)邊界,為AI時代的數(shù)據(jù)底座構(gòu)建了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。
數(shù)據(jù)的正確性是數(shù)據(jù)庫的生命線,尤其在金融交易、政務(wù)管理等關(guān)鍵場景,一個字節(jié)的錯誤都可能引發(fā)災(zāi)難性后果。OceanBase將“正確性第一”奉為工程化實(shí)踐的核心準(zhǔn)則,為此構(gòu)建了一套從代碼到硬件的全鏈路掌控體系。
在軟件層面,OceanBase堅(jiān)持根自研路線,從零開始編寫代碼,對每一行指令都保持極致掌控。其300萬行核心代碼中,超過50%用于構(gòu)建自檢機(jī)制,從數(shù)據(jù)在內(nèi)存中的流轉(zhuǎn)、主備節(jié)點(diǎn)間的同步,到落盤存儲的校驗(yàn),形成了一張密不透風(fēng)的“防護(hù)網(wǎng)”。
硬件層面,OceanBase選擇繞過操作系統(tǒng)的部分抽象層,直接操控CPU、內(nèi)存與磁盤資源。通過自研內(nèi)存管理機(jī)制優(yōu)化數(shù)據(jù)緩存策略,基于磁盤I/O特性設(shè)計(jì)存儲布局,甚至對網(wǎng)絡(luò)傳輸協(xié)議進(jìn)行深度定制,實(shí)現(xiàn)了對硬件資源的精細(xì)化利用。
“我們內(nèi)部流行一句話,不相信硬件,也不相信任何的軟件,我們只相信我們自己。”在現(xiàn)場,楊冰如此總結(jié)工程化精神。這種對工程化的偏執(zhí)雖然大幅提升了開發(fā)復(fù)雜度,卻為系統(tǒng)穩(wěn)定性和性能優(yōu)化奠定了底層基礎(chǔ)。
傳統(tǒng)數(shù)據(jù)庫架構(gòu)在AI時代面臨嚴(yán)峻挑戰(zhàn):事務(wù)處理(TP)、分析處理(AP)與AI推理負(fù)載分散在不同系統(tǒng),導(dǎo)致數(shù)據(jù)孤島、鏈路冗長和資源浪費(fèi)。OceanBase以一體化架構(gòu)打破這一困局,其核心在于實(shí)現(xiàn)多模數(shù)據(jù)融合、多工作負(fù)載融合與數(shù)模融合等“三大融合”,形成真正意義上的一體化數(shù)據(jù)基座。
在混合搜索場景中,傳統(tǒng)架構(gòu)需調(diào)用向量數(shù)據(jù)庫、全文搜索引擎和關(guān)系型數(shù)據(jù)庫才能完成一次復(fù)雜查詢,而OceanBase通過“粗排+精排”多階段檢索機(jī)制,可在毫秒級內(nèi)完成向量語義匹配、關(guān)鍵詞精確查找與標(biāo)量條件過濾的融合計(jì)算。
“如果不是工程化文化,我們會走另外一條路線,出5個產(chǎn)品,分布式TP、單機(jī)TP、分布式AP、單機(jī)AP等都分別出一個,但我們最終只做了一個。這些工程化的挑戰(zhàn)被我們‘吃掉’以后,對用戶就意味著拿到一個非常簡單、高效、統(tǒng)一的方案——這是AI時代的要求,也是現(xiàn)代化數(shù)據(jù)架構(gòu)的根本要求。”楊傳輝表示。
體現(xiàn)在金融反欺詐場景中,OceanBase能實(shí)時響應(yīng)規(guī)定時間段內(nèi)復(fù)雜篩選條件的復(fù)合查詢,無需跨系統(tǒng)拼接結(jié)果。這種原生一體化設(shè)計(jì),較傳統(tǒng)多系統(tǒng)架構(gòu)性能成倍提升,同時顯著降低運(yùn)維成本。此外,4.4版本引入的共享存儲架構(gòu),更是將存算分離推向新高度,計(jì)算節(jié)點(diǎn)可彈性擴(kuò)縮、存儲成本較傳統(tǒng)方案降低50%-90%,這都為AI時代的海量數(shù)據(jù)存儲提供了經(jīng)濟(jì)高效的解決方案。
這種架構(gòu)創(chuàng)新從數(shù)據(jù)庫內(nèi)核層面深度重構(gòu),解決了AI時代打通多云底座的核心能力,也彰顯了OceanBase以工程化思維解決復(fù)雜問題的能力。
面對AI時代多模態(tài)數(shù)據(jù)檢索與實(shí)時推理的需求,OceanBase推出首款A(yù)I原生混合搜索數(shù)據(jù)庫seekdb,以“輕量、敏捷、開源”為核心定位,重新定義AI數(shù)據(jù)基座的工程化標(biāo)準(zhǔn)。其核心突破在于首創(chuàng)“向量+全文+標(biāo)量+GIS”四維混合搜索能力,通過“粗排+精排”多階段檢索機(jī)制,在百億級數(shù)據(jù)規(guī)模下實(shí)現(xiàn)毫秒級響應(yīng)。
![]()
據(jù)悉,seekdb并非簡單集成向量搜索插件,而是以工程化思維重構(gòu)AI數(shù)據(jù)基座。它繼承OceanBase分布式內(nèi)核的基因,并將部署門檻進(jìn)一步降低,最低起步配置僅需1核CPU、2GB內(nèi)存,支持pip install一鍵安裝、秒級啟動,兼容嵌入式與客戶端/服務(wù)器雙部署模式,讓開發(fā)者無需關(guān)注底層架構(gòu)即可快速構(gòu)建知識庫、智能體等應(yīng)用。
同日,seekdb也宣布以Apache 2.0協(xié)議全球開源,無縫對接LangChain、LlamaIndex、Dify等30余種主流AI框架。同步開源PowerRAG智能文檔解析框架與PowerMem分層記憶架構(gòu),后者在LOCOMO Benchmark測評中以78.70分刷新SOTA紀(jì)錄,Token消耗降低96%。
OceanBase的混合搜索能力已在聯(lián)通統(tǒng)一AI知識庫、螞蟻百寶箱智能體等場景充分驗(yàn)證了技術(shù)價值。中國聯(lián)通基于混合搜索構(gòu)建統(tǒng)一AI知識庫,有效解決了私有文檔的權(quán)限管理與高效檢索難題;螞蟻百寶箱則基于混合搜索實(shí)現(xiàn)智能體的實(shí)時在線搜索,顯著提升了信息獲取的精準(zhǔn)性與響應(yīng)效率。
在這之外,數(shù)模融合是OceanBase原生AI架構(gòu)的另一核心突破。數(shù)據(jù)庫內(nèi)置AI Function能力,支持在SQL中直接調(diào)用Embedding模型生成向量,或通過Rerank優(yōu)化檢索結(jié)果,形成“數(shù)據(jù)寫入-向量化-檢索-推理”的閉環(huán)。配套的MaaS平臺可管理主流大語言模型與國產(chǎn)GPU算力,實(shí)現(xiàn)模型微調(diào)、量化壓縮、推理加速的全生命周期管理。這種設(shè)計(jì)使AI能力與數(shù)據(jù)庫內(nèi)核形成有機(jī)整體。
OceanBase的實(shí)踐印證,唯有通過工程化重構(gòu)實(shí)現(xiàn)的原生AI能力,才能真正突破“數(shù)據(jù)孤島”與“性能瓶頸”,支撐企業(yè)在AI時代的可持續(xù)創(chuàng)新。“這不僅是技術(shù)產(chǎn)品,更是開發(fā)范式的躍遷。”楊冰表示,“傳統(tǒng)數(shù)據(jù)庫只‘存’數(shù)據(jù),而seekdb能‘理解’數(shù)據(jù)語義,混合搜索正是AI原生數(shù)據(jù)庫的關(guān)鍵分水嶺。”
OceanBase的工程化能力已在全球市場獲得廣泛認(rèn)可,截至目前,其服務(wù)的企業(yè)客戶數(shù)量已突破4000家,覆蓋金融、政企、能源、通信、零售、制造、互聯(lián)網(wǎng)等關(guān)鍵領(lǐng)域,服務(wù)網(wǎng)絡(luò)遍及全球16個國家和地區(qū)、60多個地域、240多個可用區(qū)。
競爭激烈的金融領(lǐng)域,OceanBase憑借金融級的穩(wěn)定性和可靠性,市場份額位居第一,成為眾多金融機(jī)構(gòu)核心業(yè)務(wù)系統(tǒng)的首選數(shù)據(jù)庫。平安壽險將其7000人規(guī)模的財務(wù)系統(tǒng)遷移至OceanBase平臺,實(shí)現(xiàn)了業(yè)務(wù)的穩(wěn)定運(yùn)行和高效管理,充分驗(yàn)證了OceanBase在支撐大型企業(yè)關(guān)鍵業(yè)務(wù)場景下的工程化實(shí)力。![]()
除金融領(lǐng)域外,OceanBase在政務(wù)和通信行業(yè)也取得了顯著進(jìn)展。全國三分之一的省級人社系統(tǒng)都采用OceanBase構(gòu)建數(shù)據(jù)底座,有效提升了社保服務(wù)的效率和穩(wěn)定性。通信巨頭中國聯(lián)通基于OceanBase混合搜索能力構(gòu)建統(tǒng)一AI知識庫,成功解決了私有文檔的權(quán)限管理與高效檢索難題,進(jìn)一步拓展了OceanBase的應(yīng)用邊界。
OceanBase也正積極推進(jìn)全球化戰(zhàn)略,重點(diǎn)布局東南亞、拉美和中東等新興市場,目標(biāo)將海外營收占比提升至20%。這一進(jìn)程中,工程化能力成為克服本地化挑戰(zhàn)的關(guān)鍵。在老撾,老中銀行采用OceanBase構(gòu)建核心業(yè)務(wù)系統(tǒng),性能提升20倍、批量處理縮至30分鐘,成本僅為同類方案20%,實(shí)現(xiàn)中國自研數(shù)據(jù)庫海外銀行核心系統(tǒng)的首單落地。這些來自不同行業(yè)的實(shí)踐案例,充分證明了OceanBase工程化能力在解決實(shí)際業(yè)務(wù)問題上的有效性,也為更多企業(yè)的數(shù)字化轉(zhuǎn)型提供了可參考的技術(shù)路徑。
據(jù)Gartner預(yù)測,到2028年,支持生成式AI的數(shù)據(jù)庫支出將達(dá)2180億美元,占市場74%。市場潛力巨大,世界數(shù)據(jù)庫行業(yè)也將因?yàn)锳I時代的到來迎接一個新拐點(diǎn)。如楊冰所說,這個拐點(diǎn)不僅僅是工具的升級,更是計(jì)算范式以及數(shù)據(jù)能力的重塑,“把AI能力融進(jìn)數(shù)據(jù)庫,變成內(nèi)生動力,打造一個AI Native數(shù)據(jù)庫,這條路會使得我們離世界級數(shù)據(jù)庫的夢想更近。” (文|ToB深水區(qū),作者|秦聰慧)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論