OceanBase單機版釋出,一體化或成制勝關鍵

作者|冬梅
內卷退潮,資料庫行業進入產品時代
中國分散式資料庫市場正迎來高速增長期。
今年 2 月份,據國際資料公司(IDC)首次釋出的《2024 年上半年中國分散式事務資料庫軟體市場跟蹤報告》顯示,2024 上半年中國分散式事務資料庫軟體市場規模為 1.5 億美元,同比增長 18.5%。
分散式事務資料庫利用分散式技術,突破了傳統集中資料庫的容量與效能瓶頸,簡化了過去依賴人工進行分庫分表的繁雜和高風險工作,並有助於降低資料庫對高效能硬體的依賴。2024 年,分散式事務資料庫產品和技術逐步成熟,已廣泛應用於泛網際網路、金融、運營商等行業,產品應用已經進入規模化階段。
IDC 還預測,2024 年全年,中國分散式事務資料庫市場規模預計為 8.1 億美元,同比增長 20.3%。到 2028 年,中國分散式事務資料庫市場規模將達到 18.2 億美元,2023-2028 的 5 年市場年複合增長率(CAGR)為 22.0%。
根據 Gartner 技術成熟度曲線,當一項技術的市場滲透率超過 20% 時,意味著它已經跨越“鴻溝”,從早期採用者走向早期大眾市場,也意味著,資料庫行業已經開始進入產品化時代。
而這背後的市場驅動力主要來自兩個方面:一是國產升級進入深水區。隨著 2023 年“國測名單”的釋出,金融、電信、政務等關鍵行業的核心繫統開始從“外圍系統升級”轉向“核心系統升級”。中國信通院資料顯示,2023 年金融行業分散式資料庫採購量同比增長 47%,其中核心交易系統佔比首次超過 30%;二是 AI 革命催生新需求。大模型訓練需要處理 PB 級非結構化資料,傳統集中式資料庫面臨巨大挑戰。
IDC 的另一項資料顯示,未來四年,本地部署的國產分散式資料庫市場份額將實現 10 個百分點的跨越式增長,整體市場佔比突破 30% 大關。尤為引人注目的是,2025 年本地部署市場的增速將首次超越雲上部署市場,這對所有資料庫企業來說都是個巨大的機遇。
OceanBase CEO 楊冰認為,2025 年將成為中國資料庫產業發展的重要分水嶺。而在這樣的歷史背景下,OceanBase 順勢而為推出了單機版資料庫,豐富了 OceanBase 產品矩陣中的又一版圖。
單機版 OceanBase,中小規模業務中的“價效比之王”據悉,這款單機版產品基於自主研發的單機分散式一體化架構設計,具備極簡資料庫架構和高度相容性,為中小規模業務提供兼具效能與成本效益的單機資料庫解決方案,滿足客戶從分散式到單機場景的多元化需求。
那麼,OceanBase 為什麼要在這樣的時間節點推出這樣一款單機版產品,它又具備怎樣的產品能力?
簡而言之,這款產品和之前的幾代產品一樣,都是客戶需求的產物。
OceanBase 自 2010 年成立至今始終貫徹“一體化”產品設計理念。三年前,透過技術創新突破分散式資料庫的效能瓶頸,打造出業內首個單機分散式一體化架構,兼顧分散式系統的水平擴充套件優勢與集中式資料庫的單機效能優勢。
OceanBase 產品部總經理楊志豐介紹,此次釋出的單機版,正是在單機分散式一體化架構基礎上持續創新單機技術,進一步擴充套件產品形態,滿足企業從分散式到單機場景的多元化需求。
就產品能力而言,OceanBase 單機版以單機分散式一體化架構為核心,實現了單機部署併兼顧分散式架構的擴充套件性與集中式架構的效能優勢,支援企業資料庫“從小到大”的更多場景下的多樣化需求, 為中小規模業務提供兼具效能與成本效益的單機資料庫解決方案。主要功能包含以下幾點:
100% 根自研、平滑遷移 Oracle/MySQL:透過高度相容 MySQL 及 Oracle,提供自動化遷移評估工具與資料同步引擎,企業可快速完成存量系統的遷移適配。遷移過程中支援線上資料校驗與差異修復,確保業務切換的完整性與一致性,最大程度降低遷移風險與停機時間;
支援 HTAP 混合事務與即時分析處理:基於一體化儲存引擎實現事務處理與即時分析的資源隔離與協同排程,允許在同一份資料上並行執行高併發 OLTP 操作與複雜 OLAP 查詢。透過智慧資源分配演算法避免分析型負載對事務效能的干擾,幫助企業在無需構建獨立數倉的情況下實現即時業務洞察;
具備多模資料處理能力:透過一個引擎原生支援多種資料訪問模式,涵蓋 SQL 和 NoSQL API,滿足多樣化資料模型的需求,簡化資料架構。支援多種資料型別,包括鍵值、JSON、GIS、XML 和 SQL 查詢,並提供 Table API,相容 HBase、Redis API,確保在大規模資料儲存和高效能讀寫場景中,始終展現卓越的處理能力;
內嵌高階壓縮技術:基於 LSM-Tree 儲存引擎的層級壓縮策略,在資料寫入時透過智慧編碼減少冗餘儲存,結合後臺非同步合併機制實現儲存空間節省與查詢效能的平衡。實際測試表明,該技術可將典型業務資料的儲存成本降低 70%~90%,同時保持事務處理延遲不高於傳統行存資料庫;
單機高效能:測試結果表明,在典型的 16 核伺服器配置下,經過 Sysbench 標準測試集的實際測試,OceanBase 單機版在整體效能(包括查詢、批次讀取、寫入、讀寫混合、插入和更新操作)方面全面優於 MySQL 8.0;
具備單機分散式一體化能力:OceanBase 單機版支援透過技術路徑實現平滑擴充套件,基於單機分散式一體化架構實現從單機單節點到多節點分散式架構的平滑升級。該特性使企業能夠根據實際業務規模,在初期階段選擇單機版部署以降低資源投入。隨著業務增長,可透過動態增減節點實現彈性擴充套件,從而確保企業能夠根據不同發展階段選擇最適合的資料庫架構,靈活應對業務需求的變化。
經實際測試,在典型的 16 核伺服器配置下,經過 sysbench 標準測試集的實際測試,OceanBase 單機版的整體效能全面優於 MySQL 8.0。特別是在高併發寫入場景中,透過自適應事務最佳化機制,吞吐量實現顯著提升,最高提升達到 214.99%,能夠滿足高負載場景下的業務需求。
OceanBase 單機版專為中小規模業務場景設計,適用於非核心場景、國產升級場景,以及分散式與單機混合部署場景,幫助企業在分散式核心系統與單機非核心繫統的技術棧統一,多層級分散式與單機混合架構技術棧統一,以及面向單機資料庫國產升級提供不止於平替、面向未來的架構升級。
踐行一體化架構理念,
一路“打怪”,一路升級
OceanBase 的“一體化”之路,經歷了幾個關鍵發展階段。
最初,從早期客戶在網際網路場景 MySQL 需求,到金融行業和電信行業的核心繫統對 Oracle 相容性的需求,推動 OceanBase 一體化 SQL 引擎的出現,透過一個引擎同時實現 Oracle 和 MySQL 兩種資料庫的高度相容,滿足了不同業務的多樣化需求。
2022 年 8 月,OceanBase 釋出 4.0 版本“小魚”,並首次公開提出了單機分散式一體化這一理念,旨在適應大小不同規模的工作負載,實現了分散式可單機部署,進一步降低了大家使用分散式資料庫的複雜度。
4.0 的釋出也徹底顛覆了行業認知——在此之前,公眾對分散式資料庫的普遍認知是需要多臺伺服器部署,更適合服務大企業的海量資料儲存和分析。4.0 證明了,原來分散式資料庫不僅能跑在銀行、電商這些“大塊頭”系統裡,現在連個人小站都能輕鬆駕馭,企業再也不用糾結於是否要採用分散式了,一套架構隨業務自由伸縮,價效比和穩定性都能兼顧。
4.0 釋出後,OceanBase 在一體化產品上持續投入,佈局在多工作負載、多模、向量等一體化能力的持續研發。
2024 年 4 月,OceanBase 4.3 釋出,該版本深入探索 TP/AP 一體化,打造 PB 級即時分析資料庫。該版本從 AP 儲存入手,基於 LSM-Tree 架構推出列式儲存引擎,實現可行存、可行列混存和可列存的多種儲存方式,同時融入分散式 TP 核心能力小事務寫入技術,有效消除資料匯入延遲,滿足更嚴苛的 AP 即時分析需求。同時全新推出基於 Column 資料格式描述的 2.0 向量化引擎和物化檢視,進一步提升了深度 AP 場景下的效能表現,可實現秒級即時分析,極大提升 OLAP 即時分析的能力。
2024 年 10 月,OceanBase 推出 4.3.3 GA 版本,升級向量檢索與索引功能,實現 SQL+AI 一體化。該版本深度融合 AI 與資料庫處理能力,支援多模態資料的融合查詢,幫助企業簡化 AI 技術棧,提升 AI 應用構建效率。
隨著 AI 技術發展,越來越多的 AI 應用不再侷限於純文字來生成回答,涉及的資料型別日益複雜,並且常儲存於 IT 架構的不同資料庫中,這對資料庫提出了新的要求,包括提升效能與響應速度,要求資料庫處理和儲存不同型別的資料,並支援結構化、半結構化及非結構化資料的複雜融合查詢。
基於以上種種可見,OceanBase 一體化資料庫的發展歷程並非簡單的技術堆砌,而是一個與客戶需求深度耦合、持續演進的有機過程。
後 AI 時代,國際資料庫巨頭
競逐“一體化”賽道
過去幾個月,我們見證了以 DeepSeek R1、Gemini 2.5、GPT-4o、Qwen2.5-Max 為代表的一系列大模型的爆炸式湧現,當 AI 開始重構所有行業的運營邏輯時,一體化資料庫正成為突破傳統資料管理瓶頸的關鍵技術。這種新型資料庫架構透過整合多種資料處理能力,有效解決了傳統方案面臨的三大痛點:技術棧割裂帶來的高複雜度、多系統運維的沉重負擔以及跨資料型別處理的效率瓶頸。
不只是 OceanBase 在加快向一體化資料庫演進的速度,放眼國際,不少全球頭部資料庫廠商也在積極推進向一體化資料庫的演進。
作為 NoSQL 資料庫的領頭羊,MongoDB 的核心優勢在於其面向開發者的多模資料庫平臺,例如其 Atlas 服務支援文件、鍵值、圖資料和全文搜尋等多種模型,並透過自動化擴充套件、多雲部署簡化資料架構管理。
近年來,MongoDB 持續最佳化 NoSQL 與 SQL 的融合,例如增強對 JSON 資料的支援,使其既能保持靈活的非關係型資料儲存,又能提供類似 SQL 的查詢體驗。然而,MongoDB 仍需突破的關鍵點在於混合負載(HTAP)的平衡——如何在高併發事務處理(TP)與複雜分析查詢(AP)之間實現更優的資源排程,同時提升資料一致性和查詢效能。
全球單機資料庫領導者 Oracle 也已經透過 Autonomous Database 向一體化方向邁進,整合了 AI、機器學習和多模資料處理能力,支援關係型、文件(JSON)、圖形甚至向量資料等多種模式。
Oracle 的另一大優勢在於其 HTAP 能力,能在同一平臺上高效處理事務型和分析型任務,適用於複雜業務場景。不過,Oracle 仍需解決大規模多租戶環境下的資源隔離和效能最佳化 問題,尤其是在高負載分析任務下如何平衡資源利用率與成本控制。
此外,Amazon Redshift、Google BigQuery 等雲資料倉庫也在不斷最佳化其一體化資料庫的功能和效能,以滿足使用者對高效、靈活資料處理的需求。
隨著企業資料場景日益複雜,單一功能的資料庫已難以滿足需求。包括 MongoDB、Oracle 在內的國際頭部資料庫廠商的探索表明,未來的資料庫不僅需要支援多模資料,還需在 HTAP、AI 整合、雲原生架構等方面持續突破。誰能率先解決這些技術難題,誰就可能在下一代資料庫競爭中佔據先機。

相關文章