
MariaDB 最近釋出了 MariaDB Community Server 11.8,作為 2025 年的年度長期支援(LTS)版本,現已普遍可用。新版本引入了整合的向量搜尋功能,適用於 AI 驅動和相似性搜尋應用程式,增強了 JSON 功能,並提供了用於資料歷史和審計的時態表。
新的向量資料型別允許更復雜的資料儲存和檢索,特別適用於機器學習和資料科學應用,在這些應用中資料的向量表示很常見。雖然在早期版本中已經添加了向量支援,如之前在 InfoQ 上報道的,這是第一個允許開發人員儲存嵌入並與傳統關係資料一起查詢的 LTS 版本。MariaDB 基金會的執行長 Kaj Arnö 寫道:
這無疑是 MariaDB 11.8 LTS 最顯著的亮點:全面支援 MariaDB Vector(……) 向量搜尋能力對於 RAG 和其他現代 AI 和機器學習應用至關重要,可以在大型資料集上進行相似性搜尋。MariaDB Vector 現在以 LTS 形式得到全面支援,為你提供未來幾年的穩定性和可預測性。
MariaDB Vector 包括一個原生的向量資料型別,用於最近鄰搜尋的索引,用於計算向量相似度的函式(VEC_DISTANCE_EUCLIDEAN、VEC_DISTANCE_COSINE 和 VEC_DISTANCE),以及用於將二進位制向量轉換為其文字表示和返回的函式(VEC_FromText 和 VEC_ToText)。此外,該特性為 Intel(AVX2 和 AVX512)、ARM 和 IBM Power10 CPU 提供了 SIMD 硬體最佳化。
新功能允許針對流行的用例在高維資料上進行相似性搜尋,如語義搜尋、推薦引擎和異常檢測的用例。今年早些時候,資料庫專家 Mark Callaghan 進行了基準測試,比較了 MariaDB、Qdrant 和 Postgres(pgvector)在大型資料集上的表現。他得出結論:
如果你已經在執行 MariaDB 或 Postgres 了,那麼我建議你也使用它們進行向量索引 (……) 我有偏見。我對部署一個新的 DBMS 來支援僅一種資料型別(向量)持懷疑態度,除非你在生產環境中沒有其他 DBMS,或者你的生產 DBMS 不支援向量索引。
Vettabase 的創始人 Federico Razzoli 在這一版本進行了深入的審查,他強調了一些他最喜歡的改進,包括並行轉儲、PARSEC 身份驗證和新的 SQL 語法,以及遺漏的內容,如目錄。關於向量搜尋,他寫道:
根據 Mark Callaghan 的基準測試,MariaDB 向量比 pgvector 更快。但這裡有一些注意事項。如果我們只關心效能,最大的問題是 MariaDB 顯然決定永不使用 SQL 以外的語言來實現儲存過程。這意味著嵌入過程必須發生在 MariaDB 之外,通常是在另一個伺服器上,即使原始資料在 MariaDB 中。使用 PostgreSQL,你可以在 Postgres 內完成所有操作。
向量搜尋是 MariaDB 版本的主要功能,但不是唯一的功能:像其他開源關係資料庫一樣,MariaDB 現在已經將 Unicode 作為預設字元集,以使其完全相容當今的多語言和全球應用,並將時間戳範圍從 2038 年擴充套件到 2106 年。Arnö寫道:
像大多數開源專案一樣,我們已經解決了著名的 2038 年問題。但與許多其他專案不同,MariaDB 不需要任何資料轉換就可以實現了這一點——前提是你沒有使用系統版本的表。這意味著在時間戳溢位時,現有資料保持不變,同時可以獲得 80 年的緩期。
該版本改進了對資料歷史記錄和審計的時態表的支援:維護資料修改的完整歷史有助於時間點恢復場景、合規性和安全性。MariaDB plc 的產品經理 Ralf Gebhardt寫道:
時態表最初在 MariaDB 10.3 中引入,現在有了一些增強,它可以自動管理資料的歷史記錄,並簡化了需要沿襲資料的應用程式的開發和維護。
根據 文件,可以從 MariaDB 11.4(之前的 LTS)或任何舊版本升級到 MariaDB 11.8,回溯到 MariaDB Server 10.0 或更早的版本,包括 MySQL Server 的大多數版本。MariaDB 釋出了另一篇文章,介紹如何使用 MariaDB Vector Store 框架構建 AI 應用程式。
主要的雲服務提供商尚未在他們的託管服務上支援最新的 GA 版本,AWS 目前只在 資料庫預覽環境中支援 11.8。
MariaDB 11.8 在 GPLv2 許可下發布,可在 GitHub 上獲得。
原文連結:
https://www.infoq.com/news/2025/06/mariadb-vector-search/
宣告:本文由 InfoQ 翻譯,未經許可禁止轉載。
點選底部閱讀原文訪問 InfoQ 官網,獲取更多精彩內容!
