2025年1月15日,雲器科技舉行了雲器Lakehouse產品開放註冊釋出會。這標誌著這家專注於資料基礎設施的科技公司,正式向全球使用者開放體驗其創新的雲湖倉產品。

雲器Lakehouse開放註冊
雲器科技CEO喻思成宣佈雲器Lakehouse正式開放註冊,同時宣佈了產品已經完成了在全球七大主流雲平臺的適配,並且已經在大部分雲平臺開服。這意味著雲器提供了統一的資料底座,讓企業可以在異構雲環境中獲得一致的資料平臺體驗。

雲器Lakehouse:基於增量計算的雲湖倉平臺
喻思成表示,十年前“雲”讓計算像水電一樣觸手可及,今天雲器的開放註冊:旨在讓資料和AI更普惠,像煤氣爐一樣觸手可及——不需要專業團隊,不需要開源自建,就是這次雲器開放註冊的意義,開放註冊即所謂GA——General Available,就是“你只管寫SQL,其它的交給雲器”。

雲器Lakehouse完成了全球七大主流雲平臺適配
雲器Lakehouse產品採用了Single-Engine和通用增量計算技術。據云器科技CTO關濤介紹,透過深度最佳化的全Native C++實現的向量化引擎,並得益於軟體、硬體技術、網路技術的突破,Lakehouse產品表現出多面且優異的效能,以在批處理領域為例,雲器Lakehouse在標準TPC-DS 10TB測試中展現出比開源Spark快10倍的效能優勢。
關濤在釋出會上分享了引擎效能突破背後的技術改進項,並逐條解析了效能提升的關鍵因素:自研的基於Cascades模型的CBO最佳化器帶來2倍效能提升,Native引擎實現提供3倍效能提升,直連排程方案實現1.3倍提升,以及預設開啟的自動快取帶來1.3倍效能提升。此外,雲器Lakehouse還實現了MPP和BSP兩種排程模式的融合架構,為不同場景提供最優效能。


統一資料、統一引擎、統一體驗
在產品能力方面,雲器科技Lakehouse產品總監曲寧分享了“統一資料、統一引擎、統一體驗”的設計理念,並詳細分享資料平臺的架構設計。曲寧詳細介紹了平臺的四大核心能力:
-
全面Serverless化的計算服務,支援秒級彈性伸縮
-
基於增量計算實現統一計算模式,可實現ETL鏈路的大幅簡化
-
Data+AI融合分析能力,支援對企業所有資料資產的統一管理
-
一體化的開發治理平臺Lakehouse Studio,提供資料團隊開發運維資料的全家桶套件
值得關注的是,雲器科技在此次釋出會上還重點展示了資料與AI的結合能力。雲器科技AI產品總監孟碩表示,企業已普遍認識到構建AI就緒的知識庫系統是當前AI投資的最佳切入點。為提升企業資料與AI融合能力,雲器科技全面升級資料平臺,新增RAG就緒層,整合向量檢索、倒排索引及語義引擎等關鍵功能。基於升級後的平臺架構,推出兩款創新應用產品:智慧對話式資料分析工具Lakehouse DataGPT,和智慧開發助手Lakehouse Copilot,兩款重要產品功能,致力於讓企業資料資產更易於被AI利用和訪問。
Lakehouse DataGPT基於雲器統一的資料底座,在對話式BI分析場景中,可以準確理解複雜的業務語境,將使用者的自然語言準確轉化為資料查詢,並提供清晰的推理過程展示,確保分析結果的可信度。這些創新有效降低了企業構建AI應用的技術門檻,加速了企業資料智慧化轉型。

雲器提出“通用增量計算”的首個行業標準-SPOT
此次釋出會,雲器展現的一大亮點是增量計算技術——既透過只計算資料變化部分,提升計算效能,保持高效能的同時顯著降低計算成本。關濤談到增量計算技術的巨大潛力,並提出“增量計算將成為繼批處理、流計算、互動分析之後的第四代主流計算模式”。特別地,關濤強調了雲器在增量計算技術前沿的實踐,提出“通用增量計算”概念,旨在讓通用計算不再只是於狹窄場景下具備最佳化意義,而是在更普遍的場景實裝,甚至包括對UDF的支援。
作為業界首個提出並落地通用增量計算(Generic Incremental Computing, GIC)技術的企業,雲器科技CTO關濤在釋出會上系統性地闡述了這一創新技術。通用增量計算是一種同時面向高效能和低延遲最佳化的新計算模式,當上遊資料持續變更時,系統只計算資料變化的部分並與之前的查詢結果合併,從而以最小的計算成本快速生成最新結果。不同於傳統流計算中的增量計算,GIC採用統一的計算邏輯,可以同時支援批處理、流處理和互動式分析三種場景。


通用增量計算的SPOT技術標準
關濤在釋出會上公佈了行業首個通用增量計算的技術標準——SPOT技術標準,旨在促進交流推動行業技術創新,用來推動更多創新和行業交流。

通用增量計算的技術標準-SPOT
SPOT標準:
-
S – Standard SQL with Full Synatx/Semantics
-
P – Performance
-
O – Open Format
-
T – Trade-off seamlessly between T+0 and T+1
CTO關濤分享了過去幾年雲器實現通用增量計算技術的經驗和實現路徑,預告即將在未來向行業公開更多重磅的客戶案例。並表示未來幾個月內將釋出《通用增量計算技術白皮書》,以推動這項技術的發展。
筆者在會後立刻嘗試註冊試用雲器Lakehouse產品,在不到5分鐘的時間就完成了從產品的註冊到執行測試SQL的完整鏈路;除了能夠快速分析資料,筆者也嘗試了雲器Lakehouse的資料匯入、運維、管理功能,直觀的感受是,它不僅提供一個數據處理分析的引擎,也讓我獲得了一整套大資料分析平臺的元件能力。這是原來在網際網路大廠和業內頭部資料型企業才能配備的資料處理和管理能力,現在透過註冊賬號就能獲得。
—— 資料技術普惠正在發生。
*觀看本次釋出會的回放,可以訪問雲器科技官網https://www.yunqi.tech/open2025
下載本次演講的PPT材料,可以關注“雲器科技”公眾號,對話方塊回覆“OPEN2025”獲得完整演講材料下載

