
一 業務介紹
二 業務挑戰
三 遞四方即時數倉之路
1 即時數倉1.0

2 即時數倉2.0

-
第一條路徑是:透過DTS把Binlog資料同步到DataHub,然後使用Flink從DataHub中消費資料,把計算結果儲存在Hologres中,這條路徑主要是用於計算一些訪問頻率高且資料量大的資料,比如待攬收單量、入庫單量、待完成單量等。
-
第二條路徑是:業務系統的Binlog資料透過DataWorks同步到Hologres中。Hologres中分了3層,ODS層用於存放原始資料,直接載入原始日誌、資料,資料保持原貌不做處理。一般情況下,以增量的方式從業務系統匯入到ODS層,資料模型和粒度都與業務系統保持一致。DWD層資料明細層,對ODS層資料進行清洗。DWS為彙總層,主要存放寬表。這裡主要是考慮到粒度的不一樣,在Hologres中多表連線查詢能夠發揮其最大的作用。整個架構的任務排程依賴於DataWorks。
四 遞四方與即時數倉Hologres
1 為什麼選擇Hologres
-
第一是Hologres的即時能力,滿足目前遞四方的即時數倉需求,支援百億級表與億級表之間的JOIN,秒級查詢響應,還支援即時寫入、批次資料匯入,擁有超高匯入效能,且併發能力極強。
-
第二是Hologres 採用儲存計算分離架構,資料儲存在阿里雲分散式檔案系統pangu中(類比開源HDFS),方便按需單獨擴充套件計算或者儲存。對快速行業來說,大促和日常所需要資源不一樣,能夠快速擴縮容,滿足業務的動態需求。同時Hologres支援異構資料來源互動分析以及離線資料和即時資料的聯邦查詢,Hologres已經和MaxCompute無縫打通,能夠直接在Hologres中加速查詢MaxCompute離線表。
-
第三是維護成本低、執行穩定,Hologres作為即時數倉儲存成本大約是ADB的1/3。資源靈活性高,可以像MaxCompute一樣靈活的升降配置,與阿里雲大資料元件相容性高,能降低運維成本和提高研發效能,不會對技術架構帶來很大負擔。
2 Hologres應用場景


3 Hologres目前的不足
五 業務價值
Cassandra資料庫入門與實戰
Apache Cassandra是一套開源分散式NoSQL資料庫系統。它最初由Facebook開發,用於儲存收件箱等簡單格式資料,2008年開源後,由於Cassandra良好的可擴充套件性,被Digg、Twitter等知名Web 2.0網站所採納,成為了一種流行的分散式結構化資料儲存方案。和其他資料庫比較,Cassandra有支援線性擴充套件、可以處理大量資料集、易於大規模部署、高度容錯等特點,因此也常年的權威資料庫榜單DB-Engines上排名前十,寬表領域排名第一。
為了更好地將阿里雲的資料庫技術能力回饋給開發者,和百萬開發者共同成長。阿里雲聯合Cassandra商業公司DataStax打造了本課程,邀請中美知名資料庫技術專家共同授課,帶你上手Cassandra,訓練營涵蓋Cassandra分散式資料庫、大資料分析、AI等多個前沿領域,讓我們一起探索雲計算與AI浪潮下的下一個職業風口,也讓你在MySQL、PG、MongoDB等資料庫基礎上,加持海量擴充套件的分散式資料庫技能。
關鍵詞
系統
即時數倉
阿里雲
離線
架構