
一 概述
-
資料分析:是一種統計學常用方法,其主要特點是多維性和描述性。有些幾何方法有助於揭示不同的資料之間存在的關係,並繪製出統計資訊圖,以更簡潔的解釋這些資料中包含的主要資訊;
-
資料探勘:是一個跨學科的計算機科學分支。它是用人工智慧、機器學習、統計學和資料庫的交叉方法在相對較大型的資料集中發現模式的計算過程;
-
資料洞察:這一專案前沒有wiki詞條,基於普遍認知,是基於資料分析和資料探勘,結合業務場景後,圍繞業務鏈路定義統一口徑,進而更好的分析問題,並且能夠進一步做策略改進。
-
資料分析更側重,基於人的理解動線,結合人對業務和資料的理解,產出分析結果。這裡更加強調人的分析;
-
資料探勘同理資料分析,只不過角色從人變為了機器;
-
資料洞察是在資料分析和挖掘的基礎上,引入了業務場景的概念,梳理出圍繞業務場景結果的影響因素和鏈路,目標是對抽象問題進行歸因、拆分以及更好更快的形成改進方向。這個也是我們業務開發同學最有優勢的地方。
二 核心要素

1 資料
2 業務場景
3 口徑
三 資料建設
1 資料的清洗是保證資料有效的手段
2 資料建設是補充也是演進
四 業務場景
1 業務場景的定義
-
業務場景中,最終產物是誰?
-
業務場景中,你需要分析的維度是多深;
-
業務場景中,你要定義“一次完整業務行為”。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 結合業務場景定義的資料結構演進
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 業務場景資料的視覺化表達
-
漏斗舉例

-
基於狀態機+約定打點
-
狀態機的核心要素
