[Microsoft-SSAS] Cube Concept — DW and OLAP
Before getting into MDX…
Let’s learn some terminologies
- DW(data warehouse,資料倉儲)
目地:將不同來源資料整合起來,找出共通性以協助做決策
DW是一種資料庫,且符合以下四個特性
1.Subject-Oriented(主題導向):例如網路流量、商品資訊
2.Integrated(整合性):結合不同來源的資料,例如關聯式資料庫、文字檔
3.Non-Volatile(非揮發性):舊資料不會被取代,可分析歷史資料
4.Time-Variant(時間變異性):新資料會不斷被載入,因此具有時間的屬性
(by Inmon,2005)
DW vs. ODS
•DW和ODS(operation database systems)差別
DW主要使用OLAP,用於分析
ODS主要使用OLTP,用於日常作業記錄
•DW schema常見的有以下
star-schema:最常見的model
一個fact table,並連接多個dimension table
snowflake schema:
類似star-schema,但dimension table內又連接dimension table
fact constellation schema/galaxy schema:可表達複雜的關係多個fact table,以及連接多個dimension table
What’s Cube
•Data Cube(資料方塊)
1.OLAP中最基本的建構單元
2.提供快速回應查詢資料的機制
3.DW子集合所建立的資料集合,由Dimension與Measure所定義的Multi-dimensional Structure,此架構可提供使用者快速而複雜的查詢
- Data Cube是由資料倉儲子集合所建立的資料集合,主要由Dimension(維度)與Measure(量值)所定義的Multi-dimensional Structure(多維度結構),Dimension概念就是分析時的角度,例如時間、來源等,維度一般會還在定階層,例如時間可分為年、月、日,而Measure則感興趣的資料,例如流量、封包數等統計數據
Data Warehousing Structure

The Cube

Source (Simplified Chinese): https://wenku.baidu.com/view/0e72ffaad1f34693daef3e99?pcf=2&fbclid=IwAR2Ks9qB8WrVXeGLH5Elfe2bJ-b5b1O2e435h2cWKYWVi0rDQ5K1AFpSP3o