[Microsoft-SSAS] Cube Concept — DW and OLAP

Dana Huang
Nov 30, 2020

--

Before getting into MDX…
Let’s learn some terminologies

  • DW(data warehouse,資料倉儲)
    目地:將不同來源資料整合起來,找出共通性以協助做決策
    DW是一種資料庫,且符合以下四個特性
    1.Subject-Oriented(主題導向):例如網路流量、商品資訊
    2.Integrated(整合性):結合不同來源的資料,例如關聯式資料庫、文字檔
    3.Non-Volatile(非揮發性):舊資料不會被取代,可分析歷史資料
    4.Time-Variant(時間變異性):新資料會不斷被載入,因此具有時間的屬性
    (by Inmon,2005)

DW vs. ODS

•DW和ODS(operation database systems)差別
DW主要使用OLAP,用於分析
ODS主要使用OLTP,用於日常作業記錄

DW schema常見的有以下
star-schema:最常見的model
一個fact table,並連接多個dimension table
snowflake schema:
類似star-schema,但dimension table內又連接dimension table
fact constellation schema/galaxy schema:可表達複雜的關係多個fact table,以及連接多個dimension table

What’s Cube

Data Cube(資料方塊)
1.OLAP中最基本的建構單元
2.提供快速回應查詢資料的機制
3.DW子集合所建立的資料集合,由Dimension與Measure所定義的Multi-dimensional Structure,此架構可提供使用者快速而複雜的查詢

  • Data Cube是由資料倉儲子集合所建立的資料集合,主要由Dimension(維度)與Measure(量值)所定義的Multi-dimensional Structure(多維度結構),Dimension概念就是分析時的角度,例如時間、來源等,維度一般會還在定階層,例如時間可分為年、月、日,而Measure則感興趣的資料,例如流量、封包數等統計數據

Data Warehousing Structure

The Cube

Source (Simplified Chinese): https://wenku.baidu.com/view/0e72ffaad1f34693daef3e99?pcf=2&fbclid=IwAR2Ks9qB8WrVXeGLH5Elfe2bJ-b5b1O2e435h2cWKYWVi0rDQ5K1AFpSP3o

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

Dana Huang
Dana Huang

Written by Dana Huang

我做數據處理的工作已超過五年,從資料驗證、報表整理到自動化呈現,形形色色的工具真的用不完,突然覺得透過網址寫寫寫心路歷程還不錯!另外也記錄一些生活、工作與理財相關的心情記錄與訊息!

No responses yet

Write a response