日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

宽表和窄表

發布時間:2024/4/13 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 宽表和窄表 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

考慮這樣的一個問題,一個公司有這樣的一個需求:

設計銷售領域的訂單事實表,該事實表應該包含哪些維度和度量?事實表和維表該分別如何去設計?

好了,我們把關鍵信息拿出來,首先我們要有維度包括:銷售員、銷售員所屬部門、下訂單的時間;度量:銷售量;

那么,訂單事實表,其實就是一個商品銷售的清單;

依照這個思路,我們建立的第一個模型可能是以下這樣的:

單單看上去,貌似是符合我們的問題的需要,而且符合數據庫的范式設計:沒有冗余字段;但是情況真的就是這樣嗎?

答案是否定的,確實對于一般的OLTP系統而言這樣的表設計確實減少了冗余和,增刪改查等操作也很方便,但是往往對于我們的統計系統、OLAP、數據挖掘而言,情況卻并非如此,舉個例子:我們要統計每個部門各自的銷售量為多少?那么對于上表,sql是這樣的:

select a.*,b.sid into #dep_saleser from department a,saleser_dim b on a.dep_id = b.dep_id;select count(1),a.dep_name from #dep_saleser a,order_fact b on a.sid=b.sid group by a.dep_name;

對于這么一個簡單的需求已經要寫兩了sql去實現了,其實數據庫表模型的的設計是靈活的,我們完全可以根據我們的業務去設計我們的數據表;考慮到部門和銷售員可以是同屬于銷售者這個維度,只是他們是有上下級別關系的那么依照這個思路,我們的模型可以建立為下面這樣:

那么統計每個部門各自的銷售量,可以用如下sql去實現:

select count(1),a.dep_name from saleser_dim a,order_fact bon a.sid=b.sid group by a.dep_name;

確實對于這個模型而言,有些情況下會出現冗余(填寫用戶,沒有填寫部門;填寫部門沒填寫用戶);但是對于提取數統計的邏輯又相對來說要簡單了好多;

考慮到要實現取數簡單,我們還可以想出另外一種方法:

看上去好像不錯哦~~,取數據也就一句sql就搞掂了,但是卻是最最槽糕的情況,有可能一個銷售員,前幾天登記的部門是a,但是其實他的所屬于的部門為b,那么對于上面這個模型,我們得改動銷售員和訂單表;而對于上面的其他兩個模型都僅僅需要改動一張表就行了,造成查詢數據部一致往往也就是這種數據模型所造成的。

所謂的寬表就是字段比較多的表,包含的維度層次比較多,造成冗余也比較多,`毀范式設計`, 但是`利于取數統計`,而窄表往往對于OLTP比較合適,符合范式設計原則;

作者:Leo_wl
    
出處:http://www.cnblogs.com/Leo_wl/

總結

以上是生活随笔為你收集整理的宽表和窄表的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。