Tableau 八、数据分层、数据分组、数据集
1.數(shù)據(jù)分層(層級)結(jié)構(gòu)
1.1分層結(jié)構(gòu)的概念與意義
分層結(jié)構(gòu)是維度之間自上而下的組織形式。
Tableau默認包含對某些字段的分層結(jié)構(gòu),比如日期、時間、地理角色。
以日期為例,包含年、季度、月、日等數(shù)據(jù)分層結(jié)構(gòu)。
打開“全球超市訂單數(shù)據(jù).xlsx”。
將兩個工作表數(shù)據(jù)拖到右側(cè)。聯(lián)結(jié)為內(nèi)部聯(lián)結(jié)。
將【利潤】拖到【行】,將【訂單日期】拖到【列】,點擊【年(訂購日期)】右側(cè)的+,會往下分層(稱之為下鉆),并變成-,點擊-,會把層折疊(稱為上鉆)。
1.2分層結(jié)構(gòu)的創(chuàng)建與使用案例
打開“人工坐席接聽數(shù)據(jù).xlsx”。
中心和人工服務(wù)接聽量柱形圖
新建工作表2,右擊【中心】——【分層結(jié)構(gòu)】——【創(chuàng)建分層結(jié)構(gòu)】。
命名為【層級】。
【維度】下變化如下
將字段【部】、【組】、【班】,拖到【中心】下面,注意順序,上下順序就是層級順序。
將【中心】放到【列】中,將【人工服務(wù)接聽量】放到【行】中,將【人工服務(wù)接聽量】放到【標簽】上。
點擊【整個視圖】。
右擊【總和(人工服務(wù)接聽量)】——【設(shè)置格式】,點擊【數(shù)字】
【數(shù)字(自定義)】,設(shè)置小數(shù)位數(shù)為0,【顯示單位】為千。
點擊【列】里的【中心】左邊的+,逐級下鉆,進行分析,發(fā)現(xiàn)有【未知】字段數(shù)據(jù)太高,屬于異常,排除掉。
點擊【未知】的柱形,點擊【排除】。
分析發(fā)現(xiàn)有兩個班的數(shù)據(jù)比較高。
中心、日期和平均呼入通話時長折線圖
新建工作表3,將【日期】拖入【列】,選擇格式為【天】。
將【中心】拖入【行】,將【平均呼入通話時長】拖入行。
點擊【中心】左邊的+,下鉆到【部】,并繼續(xù)下鉆,可以到【組】,到【班】。
不想用層級的話,右擊【移除分層結(jié)構(gòu)】。
第二種創(chuàng)建分層結(jié)構(gòu)方式
將字段【部】拖到字段【中心】上,自動打開【創(chuàng)建分層結(jié)構(gòu)】,命名為【層級】。如果字段上下順序不對,則拖動調(diào)整。
右擊【組】——【分層結(jié)構(gòu)】——【添加到分層結(jié)構(gòu)】,選擇【層級】,則自動排到【層級】的最下面。
不想【組】在層級里,就直接把【組】往外拖。
注意,層級不能嵌套,但可以并列。
比如新建【層級2】,【層級2】不能放到【層級】里面。
2.數(shù)據(jù)分組
2.1數(shù)據(jù)組創(chuàng)建及使用
組是維度成員或度量的離散值的組合。
通過分組,可以實現(xiàn)維度成員的重新組合,以及度量值按范圍的分類。
字段圖標是回形針圖標。
在Tableau里,歸類重組維度成員有很多種方式,分組是其中最常見和最快速方式。
注意,組不能創(chuàng)建計算字段,不能出現(xiàn)在公式中。
新建工作表4。
將【班】拖到行中,將【人工服務(wù)接聽量】放到列中。點擊【交換行和列】。
發(fā)現(xiàn)13班和13班(15批新人)屬于一個班。其他也有可以合到一個組的情況。
創(chuàng)建分組
創(chuàng)建分組有兩種方式:
一是右擊【班】——【創(chuàng)建】——【組】。
二是在圖形里右擊【組】(注意,要點擊圖形,而不是字段)。這里使用第二種方法。
出現(xiàn)【創(chuàng)建組】的對話框,點擊【應(yīng)用】和【確定】。
編輯組
右擊帶有回形針圖標的【班(組)】——【編輯組】。
將【13班(15批新人)】拖到組【13班】下,如果組名不合適,可以右擊組名——【重命名】。
按ctrl鍵,選擇【15班】和【15期新人】,點擊【分組】,則新建一組。
查找和分組
如果字段名稱太多,點擊【查找】,查找方式有三種
- 包含,屬于模糊查找,包含這個字就能找到
- 開頭為,則字段開頭必須為這個字
- 精確匹配,則查找字為全部字段。
【范圍】是查找范圍,指的是全部查詢還是在某個組內(nèi)查詢,一般選全部。
想找到所有常白班,【查找成員】輸入【白】,【包含】,【范圍】選【全部】。點擊【查找全部】。
找到后,默認結(jié)果是被選中的,點擊【分組】,重命名為【常白班】。
同樣,對【運行班】分組。
將一些字段分組,稱為【其他班】。
修改圖表
將【班】拖走,將【班分組】拖到【列】中。點擊【交互行和列】。
右擊【班分組】,去掉勾選【包含“其他”】
點擊【降序】,點擊【交互行和列】。
2.2電量銷售數(shù)據(jù)按地理區(qū)域分組
打開文件“2014年各省市售電量.xlsx”
中國一般分為七個區(qū):東北,華東,華中,華北,華南,西南和西北。
將省市按照七個區(qū)域分組。
建立地圖
新建工作表,右擊【維度】下【省市】——【地理角色】——【省/市/自治區(qū)】。
雙擊【省市】,點擊【未知】,選擇【編輯位置】。(注意,因為第七章中自定義地理編碼,如果不移除會導(dǎo)致未知過多,點擊【地圖】——【地理編碼】——【移除自定義地理編碼】)
修改匹配位置,點擊【確定】。
套索選擇和建組
將【省市】拖到【標簽】上。
點擊地圖上的【套索選擇】按鈕,先框選黑龍江,吉林和遼寧三省。
套索選擇后,其他省份變灰,只顯示選中的省份。
懸浮在【龍江】上,可以看見3省已選擇,點擊回形針標識,創(chuàng)建東北組。
同樣使用套索,選擇山東,江蘇,安徽,上海,浙江,江西,福建。選擇后懸浮在其中一個省份上,點擊回形針標識,創(chuàng)建分組華東組。
華北組包括內(nèi)蒙古,河北,山西,北京,天津。
華中組包括河南,湖北,湖南。
西南組包括重慶、四川和西藏。
西北組包括新疆、青海、甘肅和寧夏。
右擊【省市(組)】——【編輯組】,重新命名字段名稱和群組名稱,點擊【確定】。
將【當(dāng)期值】拖入【大小】。
填充地圖
新建工作表6,雙擊【中國地理區(qū)域】,將【同期值】拖到【顏色】,點擊【顏色】——【編輯顏色】,選擇【紅色—藍色發(fā)散】,勾選【倒序】。
將【中國地理區(qū)域】和【當(dāng)期值】拖到【標簽】上。
右擊標簽【總和(當(dāng)期值)】——【設(shè)置格式】,【數(shù)字(自定義)】,小數(shù)位數(shù)為0,顯示單位為千(K)。
添加說明,【標記】下空白處右擊勾選【說明】,雙擊說明處,輸入文字。
重命名工作表6為“各地區(qū)用電量”?!竟ぷ鞅怼俊緦?dǎo)出】——【圖像】。
各區(qū)域用電量標靶圖
新建工作表7。
將【中國地理區(qū)域】和【省市】拖到【行】,將【當(dāng)期值】拖到列。
將【月度計劃值】拖到【詳細信息】。
右擊坐標軸——【添加參考線】。
選擇【分布】下【分區(qū)】。
【計算】里選擇【百分比】,修改為【50,100】,百分比類型為【總和(月度計劃)】。
【標簽】選擇【無】。
【格式】里【線】選擇黑色直線,填充不修改,點擊【確定】。
將【中國地理區(qū)域】拖到【顏色】,將【當(dāng)期值】拖到【標簽】。
右擊標簽【總和(當(dāng)期值)】——【設(shè)置格式】。
修改填充顏色:右擊坐標軸下方——【編輯參考線】,選擇【向下填充】,然后可以選多種填充顏色。
也可以同時選擇【對稱】和【反向】?!緦ΨQ】是指顏色沿著參考線對稱。
添加說明,【標記】下空白處右擊勾選【說明】,雙擊說明處,輸入文字。
重命名工作表7為“電量銷售區(qū)域標靶圖”?!竟ぷ鞅怼俊緦?dǎo)出】——【圖像】。
3.數(shù)據(jù)集
3.1數(shù)據(jù)集的相關(guān)概念
定義:集是滿足某些條件的數(shù)據(jù)子集,它是維度的部分成員。
圖標是
類型
| 類型 | 靜態(tài)集 | 動態(tài)集 |
| 是否會更新 | 否 | 是 |
| 可用維度度量 | 單個或多個 | 單個 |
| 創(chuàng)建方式 | 視圖中選擇 | 數(shù)據(jù)窗口創(chuàng)建 |
用途
- 集內(nèi)外成員的對比分析
- 集內(nèi)部成員的對比分析
3.2創(chuàng)建數(shù)據(jù)集
導(dǎo)入數(shù)據(jù)“全球超市訂單數(shù)據(jù).xlsx”
創(chuàng)建靜態(tài)數(shù)據(jù)集
新建工作表8,找到負利潤的國家數(shù)據(jù)集。
將【國家/地圖】拖到【列】,將【利潤】拖到【行】。
點擊降序圖標。
從數(shù)據(jù)開始為負數(shù)的國家開始往后選。
選擇好后,懸浮在上面,選擇創(chuàng)建集按鈕。
修改集的名稱,點擊【確定】。
可見左側(cè)【度量】下出現(xiàn)【集】。
將【市場】和【細分市場】拖到【列】中
將【利潤】拖到【顏色】上。
修改【利潤】的顏色,【漸變顏色】為2階,勾選【倒序】。這樣看的更清楚。
按ctrl鍵,將圖表中藍色的選出來。選好后右擊【創(chuàng)建集】,修改集名稱如下,點擊【確定】。
右擊【集】下【負利潤國家2】——【編輯集】,將鼠標懸浮在每條記錄的后邊,會有×,如果不想要該記錄,可以點擊移除。
懸浮在列名上,也會有×,如果不想要改列,可以進行刪除。
點擊【清除工作表】。
將【負利潤國家2】拖到【列】中,將【利潤】拖到【行】中??梢钥吹郊瘍?nèi)外變化。
右擊【負利潤國家2】——【編輯集】,刪除【市場】列,點擊【應(yīng)用】和【確定】。
發(fā)現(xiàn)圖表無變化,因為【市場】列變化不影響數(shù)據(jù)。
右擊【負利潤國家2】——【編輯集】,刪除【國家/地區(qū)】列,點擊【應(yīng)用】和【確定】。
發(fā)現(xiàn)數(shù)據(jù)發(fā)生變化。原因是細分市場里的【公司】和【消費者】變成了內(nèi),其他的細分市場變成了外。
創(chuàng)建動態(tài)數(shù)據(jù)集
新建工作表9。
右擊【維度】下【產(chǎn)品名稱】——【創(chuàng)建】——【集】。
修改集的名稱,勾選【按字段】,選擇【利潤】【總和】【<=】【0】,點擊【加載】,點擊【確定】。
將【負利潤產(chǎn)品】拖到【行】中,將【利潤】拖到【列】中。
點擊行中【內(nèi)/外(負利潤產(chǎn)品)】的下拉三角,選擇【在集內(nèi)顯示成員】。
通過排序方式創(chuàng)建動態(tài)數(shù)據(jù)集
復(fù)制工作表9,【清除工作表】,這次找銷量在前100的產(chǎn)品。
右擊【維度】下【產(chǎn)品名稱】——【創(chuàng)建】——【集】。
修改集名稱,選擇【頂部】,勾選【按字段】,選擇【頂部】【100】【數(shù)量】【總和】,就是將銷量按降序排序,取前100個。點擊【確定】。
合并集
合并同一個維度的數(shù)據(jù)。
右擊【負利潤產(chǎn)品】——【創(chuàng)建合并集】。
修改集名稱,左邊是【負利潤產(chǎn)品】,右邊只能選擇【銷量TOP100】,因為兩者都是從【產(chǎn)品名稱】這個維度創(chuàng)建而來。
下面有四種選擇:
- 合并
- 相交
- 左交
- 右交
選擇相交,點擊【確定】。
通過篩選器創(chuàng)建數(shù)據(jù)集
將【地區(qū)】拖到【篩選器】里,勾選【南亞】【西亞】【中亞】【東亞】【東南亞】,點擊【確定】。
右擊【篩選器】下的【地區(qū)】——【創(chuàng)建集】。
修改集名稱,點擊【確定】。
數(shù)據(jù)集用于分層結(jié)構(gòu)
將【集】下【亞洲地區(qū)】拖到【維度】——【市場】上,彈出【創(chuàng)建分層結(jié)構(gòu)】,修改分層名稱,點擊【確定】。
3.3使用集做對比分析
將【賣情懷的產(chǎn)品】拖到【行】,將【利潤】拖到【列】。
選擇【行】中【賣情懷的產(chǎn)品】的下拉三角——【在集內(nèi)顯示成員】。
點擊【顯示標記標簽】,顯示具體標簽數(shù)值。
總結(jié)
以上是生活随笔為你收集整理的Tableau 八、数据分层、数据分组、数据集的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: VS2017编译文件遇到fatal er
- 下一篇: 网页搜题插件使用