举个栗子!Tableau 技巧(199):用 Prep 正则表达式拆分复杂字段
數據準備時,我們經常會遇到需要拆分的字段。對于比較簡單規整的字段,可以用 split() 函數進行拆分。
但是,如果遇到較復雜的情況(如下圖):沒有固定的長度,分隔字符不固定,分隔字符的數量也不固定。用普通的拆分方法,需要重復很多次,費時費力。
對于這種復雜字段,有辦法快速拆分么?有的,試試 Tableau Prep 正則表達式的字符串處理方法吧!
本期《舉個栗子》,我們要給大家分享的 Tableau 技巧是:用 Prep 正則表達式拆分復雜字段。
為方便學習,栗子使用自備的上述示例數據。掌握栗子方法后,數據粉可嘗試使用自己的數據源。懶癌患者可通過以下鏈接獲取栗子數據源:
https://www.dkmeco.com/cms/course/detail/535?suid=5
具體步驟如下:
01、 創建自定義計算替換字符
打開 Tableau Prep 連接栗子數據源“復雜拆分”,新建一個清理步驟:單擊數據表右側
按鈕,下拉菜單選擇:+ 清理步驟。
首先,需要將多種分隔符號統一替換成可自動拆分的半角符號。
單擊“待拆分字段”右上角圖片符號,下拉菜單選擇:創建計算字段-自定義計算。使用 REGEXP_REPLACE() 函數,按照正則表達式對字段進行拆分。
Tips:REGEXP_REPLACE 函數的作用是把字段中符合正則表達式的字符,替換成指定的字符。有三個接收的參數,分別是 REGEXP_REPLACE(<待處理的字段名稱>,<正則表達式>,<替換成字符>)。
將計算字段命名為:拆分字段,鍵入函數
REGEXP_REPLACE([待拆分字段], “[,, |分數]+”, “,”)
計算說明:示例中的正則表達式’[,,| 分數]+’,意思是匹配 [] 內的任意字符,匹配次數可以是 1 次或多次。連起來的意思是把“待拆分字符串”中包含的任意數量的表達式字符,替換成為半角符號。
計算應用保存后,可以看到替換效果如下:
02、 拆分字段
單擊“拆分字段”右上角
符號,下拉菜單選擇:拆分值-自動拆分。
如此,就完成了我們想要的字段拆分結果。
本期的 Tableau 技巧,你 Get 到了嗎?趕快試試看吧!
下一期,再見~
文章部分信息來源于網絡,如有侵權請告知
總結
以上是生活随笔為你收集整理的举个栗子!Tableau 技巧(199):用 Prep 正则表达式拆分复杂字段的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 11.集合之List
- 下一篇: 关于Native Library在Net