hive sql正则表达式总结
正則通配符的介紹
^ 表示開頭 $ 表示結尾 . 表示任意字符 * 表示任意多個?? ?
1、元字符匹配
(.) ? 表示匹配除換行符以外的任意字符。
(\w) 表示匹配字母、下劃線、數(shù)字 (\W匹配漢字)
(\d) 表示匹配數(shù)字
(\s) 表示匹配任意的空白符(tab 換行 空格)
([ ]) ?表示匹配方括號中任一字符
([^匹配內容]) 表示不匹配方括號中任一字符
2、位置匹配
(^) 表示匹配字符串的開始,空值:^$
($) 表示匹配字符串的結束
(\b) 表示匹配單詞的開始或結束。
(\B) 表示匹配非單詞的開始或結束
3、頻率匹配
(*) 表示匹配重復0次或多次
(+) 表示匹配重復一次或更多次
(?) 表示匹配重復0次或1次
({n}) 表示匹配重復n次
({n,}) 表示重復n次或更多次
({n,m}) 表示重復n到m次
正則匹配函數(shù):regexp_extract函數(shù)
用法:
regexp_extract(string subject, string pattern, int index)
返回值: string
功能:將字符串subject按照pattern正則表達式的規(guī)則拆分,返回index指定的字符。
?regexp_replace(string A, string B, string C)?
返回值: string?
說明:將字符串A中的符合Java正則表達式B的部分替換為C。注意,在有些情況下要使用轉義字符,類似Oracle中的regexp_replace函數(shù)。
regexp
語法: A REGEXP B?
操作類型: strings?
描述: 功能與RLIKE相同? 如 xx not regexp '\\d{8}'
?
?
?
總結
以上是生活随笔為你收集整理的hive sql正则表达式总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java实验计算机与光盘,JAVA实验指
- 下一篇: 基于FPGA的三人表决器设计