hive sql 正则表达式
今天來說一下hive中的正則表達式,主要包含:元字符匹配、位置匹配、頻率匹配
1、元字符匹配
(.) ? 表示匹配除換行符以外的任意字符。
(\w) 表示匹配字母、下劃線、數字 (\W匹配漢字)
(\d) 表示匹配數字
(\s) 表示匹配任意的空白符(tab 換行 空格)
([ ]) ?表示匹配方括號中任一字符
([^匹配內容]) 表示不匹配方括號中任一字符
2、位置匹配
(^) 表示匹配字符串的開始,空值:^$
($) 表示匹配字符串的結束
(\b) 表示匹配單詞的開始或結束。
(\B) 表示匹配非單詞的開始或結束
3、頻率匹配
(*) 表示匹配重復0次或多次
(+) 表示匹配重復一次或更多次
(?) 表示匹配重復0次或1次
({n}) 表示匹配重復n次
({n,}) 表示重復n次或更多次
({n,m}) 表示重復n到m次
正則匹配函數:regexp_extract函數
用法:
regexp_extract(string subject, string pattern, int index)
返回值: string
功能:將字符串subject按照pattern正則表達式的規則拆分,返回index指定的字符。
?regexp_replace(string A, string B, string C)?
返回值: string?
說明:將字符串A中的符合Java正則表達式B的部分替換為C。注意,在有些情況下要使用轉義字符,類似Oracle中的regexp_replace函數。
regexp
語法: A REGEXP B?
操作類型: strings?
描述: 功能與RLIKE相同? 如 xx not regexp '\\d{8}'
————————————————
版權聲明:本文為CSDN博主「數據小白的進階之路」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/weixin_37536446/article/details/81053172
總結
以上是生活随笔為你收集整理的hive sql 正则表达式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop 各组件介绍
- 下一篇: pageoffice 选中部分文字 添加