LINUX正则表达式-- grep
??正則表達(dá)式(Regular Expression)是一種字符串處理的標(biāo)準(zhǔn),對(duì)于系統(tǒng)管理員來說,正則是一門必修技。例如:系統(tǒng)產(chǎn)生數(shù)據(jù)量太大,身為系統(tǒng)管理員每天去看這么多的信息數(shù)據(jù), 從千百行的數(shù)據(jù)里面找出一行有問題的信息,怎么辦? 這個(gè)時(shí)候,我們就可以透過正則表達(dá)式的功能,將這些登錄的資訊進(jìn)行處理, 僅取出有問題的資訊來進(jìn)行分析,如此一來,你的系統(tǒng)管理工作將會(huì)更加直觀,簡(jiǎn)便!????
??正則表達(dá)式中我們常使用的命令,三劍客:grep、sed、awk。通常使用三劍客結(jié)合正則的特殊字符,來完成我們需要的操作。
grep命令:
介紹玩grep常用選項(xiàng)后,結(jié)合grep來看看基礎(chǔ)正則常用的特殊字符。
正則表達(dá)式特殊字符歸納
^word 意義:待搜尋的字串(word)在行首!
?范例:搜尋行首為 # 開始的那一行,并列出行號(hào)?
grep -n '^#' filename?
word$ 意義:待搜尋的字串(word)在行尾!
?范例:將行尾為 ! 的那一行列印出來,并列出行號(hào)?
grep -n '!$' filename?
^$ 意義:空白行,開頭之后就是結(jié)尾當(dāng)然是空行了!
. 意義:代表『一定有一個(gè)任意字節(jié)』的字符!
?范例:搜尋的字串可以是 (eve) (eae) (eee) (e e), 但不能僅有 (ee) !亦即 e 與 e 中間『一定』僅有一個(gè)字節(jié),而空白字節(jié)也是字節(jié)!?
grep -n 'e.e' filename?
\ 意義:跳脫字符,將特殊符號(hào)的特殊意義去除!
?范例:搜尋含有單引號(hào) ' 的那一行!?
grep -n \' filename?
* 意義:重復(fù)零個(gè)到無窮多個(gè)的前一個(gè) RE 字符
?范例:找出含有 (es) (ess) (esss) 等等的字串,注意,因?yàn)?* 可以是 0 個(gè),所以 es 也是符合帶搜尋字串。另外,因?yàn)?* 為重復(fù)『前一個(gè) RE 字符』的符號(hào), 因此,在 * 之前必須要緊接著一個(gè) RE 字符喔!例如任意字節(jié)則為 『.*』 !?
grep -n 'ess*' filename
[list] 意義:字節(jié)集合的 RE 字符,里面列出想要擷取的字節(jié)!
?范例:搜尋含有 (gl) 或 (gd) 的那一行,需要特別留意的是,在 [] 當(dāng)中『謹(jǐn)代表一個(gè)待搜尋的字節(jié)』, 例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思!?
grep -n 'g[ld]' filename?
[n1-n2] 意義:字節(jié)集合的 RE 字符,里面列出想要擷取的字節(jié)范圍!
?范例:搜尋含有任意數(shù)字的那一行!需特別留意,在字節(jié)集合 [] 中的減號(hào) - 是有特殊意義的,他代表兩個(gè)字節(jié)之間的所有連續(xù)字節(jié)!但這個(gè)連續(xù)與否與 ASCII 編碼有關(guān),因此,你的編碼需要配置正確(在 bash 當(dāng)中,需要確定 LANG 與 LANGUAGE 的變量是否正確!) 例如所有大寫字節(jié)則為 [A-Z]?
grep -n '[A-Z]' filename?
[^list] 意義:字節(jié)集合的 RE 字符,里面列出不要的字串或范圍!
?范例:搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ,那個(gè) ^ 在 [] 內(nèi)時(shí),代表的意義是『反向選擇』的意思。 例如,我不要大寫字節(jié),則為 [^A-Z]。但是,需要特別注意的是,如果以 grep -n [^A-Z] regular_express.txt 來搜尋,卻發(fā)現(xiàn)該文件內(nèi)的所有行都被列出,為什么?因?yàn)檫@個(gè) [^A-Z] 是『非大寫字節(jié)』的意思, 因?yàn)槊恳恍芯蟹谴髮懽止?jié),例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小寫字?
grep -n 'oo[^t]' filename?
\{n,m\} 意義:連續(xù) n 到 m 個(gè)的『前一個(gè) RE 字符』
?意義:若為 \{n\} 則是連續(xù) n 個(gè)的前一個(gè) RE 字符,
?意義:若是 \{n,\} 則是連續(xù) n 個(gè)以上的前一個(gè) RE 字符! 范例:在 g 與 g 之間有 2 個(gè)到 3 個(gè)的 o 存在的字串,亦即 (goog)(gooog)?
grep -n 'go\{2,3\}g' filename?
\<和\> 意義:
\<后面接的字符必須是一個(gè)單詞最前部分;
\>前面接的字符必須是一個(gè)單詞的最后部分;
注意:一個(gè)單詞定義的是:字母、數(shù)字、下劃線的組合
所以\<word\>必須是單獨(dú)的word單詞才會(huì)匹配,其他符號(hào)如: ()/等都會(huì)視為單詞分割號(hào)
分組\( \) 意義:
小括號(hào)的內(nèi)容作為整體,如\(ab\)* 匹配0個(gè)到無窮個(gè)ab
范例:test文件內(nèi)容如下:
love:lover
love:liker
like:lover
like:liker
如何取出1和4行?
第1,4行,特點(diǎn)前后文有一致的字符串,可以使用引用上文的功能
在使用分組功能時(shí),我們可以通過\1 \2 \3 ...來引用,所以:
grep '\(.*\):\1r' test?
轉(zhuǎn)載于:https://blog.51cto.com/googgoogstudy/1632044
《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的LINUX正则表达式-- grep的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 上传下载文件命令
- 下一篇: linux服务之git