Linux之正则表达式
生活随笔
收集整理的這篇文章主要介紹了
Linux之正则表达式
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
正則表達(dá)式與通配符的區(qū)別:
- 最常應(yīng)用正則表達(dá)式的命令是grep(egrep),sed,awk。
- 正則表達(dá)式和通配符有本質(zhì)區(qū)別,正則表達(dá)式用來找:【文件】?jī)?nèi)容,文本,字符串。一般只有三劍客支持。通配符用來找:文件名。普通命令都支持
正則表達(dá)式的分類
POSIX規(guī)范將正則表達(dá)式的分為了兩種
- 基本正則表達(dá)式(BRE,basic regular expression)
- 高級(jí)功能:擴(kuò)展正則表達(dá)式(ERE,extended regular expression)
BRE和ERE的區(qū)別僅僅是元字符的不同
- BRE(基礎(chǔ)正則表達(dá)式)只承認(rèn)的元字符有^$.[]* 其他字符識(shí)別為普通字符:\(\)
- ERE(擴(kuò)展正則表達(dá)式)則添加了(){}?+|等
- 只有在用反斜杠“\”進(jìn)行轉(zhuǎn)義的情況下,字符(){}才會(huì)在BRE被當(dāng)作元字符處理,而BRE中,任何元符號(hào)前面加上反斜杠反而會(huì)使其被當(dāng)作普通字符來處理。
基礎(chǔ)正則表達(dá)式
| 字符 | 描述 |
|---|---|
| ^ | ^word: 搜索以word開頭的內(nèi)容 |
| $ | word$: 搜索以word結(jié)尾的內(nèi)容 |
| ^$ | 表示空行,不是空格 |
| . | 代表且只能代表任意一個(gè)字符(不匹配空行) |
| \ | 轉(zhuǎn)義字符,讓有特殊含義的字符脫掉馬甲,現(xiàn)出原形,如\.只表示小數(shù)點(diǎn) |
| * | 重復(fù)之前的字符或文本0個(gè)或多個(gè),之前的文本或字符連續(xù)0次或多次 |
| .* | 任意多個(gè)字符 |
| ^.* | 以任意多個(gè)字符串開頭,.*盡可能多,有多少算多少,貪婪性 |
| [^abc] | 匹配不包含^后的任意字符a或b或c,是對(duì)[abc]的取反,且與^含義不同 |
| a\{n,m\} | 重復(fù)前面a字符n到m次(如果用egrep或sed -r可去掉斜線) |
| a\{n,\} | 重復(fù)前面a字符至少n次,如果用egrep或sed -r可去掉斜線 |
|---|---|
| a\{n\} | 重復(fù)前面a字符n次,如果用egrep或sed -r可去掉斜線 |
| --- | --- |
擴(kuò)展正則表達(dá)式ERE
| 特殊字符 | 含義與例子 |
|---|---|
| + | 重復(fù)前一個(gè)字符一次或一次以上,前一個(gè)字符連續(xù)一個(gè)或多個(gè),把連續(xù)的文本/字符取出 |
| ? | 重復(fù)前面一個(gè)字符0次或1次(.是有且只有1個(gè)) |
| 管道符| | 表示或者同時(shí)過濾多個(gè)字符 |
| () | 分組過濾被括起來的東西表示一個(gè)整體(一個(gè)字符) |
管道符|
(): 分組過濾被括起來的東西表示一個(gè)整體(一個(gè)字符)
最早的文本匹配程序,使用POSIX定義的基本正則表達(dá)式(BRE)來匹配文本。
- grep -E 強(qiáng)制讓grep直接認(rèn)識(shí)正則符號(hào),不需要再進(jìn)行轉(zhuǎn)義
- egrep 等效grep -E 天生就能認(rèn)識(shí)正則符號(hào)
- 我們平時(shí)備份可以通過cp 文件名{,.bak}的形式進(jìn)行,避免再打一次文件名
- sed -r :讓sed支持正則
基本正則和擴(kuò)展正則區(qū)別
| 基礎(chǔ)正則BRE | 擴(kuò)展正則ERE |
|---|---|
| \? | ? |
| \+ | + |
| \{\} | {} |
| \( \ ) | () |
| \ |
所謂基礎(chǔ)正則實(shí)際上就是得需要轉(zhuǎn)義字符配合表達(dá)的正則,而擴(kuò)展正則就是讓命令擴(kuò)展它的權(quán)限讓他直接就認(rèn)識(shí)正則表達(dá)符號(hào)(egrep,sed -r,awk直接支持)
補(bǔ)充說明
1 一些預(yù)定義的:
| 正則表達(dá)式 | 描述 | 示例 |
|---|---|---|
| [:alnum:] | [a-zA-Z0-9]匹配任意一個(gè)字母或數(shù)字字符 | [[:alnum:]]+ |
| [:alpha:] | 匹配任意一個(gè)字母字符(包括大小寫字母) | [[:alpha:]]{4} |
| [:blank:] | 空格與制表符(橫向縱向) | [[:blank:]]* |
| [:digit:] | 匹配任意一個(gè)數(shù)字字符 | [[:digit:]]? |
| [:lower:] | 匹配小寫字母 | [[:lower:]]{5,} |
| [:upper:] | 匹配大寫字母 | ([[:upper:]]+)? |
| [:punct:] | 匹配標(biāo)點(diǎn)符號(hào) | [[:punct:]] |
| [:space:] | 匹配一個(gè)包括換行符,回車等在內(nèi)的所有空白符 | [[:space:]]+ |
| [:graph:] | 匹配任何一個(gè)可以看得見的且可以打印的字符 | [[:graph:]] |
| [:xdigit:] | 任何一個(gè)十六進(jìn)制數(shù) | [[:xdigit:]]+ |
| [:cntrl:] | 任何一個(gè)控制字符(ASCII字符集中的前32個(gè)字符) | [[:cntrl:]] |
| [:print:] | 任何一個(gè)可以打印的字符 | [[:print:]] |
2 元字符
元字符是一種Perl風(fēng)格的正則表達(dá)式,只有一部分文本處理工具支持它,并不是所有的文本處理工具都支持
| 正則表達(dá)式 | 描述 | 示例 |
|---|---|---|
| \b | 單詞邊界 | \bcool\b匹配cool,不匹配coolant |
| \B | 非單詞邊界 | cool\B匹配coolant不匹配cool |
| \d | 單個(gè)數(shù)字字符 | b\db匹配b2b,不匹配bcb |
| \D | 單個(gè)非數(shù)字字符 | b\Db匹配bcb不匹配b2b |
| \w | 單個(gè)單詞字符(字母,數(shù)字與_) | \w匹配1或a,不匹配& |
| \W | 單個(gè)非單詞字符 | \W匹配&,不匹配1或a |
| \n | 換行符 | \n匹配一個(gè)新行 |
| \s | 單個(gè)空白字符 | x\sx匹配xx,不匹配xx |
| \S | 單個(gè)非空白字符 | x\S\x匹配xkx,不匹配xx |
| \r | 回車 | \r匹配回車 |
| \t | 橫向制表符 | \t匹配一個(gè)橫向制表符 |
| \v | 垂直制表符 | \v匹配一個(gè)垂直制表符 |
| \f | 換頁符 | \f匹配一個(gè)換頁符 |
參考博客:http://www.cnblogs.com/chensiqiqi/p/6285060.html
總結(jié)
以上是生活随笔為你收集整理的Linux之正则表达式的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 漫步Unity3D(三)
- 下一篇: 【Linux入门】