當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

正则表达式总结之查找

發(fā)布時(shí)間：2023/12/3 编程问答 44 豆豆

生活随笔收集整理的這篇文章主要介紹了正则表达式总结之查找小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

【0】、寫(xiě)在前面

以下內(nèi)容總結(jié)于shell腳本學(xué)習(xí)指南

【1】我們說(shuō)查找文本要用到三種文本匹配程序：

1.1）grep 使用的是基本正則表達(dá)式（basic regular expression，BRE）

1.2）擴(kuò)展式grep 使用 egrep（extended regular express， ERE）；用grep -E 取代 egrep

1.3）快速grep （fast grep），主要用于匹配固定字符串而非正則表達(dá)式；用grep -F取代fgrep

【2】grep的用法：匹配一個(gè)或者多個(gè)模式的文本行

grep [options …] pattern-spec [files…] （以下grep 選項(xiàng)沒(méi)有列完全，但列出重要的）

2.1）-E 取代egrep

2.2）-F 取代fgrep

2.3）-e par-list 匹配多個(gè)模式，自己查

2.4）-i 忽略大小寫(xiě)

2.5）-v 顯示不匹配的行

2.6） -q 匹配成功則離開(kāi)，不寫(xiě)入到標(biāo)準(zhǔn)輸出

2.7） -l 列出匹配模式的文件名稱(chēng)，而不是打印匹配的行

【3】基本正則表達(dá)式

3.1）匹配單個(gè)字符

可采用以下幾種方式做到：

3.1.1）單個(gè)字符

正則表達(dá)式a匹配a，而不是匹配A，word match word not WoRD；

3.1.2）轉(zhuǎn)義的meta字符

meta字符（元字符），如*， \ 等可以用\轉(zhuǎn)義它

3.1.3）.號(hào) match 任一字符not任意字符 a.c match abc,aac not ac

3.1.4）方括號(hào)表達(dá)式

c[aeiou]t match cat, cet , cit, cot cut
complementary: ^放在[] 里面的字首表示取反; 即是匹配不在[] 里面的字符；

3.2）POSIX 的排序符號(hào) 等價(jià)字符集以及字符集

3.2.1）排序

定義：指給予成組的項(xiàng)目排列順序的操作；
形式：用[.與.] 括起來(lái)
如 [.ch.] 匹配成對(duì)的ch 而不是單個(gè)c or h ；又如 [ab[.ch.]de] match a or b or d or e or 成對(duì)的ch

3.2.2）等價(jià)字符集

定義：用來(lái)讓不同字符在匹配時(shí)視為相同字符；
形式：用 [= 與 =] 括起來(lái)
如：[=e=] matching 各種e （如法語(yǔ)中的e字母是和英語(yǔ)中的e字母不一樣的，這和具體的locale有關(guān)）

3.2.3）字符集

定義：表示字符的類(lèi)別；如數(shù)組，大寫(xiě)字母，小寫(xiě)字母，標(biāo)點(diǎn)符號(hào)，空白；
形式：用[:與:] 括起來(lái)；
來(lái)張鳥(niǎo)哥的圖：

3.3）后向引用

定義：指的是匹配于正則表達(dá)式匹配的先前部分；分為兩步：first , 將子表達(dá)式包圍在( 與 ) 里面；second, 在同一模式后使用\digit， digit指的是介于1~9的數(shù)字，指的是匹配于第n個(gè)先前方括號(hào)內(nèi)子表達(dá)式匹配成功的字符。
如：

$ab$$cd$[def]*\2\1 matching abcdcdab,abcdeeecdab, abcdddeeffcdab $why$.*\1 matching 一行里重現(xiàn)兩個(gè)why $[""']$.*\1 matching 以單引號(hào)或是雙引號(hào)括起來(lái)的字，如 ‘foo’ or "bar"

3.4）單字符匹配多字符

**3.4.1） * 修飾符是好用的，但是他沒(méi)有顯示；（用于匹配0個(gè)或者多個(gè)）**

3.4.2）區(qū)間表達(dá)式

形式：該表達(dá)式將一個(gè)或者兩個(gè)數(shù)字放在 { 和 } 之間， there are 3 forms:
{n} : 前置正則表達(dá)式所得結(jié)果重現(xiàn)n次；
{n,} : 前置正則表達(dá)式所得結(jié)果重現(xiàn)至少n次；
{n,m} : 前置正則表達(dá)式所得結(jié)果重現(xiàn)n~m次；

【Attention】

n和m介于0到RE_DUP_MAX之間；getconf RE_DUP_MAX 獲取該值大小

3.4）文本匹配錨點(diǎn)

3.4.1）脫字符號(hào)^ :限定匹配字符串的起始處

如^ABC 用于匹配行起始處為ABC的行；

3.4.２）貨幣符號(hào)＄ :限定匹配字符串的結(jié)束處

$ABC 用于匹配以ABC結(jié)束的行；
\^$也可以同時(shí)使用，用于表示空行

3.5）BRE運(yùn)算符的優(yōu)先級(jí)

（由高到低）

first: [..] [==] [::] 用于字符排序的方括號(hào)符號(hào) second: \metacharacter 轉(zhuǎn)義的meta符號(hào) third: [] 方括號(hào)表達(dá)式 4th:  \digit 子表達(dá)式與向后引用 5th: * \{\} 前置單個(gè)字符重現(xiàn)的正則表達(dá)式 6th: 無(wú)符號(hào) (no symbol) 連續(xù) 7th: ^$ 錨點(diǎn)

【4】擴(kuò)展正則表達(dá)式

匹配單個(gè)字符同BRE；
后向用于不存在；

4.1）匹配單個(gè)表達(dá)式或多個(gè)正則表達(dá)式

與BRE不同之處在于：
區(qū)間表達(dá)式不需要反斜杠字符：如a{5} or q{10,42} 是不是爽到爆；
ERE有兩個(gè)meta字符：
？ matching 0 or 1 前置正則表達(dá)式
+ matching 1 or more 前置正則表達(dá)式

4.2) 交替

問(wèn)題：方括號(hào)表達(dá)式易于表示匹配這個(gè)字符那個(gè)字符，但是不能指定匹配這個(gè)序列那個(gè)序列，交給管道字符(|）來(lái)處理吧
如： read |write matching read or write

【Attention】

| 運(yùn)算法是在ERE中優(yōu)先級(jí)別最低的；

4.3 ）分組

圓方括號(hào)提供了分組功能；
如：（why）+ mathcing one or more 連續(xù)重復(fù)的why
而且分組可以和交替相結(jié)合；
如： read|write+ 指的是匹配正好一個(gè)read或是一個(gè)write后面跟了無(wú)數(shù)個(gè)e字符如 writee, writeeeee

【key】

當(dāng)你將交替操作結(jié)合^, $ 錨點(diǎn)字符使用時(shí)，分組就非常好用了。
\^abcd|efgh\$ matching 字符串的起始處是否有abcd或者結(jié)尾處室友有efgh ， nice！

4.4）ERE運(yùn)算符的優(yōu)先級(jí)

first: [...] [= =] [: :] 方括號(hào)符號(hào) second: \metacharacter 轉(zhuǎn)義的meta字符 third: [] 方括號(hào)表達(dá)式 4th: () 分組 5th: * + ? {} 重復(fù)前置的表達(dá)式 6th: 無(wú)符號(hào) 連續(xù)字符 7th: ^$ 錨點(diǎn) 8th: | 交替

【extension】

說(shuō) \<\> 可以匹配一個(gè)單詞; 如：\<chop 匹配于 use chopsticks not eat a lambchop; chop\> matching eat a lambchop; \<chop\> 指匹配 chop

【complementary】

unix程序及其正則表達(dá)式類(lèi)型

總結(jié)

以上是生活随笔為你收集整理的正则表达式总结之查找的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

正则表达式

上一篇：换购什么意思怎么理解换购
下一篇：文本替换sed+字段处理cut,join

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

正则表达式总结之查找

【0】、寫(xiě)在前面

以下內(nèi)容總結(jié)于shell腳本學(xué)習(xí)指南

【1】我們說(shuō)查找文本要用到三種文本匹配程序 ：

1.1）grep 使用的是基本正則表達(dá)式（basic regular expression，BRE）

1.2）擴(kuò)展式grep 使用 egrep（extended regular express， ERE）；用grep -E 取代 egrep

1.3）快速grep （fast grep），主要用于匹配固定字符串而非正則表達(dá)式；用grep -F取代fgrep

【2】grep的用法 ： 匹配一個(gè)或者多個(gè)模式的文本行

2.1）-E 取代egrep

2.2）-F 取代fgrep

2.3）-e par-list 匹配多個(gè)模式，自己查

2.4）-i 忽略大小寫(xiě)

2.5）-v 顯示不匹配的行

2.6） -q 匹配成功則離開(kāi)，不寫(xiě)入到標(biāo)準(zhǔn)輸出

2.7） -l 列出匹配模式的文件名稱(chēng)，而不是打印匹配的行

【3】基本正則表達(dá)式

3.1）匹配單個(gè)字符

3.1.1）單個(gè)字符

3.1.2） 轉(zhuǎn)義的meta字符

3.1.3）.號(hào) match 任一字符not任意字符 a.c match abc,aac not ac

3.1.4） 方括號(hào)表達(dá)式

3.2）POSIX 的排序符號(hào) 等價(jià)字符集以及字符集

3.2.1） 排序

3.2.2） 等價(jià)字符集

3.2.3）字符集

3.3）后向引用

3.4） 單字符匹配多字符

3.4.1） * 修飾符是好用的，但是他沒(méi)有顯示；（用于匹配0個(gè)或者多個(gè)）

3.4.2）區(qū)間表達(dá)式

【Attention】

3.4） 文本匹配錨點(diǎn)

3.4.1）脫字符號(hào)^ :限定匹配字符串的起始處

3.4.２）貨幣符號(hào)＄ :限定匹配字符串的結(jié)束處

3.5）BRE運(yùn)算符的優(yōu)先級(jí)

【4】擴(kuò)展正則表達(dá)式

4.1）匹配單個(gè)表達(dá)式或多個(gè)正則表達(dá)式

4.2) 交替

【Attention】

4.3 ） 分組

【key】

4.4）ERE運(yùn)算符 的優(yōu)先級(jí)

【extension】

【complementary】

總結(jié)

【1】我們說(shuō)查找文本要用到三種文本匹配程序：

【2】grep的用法：匹配一個(gè)或者多個(gè)模式的文本行

3.1.2）轉(zhuǎn)義的meta字符

3.1.4）方括號(hào)表達(dá)式

3.2.1）排序

3.2.2）等價(jià)字符集

3.4）單字符匹配多字符

**3.4.1） * 修飾符是好用的，但是他沒(méi)有顯示；（用于匹配0個(gè)或者多個(gè)）**

3.4）文本匹配錨點(diǎn)

4.3 ）分組

4.4）ERE運(yùn)算符的優(yōu)先級(jí)