php正则匹配sg-nc-wap_php正则匹配
概述
正則表達式是一種描述字符串結(jié)果的語法規(guī)則,是一個特定的格式化模式,可以匹配、替換、截取匹配的字符串。常用的語言基本上都有正則表達式,如JavaScript、java等。其實,只有了解一種語言的正則使用,其他語言的正則使用起來,就相對簡單些。文本主要圍繞解決下面問題展開。
有哪些常用的轉(zhuǎn)義字符
什么是限定符與定位符
什么是單詞定位符
特殊字符有哪些
什么是逆向引用以及怎樣使用逆向引用
匹配模式
php中怎樣使用正則表達式
php中哪些方面需要用到正則
怎樣進行郵箱匹配,url匹配,手機匹配
怎樣使用正則替換字符串中某些字符
貪婪匹配與惰性匹配區(qū)別
正則表達式之回溯與固態(tài)分組
正則優(yōu)缺點有哪些
正則表達式的基本知識匯總
行定位符(^與$)
行定位符是用來描述字符串的邊界。“$”表示行結(jié)尾“^”表示行開始如"^de",表示以de開頭的字符串"de$",表示以de結(jié)尾的字符串。
單詞定界符
我們在查找的一個單詞的時候,如an是否在一個字符串”gril and body”中存在,很明顯如果匹配的話,an肯定是可以匹配字符串“gril and body”匹配到,怎樣才能讓其匹配單詞,而不是單詞的一部分呢?這時候,我們可以是喲個單詞定界符\b。
\ban\b 去匹配”gril and body”的話,就會提示匹配不到。
當然還有一個大寫的\B,它的意思,和\b正好相反,它匹配的字符串不能使一個完整的單詞,而是其他單詞或字符串中的一部分。如\Ban\B。
選擇字符(|) ,表示或
選擇字符表示或的意思。如Aa|aA,表示Aa或者是aA的意思。注意使用”[]”與”|”的區(qū)別,在于”[]”只能匹配單個字符,而”|”可以匹配任意長度的字符串。在使用”[]”的時候,往往配合連接字符”-“一起使用,如[a-d],代表a或b或c或d。
排除字符,排除操作
正則表達式提供了”^”來表示排除不符合的字符,^一般放在[]中。如[^1-5],該字符不是1~5之間的數(shù)字。
限定符(?*+{n,m})
限定符主要是用來限定每個字符串出現(xiàn)的次數(shù)。
限定字符
含義
?
零次或一次
*
零次或多次
+
一次或多次
{n}
n次
{n,}
至少n次
{n,m}
n到m次
如(D+)表示一個或多個D
點號操作符
匹配任意一個字符(不包含換行符)
表達式中的反斜杠(\)
表達式中的反斜杠有多重意義,如轉(zhuǎn)義、指定預(yù)定義的字符集、定義斷言、顯示不打印的字符。
轉(zhuǎn)義字符
轉(zhuǎn)義字符主要是將一些特殊字符轉(zhuǎn)為普通字符。而這些常用特殊字符有”.”,”?”、”\”等。
指定預(yù)定義的字符集
字符
含義
\d
任意一個十進制數(shù)字[0-9]
\D
任意一個非十進制數(shù)字
\s
任意一個空白字符(空格、換行符、換頁符、回車符、字表符)
\S
任意一個非空白字符
\w
任意一個單詞字符
\W
任意個非單詞字符
###顯示不可打印的字符
字符
含義
\a
報警
\b
退格
\f
換頁
\n
換行
\r
回車
\t
字表符
括號字符()
在正則表達式中小括號的作用主要有:
改變限定符如(|、*、^)的作用范圍
如(my|your)baby,如果沒有”()”,|將匹配的是要么是my,要么是yourbaby,有了小括號,匹配的就是mybaby或yourbaby。
進行分組,便于反向引用
反向引用
反向引用,就是依靠子表達式的”記憶”功能,匹配連續(xù)出現(xiàn)的字串或是字符。如(dqs)(pps)\1\2,表示匹配字符串dqsppsdqspps。在下面php應(yīng)用中,我將詳細展開學(xué)習(xí)反向引用。
模式修飾符
模式修飾符的作用是設(shè)定模式,也就是正則表達式如何解釋。php中主要模式如下表:
修飾符
說明
i
忽略大小寫
m
多文本模式
s
單行文本模式
x
忽略空白字符
正則表達式在php中應(yīng)用
php中字符串匹配
所謂的字符串匹配,言外之意就是判斷一個字符串中,是否包含或是等于另一個字符串。如果不使用正則,我們可以使用php中提供了很多方法進行這樣的判斷。
不使用正則匹配
strstr函數(shù)
string strstr ( string?haystack,mixedneedle [, bool $before_needle = false ])
注1:haystack是當事字符串,needle是被查找的字符串。該函數(shù)區(qū)分大小寫。
注2:返回值是從needle開始到最后。
注3:關(guān)于$needle,如果不是字符串,被當作整形來作為字符的序號來使用。
注4:before_needle若為true,則返回前東西。
stristr函數(shù)與strstr函數(shù)相同,只是它不區(qū)分大小寫
strpo函數(shù)
int strpos ( string?haystack,mixedneedle [, int $offset = 0 ] )
注1:可選的offset參數(shù)可以用來指定從haystack中的哪一個字符開始查找。返回的數(shù)字位置是相對于haystack的起始位置而言的。
stripos -查找字符串首次出現(xiàn)的位置(不區(qū)分大小定)
strrpos -計算指定字符串在目標字符串中最后一次出現(xiàn)的位置
strripos -計算指定字符串在目標字符串中最后一次出現(xiàn)的位置(不區(qū)分大小寫)
使用正則進行匹配
在php中,提供了preg_math()和preg_match_all函數(shù)進行正則匹配。關(guān)于這兩個函數(shù)原型如下:
int preg_match|preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )
搜索subject與pattern給定的正則表達式的一個匹配.
pattern:要搜索的模式,字符串類型。
subject :輸入字符串。
matches:如果提供了參數(shù)matches,它將被填充為搜索結(jié)果。matches[0]將包含完整模式匹配到的文本,matches[1]將包含第一個捕獲子組匹配到的文本,以此類推。
flags:flags可以被設(shè)置為以下標記值:PREG_OFFSET_CAPTURE如果傳遞了這個標記,對于每一個出現(xiàn)的匹配返回時會附加字符串偏移量(相對于目標字符串的)。 注意:這會改變填充到matches參數(shù)的數(shù)組,使其每個元素成為一個由 第0個元素是匹配到的字符串,第1個元素是該匹配字符串 在目標字符串subject中的偏移量。
offset:通常,搜索從目標字符串的開始位置開始。可選參數(shù)offset用于 指定從目標字符串的某個未知開始搜索(單位是字節(jié))。
返回值:preg_match()返回pattern的匹配次數(shù)。 它的值將是0次(不匹配)或1次,因為preg_match()在第一次匹配后 將會停止搜索。preg_match_all()不同于此,它會一直搜索subject直到到達結(jié)尾。 如果發(fā)生錯誤preg_match()返回FALSE。
實例
實例1
判斷字符串”http://blog.csdn.net/hsd2012“中是否包含csdn?
解法一(不適用正則):
如果不適用正則,我們使用strstr或者strpos中任意一個都可以,在此,我將使用strstr函數(shù),代碼如下:
$str='http://blog.csdn.net/hsd2012';function checkStr1($str,$str2)
{
return strstr1($str,$str2)?true:false;
}echo checkStr($str,'csdn');
解法二:使用正則
因為我們只需要判斷是否存在即可,所以選擇preg_match。
$str='http://blog.csdn.net/hsd2012';$pattern='/csdn/';function checkStr2($str,$str2)
{
return preg_match($str2,$str)?true:false;
}echo checkStr2($str,$pattern);
實例2(考察單詞定界符)
判斷字符串”I am a good boy”中是否包含單詞go
首先判斷是單詞,而不是字符串,因此比較的時候,需要比較是否包含’ go ‘,即在字符串go前后有一個空格。
解析:如果使用非正則比較,只需要調(diào)用上面的checkStr1()函數(shù)即可,注意,第二個參數(shù)前后要加一個空格,即’ go ‘。如果使用正則,
我們可以考慮使用單詞定界符\b,那么$pattern=’/\bgo\b/’;然后調(diào)用checkStr2函數(shù)即可.
例3(考察反向引用)
判斷字符串”I am a good boy”中是否包含3個相同的字母
解析:此時,如果我們不使用正則,將會很難判斷,因為字母太多了,我們不可能去將所有字母分別與該字符串比較,那樣工作量也比較大。這時候涉及到了正在的反向引用。在php正則表達式中,通過\n,來表示第n次匹配到的結(jié)果。如\5代表第五次匹配到的結(jié)果。那么本題的$pattern='/(\w).*\1.*\1/';
主要注意的是,在使用反向匹配的時候都需要使用(),反向匹配時,匹配()里面出現(xiàn)的字符或字符串。
php中字符串替換
不使用正則
php中當替換字符串的時候,如果不適用正則,我們通常使用substr、mb_substr、str_replace、substr_replace關(guān)于這幾個函數(shù)區(qū)別如下表。
函數(shù)符
功能
描述
str_replace(find,replace,string,count)
使用一個字符串替換字符串中的另一些字符。
find 必需。規(guī)定要查找的值。replace 必需。規(guī)定替換 find 中的值的值。string 必需。規(guī)定被搜索的字符串。count 可選。一個變量,對替換數(shù)進行計數(shù)。
substr_replace(string,replacement,start,length)
把字符串的一部分替換為另一個字符串。適合用于替換自定位置的字符串。
string 必需。規(guī)定要檢查的字符串。replacement 必需。規(guī)定要插入的字符串。start 必需。規(guī)定在字符串的何處開始替換。
使用正則
如果使用正則替換,php中提供了preg_replace _callback和preg_replace函數(shù),preg_replace原型如下:
mixed preg_replace ( mixed?pattern,mixedreplacement , mixed?subject[,intlimit = -1 [, int &count]])函數(shù)功能描述:在字符串subject中,查找pattern,然后使用replacement去替換,如果有l(wèi)imit則代表限制替換limit次。pregreplacecallback與pregreplace功能相識,不同的是pregreplaceback使用一個回調(diào)函數(shù)callback來代替replacement.?例1將字符串”hello,中國”中的hello替換為′你好′;如果不是用正則:str=’hello,中國’;
str=strreplace(′hello′,′你好′,str)
或是使用str=substrreplace(str,’你好’,0,5)
使用正則
pattern=′/hello/′;str=preg_replace (pattern,′你好′,str);
- 例2
去除字符串”gawwenngeeojjgegop”中連續(xù)相同的字母
$str='gawwenngeeojjgegop';$pattern='/(.)\1/';$str=preg_replace($pattern,'',$str);
解析:當然這樣可能會遇到,當?shù)谝淮稳コ酥貜?fù)了字符串后,又出來重復(fù)的字符串。如字符串味’gewwenngeeojjgegop’,針對這中問題,當然,這樣的話,通過判斷,繼續(xù)替換下去。
例3
將字符串中”age13gegep3iorji65k65k”;中出現(xiàn)的連續(xù)兩個數(shù)字改為第二個數(shù)字,如字符串中13被改為3
$str='age13gegep3iorji65k65k';$pattern='/(\d)(\d)/';$str=preg_replace($pattern,'$2', $str);
解析:$n在正則表達式外使用反向引用。n代表第幾次匹配到的結(jié)果。
php中字符串分割
不適用正則
php提供了explode函數(shù)去分割字符串,與其對應(yīng)的是implode。關(guān)于explode原型如下:
array explode ( string?delimiter,stringstring [, int $limit ] )
delimiter:邊界上的分隔字符。
string:輸入的字符串。
limit:如果設(shè)置了limit參數(shù)并且是正數(shù),則返回的數(shù)組包含最多l(xiāng)imit個元素,而最后那個元素將包含string的剩余部分。如果limit參數(shù)是負數(shù),則返回除了最后的-limit個元素外的所有元素。如果limit是0,則會被當做1。
使用正則
關(guān)于通過正則表達式進行字符串分割,php提供了split、preg_split函數(shù)。preg_split()函數(shù),通常是比split()更快的替代方案。
array preg_split ( string?pattern,stringsubject [, int?limit=?1[,intflags = 0 ]] )
$str='http://blog.csdn.net/hsd2012/article/details/51152810';$str=explode('/', $str);
解法二:
$str='http://blog.csdn.net/hsd2012/article/details/51152810';$pattern='/\//'; ?/*因為/為特殊字符,需要轉(zhuǎn)移*/$str=preg_split ($pattern, $str);
php中貪婪匹配與惰性匹配
貪婪匹配:就是匹配盡可能多的字符。
比如,正則表達式中m.*n,它將匹配最長以m開始,n結(jié)尾的字符串。如果用它來搜索manmpndegenc的話,它將匹配到的字符串是manmpndegen而非man。可以這樣想,當匹配到m的時候,它將從后面往前匹配字符n。
懶惰匹配:就是匹配盡可能少的字符。
有的時候,我們需要并不是去貪婪匹配,而是盡可能少的去匹配。這時候,就需要將其轉(zhuǎn)為惰性匹配。怎樣將一個貪婪匹配轉(zhuǎn)為惰性匹配呢?只需要在其后面添加一個”?”即可。如m.*?n將匹配manmpndegenc,匹配到的字符串是man。
函數(shù)符
描述
*?
零次或多次,但盡可能少的匹配
+?
一次或多次,但盡可能少的匹配
??
0次或1次,但盡可能少的匹配
{n,}?
至少n次,但盡可能少的匹配
{n,m}?
n到m次 ,但盡可能少的匹配
php正則表達式之回溯與固態(tài)分組
回溯
首先我們需要清楚什么是回溯,回溯就像是在走岔路口,當遇到岔路的時候就先在每個路口做一個標記。如果走了死路,就可以照原路返回,直到遇見之前所做過的標記,標記著還未嘗試過的道路。如果那條路也走不能,可以繼續(xù)返回,找到下一個標記,如此重復(fù),直到找到出路,或者直到完成所有沒有嘗試過的路。首先我們看例題
$str='aageacwgewcaw';$pattern='/a\w*c/i';$str=preg_match($pattern, $str);
看到上面的程序,可能都清楚是什么意思,就是匹配$str是否包含這樣一個由”a+0個或多個字母+c”不區(qū)分大小寫的字符串。但是至于程序怎樣去匹配的呢?匹配的過程中,回溯了多少次呢?
匹配過程
接下來操作描述
‘a(chǎn)\w*c’中a匹配到’aageacwgewcaw’中第一個字符a
\w進行下一個字符匹配
因為\w是貪婪匹配,會一直匹配到’aageacwgewcaw’中最后一個字符w
c進行下一個字符匹配時
‘a(chǎn)\w*c’中c發(fā)現(xiàn)沒有可以匹配的
于是\w匹配進行第一次回溯,匹配到倒數(shù)第二個字符a
‘a(chǎn)\w*c’中c發(fā)現(xiàn)還是沒有可以匹配的
于是\w匹配進行第二次回溯,匹配到倒數(shù)第三個字符c
‘a(chǎn)\w*c’中c匹配成功
匹配結(jié)束返回結(jié)果
現(xiàn)在,如果我們將pattern改為pattern=’/a\w*?c/i’;又會回溯多少次呢?正確答案是回溯四次。
固態(tài)分組
固態(tài)分組,目的就是減少回溯次數(shù), 使用(?>…)括號中的匹配時如果產(chǎn)生了備選狀態(tài),那么一旦離開括號便會被立即 引擎拋棄掉。舉個典型的例子如:‘\w+:’這個表達式在進行匹配時的流程是這樣的,會優(yōu)先去匹配所有的符合\w的字符,假如字符串的末尾沒有’:’,即匹配沒有找到冒號,此時觸發(fā)回溯機制,他會迫使前面的\w+釋放字符,并且在交還的字符中重新嘗試與’:’作比對。但是問題出現(xiàn)在這里: \w是不包含冒號的,顯然無論如何都不會匹配成功,可是依照回溯機制,引擎還是得硬著頭皮往前找,這就是對資源的浪費。所以我們就需要避免這種回溯,對此的方法就是將前面匹配到的內(nèi)容固化,不令其存儲備用狀態(tài)!,那么引擎就會因為沒有備用狀態(tài)可用而只得結(jié)束匹配過程。大大減少回溯的次數(shù)。
如下代碼,就不會進行回溯:
$str='nihaoaheloo';$pattern='/(?>\w+):/';$rs=preg_match($pattern, $str);
當然有的時候,又需慎用固態(tài)分組,如下,我要檢查$str中是否包含以a結(jié)尾的字符串,很明顯是包含的,但是因為使用了固態(tài)分組,反而達不到我們想要的效果
$str='nihaoahelaa';$pattern1='/(?>\w+)a/';$pattern2='/\w+a/';$rs=preg_match($pattern1, $str);//0$rs=preg_match($pattern2, $str);//1
php中其他常用字符串操作函數(shù)
字符串截取截取
string substr ( string?string,intstart [, int?length])stringmbsubstr(stringstr , int?start[,intlength = NULL [, string $encoding = mb_internal_encoding() ]] )
字符串中大小寫轉(zhuǎn)換
strtoupper
strtolower
ucfirst
ucwords
字符串比較
-strcmp、strcasecmp、strnatcmp
字符串過濾
字符串翻轉(zhuǎn)
strrev($str);
字符串隨機排序
string str_shuffle ( string $str )
補充
怎樣進行郵箱匹配,url匹配,手機匹配
使用preg_match函數(shù)進行匹配,以下內(nèi)容從TP中復(fù)制而來。
郵箱驗證
pattern=′/\w+([?+.]\w+)?@\w+([?.]\w+)?\.\w+([?.]\w+)?/’;
url匹配
pattern='/^http(s?):\/\/(?:[A-za-z0-9-]+\.)+[A-za-z]{2,4}(:\d+)?(?:[\/\?#][\/=\?%\-&~`@[\]\':+!\.#\w]*)?/’;
手機驗證
pattern=′/1[3458]\d10/’;
php中正則的優(yōu)缺點
php中正則在某些時候,能幫我們解決php函數(shù)很多困難的匹配或是替換。然后php中正則的效率,往往是我們需要考慮的,所以在某些時候,能不用正則還是盡量不去用它,除非,某些場合必須用到,或是我們能夠有效減少其回溯次數(shù)。
總結(jié)
以上是生活随笔為你收集整理的php正则匹配sg-nc-wap_php正则匹配的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信消息过多被限制接收怎么办(微信公众平
- 下一篇: 动态规划算法php,php算法学习之动态