當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

注册用户名非法关键字限制

發(fā)布時(shí)間：2023/12/20 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了注册用户名非法关键字限制小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

@#%）等等這類符號(hào)不行為什么用戶注冊(cè)時(shí)要屏蔽“用戶信息保留關(guān)鍵字”？1、保護(hù)會(huì)員安全，防止有用戶使用管理員的名義來騙取其他會(huì)員的錢財(cái)2、仿制部分網(wǎng)友采用域名注冊(cè)，惡意來宣傳discuz有這個(gè)功能，可以研究一下：后臺(tái) → 全局?→?注冊(cè)與訪問控??→?注冊(cè)?→?用戶信息保留關(guān)鍵字UCenter → 注冊(cè)設(shè)置??→?禁止的用戶名

wordpresswp-includes/user.phpsanitize_user屏蔽非法關(guān)鍵詞用戶名教大家如何禁止wordpress網(wǎng)站用戶在注冊(cè)時(shí)使用敏感關(guān)鍵。首先在functions.php文件中加入以下兩段代碼： function ruikeedu_blacklist_check($str){ $moderation_keys = trim(get_option('moderation_keys')); $blacklist_keys = trim(get_option('blacklist_keys')); $keys = $moderation_keys ."\n".$blacklist_keys; $words = explode("\n", $keys ); foreach ( (array) $words as $word) { $word = trim($word); if ( empty($word) ) continue; $word = preg_quote($word, '#'); $pattern = "#$word#i"; if ( preg_match($pattern, $str) ) return true; } return false; } add_filter( 'sanitize_user', 'ruikeedu_sanitize_user',3,3); function ruikeedu_sanitize_user($username, $raw_username, $strict){ if(ruikeedu_blacklist_check($username)){ $username = ''; } return $username; }然后在 WordPress 后臺(tái) > 設(shè)置 > 討論，我們輸入“評(píng)論審核”和“評(píng)論黑名單”關(guān)鍵字，就可以來屏蔽用戶使用敏感關(guān)鍵詞來注冊(cè)了。

用戶注冊(cè)時(shí)候不能含有非法關(guān)鍵字，同上WordPress 后臺(tái) > 設(shè)置 > 討論，可以讓我們輸入“評(píng)論審核”和“評(píng)論黑名單”關(guān)鍵字，這些關(guān)鍵字在用戶留言的時(shí)候?qū)⒂糜诜欠P(guān)鍵字的檢測。那么我們是否可以將這些關(guān)鍵字用于其他方面呢？比如用戶注冊(cè)的時(shí)候，用戶名不能包含這些非法關(guān)鍵字。答案肯定是可以：首先創(chuàng)建非法關(guān)鍵字檢測函數(shù)：function wpjam_blacklist_check($str){ $moderation_keys = trim(get_option('moderation_keys')); $blacklist_keys = trim(get_option('blacklist_keys')); $keys = $moderation_keys ."\n".$blacklist_keys; $words = explode("\n", $keys ); foreach ( (array) $words as $word) { $word = trim($word); // Skip empty lines if ( empty($word) ) continue; // Do some escaping magic so that '#' chars in the // spam words don't break things: $word = preg_quote($word, '#'); $pattern = "#$word#i"; if ( preg_match($pattern, $str) ) return true; } return false; }設(shè)置用戶名不能含有待審關(guān)鍵字和黑名單關(guān)鍵字。add_filter( 'sanitize_user', 'wpjam_sanitize_user',3,3); function wpjam_sanitize_user($username, $raw_username, $strict){ if(wpjam_blacklist_check($username)){ $username = ''; } return $username; }將上面這兩段函數(shù)復(fù)制到當(dāng)前主題的?functions.php?文件即可。*版主**管理**站長**admin**超版**眾樂網(wǎng)**眾樂**社區(qū)**元老*Administrator*管理**@**網(wǎng)**com**cn**net**org**cc**tk**公司**gov.cn**name**info**biz**官方**tm **mn**in**pro**net.cn **travel **ag**cm **com.hk **org.cn**sh **ws**vc**co**com.tw**版主* *斑竹* *吧主* *霸主* *Manager**<* *>**文學(xué)**作家**文章**作品**昵稱**名字**名稱* *人名**name**網(wǎng)站* *baidu*百度*sina*新浪*163*網(wǎng)易 *sohu*搜狐*xunlei* 訊雷 *gougou*狗狗*iask*愛問 *youku*優(yōu)酷*56*我樂 *hao123*好123*頭銜* *關(guān)鍵字* *關(guān)鍵詞* *統(tǒng)配符**網(wǎng)頁**電腦* *文檔* *瀏覽器* *保留**主席* *公司* *總經(jīng)理* *投資商**股東**Marshal**fuck**操* *靠**日* *kao**cao* *黑社會(huì)**流氓* *se**色**性-愛**肏**尼瑪**你媽**傻**www**qq**QQ**yy**YY**戰(zhàn)隊(duì)**火線**游戲**刷機(jī)**刷級(jí)**網(wǎng)**攻擊**黑**黃**迷藥**匿名**倪明**佚名**未知*

admin

administrator

管理員

版主

超級(jí)版主

超級(jí)管理員

本站管理員

本版版主

會(huì)員

超級(jí)會(huì)員

vip

*.com*

*.cn*

用戶管理

*管理員*

*官方

*京東*

*淘寶*

PHP屏蔽過濾指定關(guān)鍵字的方法實(shí)現(xiàn)思路：一、把關(guān)鍵字專門寫在一個(gè)文本文件里，每行一個(gè)，數(shù)量不限，有多少寫多少。二、PHP讀取關(guān)鍵字文本，存入一個(gè)數(shù)組三、遍歷關(guān)鍵字?jǐn)?shù)組，挨個(gè)用strpos函數(shù)去看看內(nèi)容有沒有關(guān)鍵字，如果有，返回true,沒有則返回falsePHP代碼如下:[php]?view plaincopy

/*?PHP中用strpos函數(shù)過濾關(guān)鍵字?*/??

//?關(guān)鍵字過濾函數(shù)??

function?keyWordCheck($content){??

//?去除空白??

$content?=?trim($content);??

//?讀取關(guān)鍵字文本??

$content?=?@file_get_contents('keyWords.txt');??

//?轉(zhuǎn)換成數(shù)組??

$arr?=?explode("n",?$content);??

//?遍歷檢測??

for($i=0,$k=count($arr);$i<$k;$i++){??

//?如果此數(shù)組元素為空則跳過此次循環(huán)??

if($arr[$i]==''){??

continue;???

}???

//?如果檢測到關(guān)鍵字，則返回匹配的關(guān)鍵字,并終止運(yùn)行??

if(@strpos($str,trim($arr[$i]))!==false){??

//$i=$k;???

return?$arr[$i];??

}???

}??

//?如果沒有檢測到關(guān)鍵字則返回false???

return?false;??

}???

$content?=?'這里是要發(fā)布的文本內(nèi)容。。。';???

//?過濾關(guān)鍵字??

$keyWord?=?keyWordCheck($content);??

//?判斷是否存在關(guān)鍵字??

if($keyWord){??

echo?'你發(fā)布的內(nèi)容存在關(guān)鍵字'.$keyWord;??

}else{??

echo?'恭喜！通過關(guān)鍵字檢測';??

//?往下可以進(jìn)行寫庫操作完成發(fā)布動(dòng)作。??

}

例子2 （注：中文關(guān)鍵字過濾時(shí)使用的關(guān)鍵字文件為utf-8編碼）[php]?view plaincopy

/**?

?*?被禁止的關(guān)鍵字檢測?

?*?

?*?@param?string?$string??要檢測的字符串?

?*?@param?string?$fileName?屏蔽關(guān)鍵字文件?

?*?@return?bool?

?*/??

function?banwordCheck(?$string,?$fileName?)??

{??

?if?(?!($words?=?file_get_contents(?$fileName?))?){??

??die('file?read?error!');??

?}??

?$string?=?strtolower($string);??

?$matched?=?preg_match('/'.$words.'/i',?$string,?$result);??

?if?(?$matched?&&?isset($result[0])?&&?strlen($result[0])?>?0?)??

?{??

??if?(?strlen($result[0])?==?2?){??

???$matched?=?preg_match('/'.$words.'/iu',?$string,?$result);??

??}???

??if?(?$matched?&&?isset($result[0])?&&?strlen($result[0])?>?0?)?{??

???return?true;??

??}else{??

???return?false;??

??}????

?}else{??

??return?false;??

?}??

}??

$content?=?'測試關(guān)鍵字';??

if?(?banwordCheck($content,?'./banwords.txt')?){??

?echo?"matched!?";??

}else{??

?echo?"no?match!?";??

}??

用正則去匹配關(guān)鍵字，把關(guān)鍵字用別的字符替換[php]?view plaincopy

$str?=?"/你大爺|你麻痹|什么玩意|SB|你他媽/";??//?關(guān)鍵字正則字符串????

?$string?=?"你他媽干什么玩意了?SB";????//?文本字符串???

?echo?preg_replace($str,?"*",?$string);????//preg_replace()?執(zhí)行一個(gè)正則表達(dá)式的匹配和替換??

思路1.把關(guān)鍵字放到一個(gè)txt文檔中要用一定的符合分隔開，用file_get_contents() 函數(shù)將關(guān)鍵字文檔讀入2.用函數(shù)explode() 把字符串分割成數(shù)組循環(huán)數(shù)組 strpos() 查找匹配關(guān)鍵字代碼[php]?view plaincopy

header('content-type:textml;?charset=utf-8;');???

function?strPosFuck($content)???

{?????

$fuck?=?file_get_contents('keyWords.txt');??//?讀取關(guān)鍵字文本信息????

$content?=?trim($content);????$fuckArr?=?explode("\n",$fuck);??//?把關(guān)鍵字轉(zhuǎn)換為數(shù)組????

for?($i=0;?$i?<?count($fuckArr)?;?$i++)?????

{????

//?$fuckArr[$i]?=?trim($fuckArr[$i]);????

if?($fuckArr[$i]?==?"")?{???????

continue;??//如果關(guān)鍵字為空就跳過本次循環(huán)?????

#?code...?????

}??????

if?(strpos($content,trim($fuckArr[$i]))?!=?false)??????

??{??????

??return?$fuckArr[$i];??//如果匹配到關(guān)鍵字就返回關(guān)鍵字???????

??#?code...???????

??}?????

??}????return?false;??//?如果沒有匹配到關(guān)鍵字就返回?false???

??}???

??$content?=?"我今天你大爺碰到一個(gè)SB";????

??$key?=?strPosFuck($content);???

??if?($key)???

??{????

??echo?"存在關(guān)鍵字".$key;????

??#?code...????

??}???

??else????

??{?????

??echo?"OK";???

??}??

注意點(diǎn)?一定要去空一定要去空，strops() 函數(shù)返回值要么是false 要么就是關(guān)鍵字的位置判斷的時(shí)候注意成功后大家可以想想怎么把匹配到的關(guān)鍵字全部返回組成一個(gè)字符串或者數(shù)組關(guān)鍵詞少的時(shí)候，用簡單的遍歷就可以，沒必要復(fù)雜化如果類似貼吧這種大型社區(qū)，敏感詞庫龐大的，可以使用DFA算法來進(jìn)行判斷和過濾Python和JAVA有很多現(xiàn)成的過濾方法，如http://blog.csdn.net/woshiaotian/article/details/10047675http://blog.zhaojie.me/2008/12/filter-forbidden-word-solution.html 關(guān)鍵字過濾解決方案（上）在Discuz!論壇后臺(tái)，站長可以在后臺(tái)-帖子-詞語過濾里設(shè)置需要屏蔽或替換的關(guān)鍵詞。一般這些需要屏蔽和替換的關(guān)鍵字包括一些和政治、色情相關(guān)的違法國家法律法規(guī)的詞語。????在這里，我們點(diǎn)“批量添加”，然后將壓縮包中的“屏蔽關(guān)鍵詞.txt”文件導(dǎo)入，進(jìn)行批量屏蔽非法關(guān)鍵詞。??? 其中，在Discuz!論壇后臺(tái)設(shè)置屏蔽的關(guān)鍵字只能保證帖子內(nèi)容正當(dāng)不違規(guī)，站長可以在UCenter后臺(tái)-詞語過濾里面進(jìn)一步設(shè)置一些屏蔽的關(guān)鍵字，這里就不具體舉例了，以保障用戶的短消息也能安全。??? 屏蔽關(guān)鍵詞表下載http://www.cnblogs.com/AndersLiu/archive/2007/03/25/687069.html在線測試/學(xué)習(xí)正則表達(dá)式的網(wǎng)址，http://www.gskinner.com/RegExr/只含有漢字、數(shù)字、字母、下劃線，下劃線位置不限：? ^[a-zA-Z0-9_\u4e00-\u9fa5]+$如一個(gè)用戶叫Bill Gates，另一個(gè)人起名叫Bill Gates，區(qū)別只是兩個(gè)單詞見多了一個(gè)空格，當(dāng)然也可能是換行符這種不可見字符，它們?cè)跒g覽器里面看上去就象同一個(gè)人）1. 字母數(shù)字字符（英文字母和數(shù)字）?2. 下劃線(_)?與此同時(shí)，我們還強(qiáng)制用戶名最短3個(gè)字符最長不超過16個(gè)字符。下面就是符合上述描述條件的正則表達(dá)式：?/[a-zA-Z0-9_]{3,16}/?這個(gè)有問題，需要用到行定位點(diǎn)， ^ (caret) 和 $ (dollar) 字符將把我們的表達(dá)式限制在一個(gè)字符串的起點(diǎn)和終點(diǎn)位置，這樣可以確保整個(gè)用戶名符合我們的設(shè)定，而不是一部分。修訂版的正則表達(dá)式象這樣：?/^[a-zA-Z0-9_]{3,16}$/?function validate_username( $username ) { if(preg_match('/^[a-zA-Z0-9_]{3,16}$/', $_GET['username'])) { return true; } return false; }Warning: preg_match() [function.preg-match]: Compilation failed: PCRE does not support \L, \l, \N, \U, or \u at offset 3?in?test.php on line 3if?(preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {print("該字符串全部是中文");}?else?{print("該字符串不全部是中文");}在php中，是用\x表示十六進(jìn)制數(shù)據(jù)的。http://www.cnblogs.com/seanxyh/archive/2013/04/03/2998596.html說明：正則表達(dá)式通常用于兩種任務(wù)：1.驗(yàn)證，2.搜索/替換。用于驗(yàn)證時(shí)，通常需要在前后分別加上^和$，以匹配整個(gè)待驗(yàn)證字符串；搜索/替換時(shí)是否加上此限定則根據(jù)搜索的要求而定，此外，也有可能要在前后加上\b而不是^和$。此表所列的常用正則表達(dá)式，除個(gè)別外均未在前后加上任何限定，請(qǐng)根據(jù)需要，自行處理。正則表達(dá)式（英文：Regular Expression）在計(jì)算機(jī)科學(xué)中，是指一個(gè)用來描述或者匹配一系列符合某個(gè)句法規(guī)則的字符串的單個(gè)字符串。

說明	正則表達(dá)式
網(wǎng)址（URL）	[a-zA-z]+://[^\s]*
IP地址(IP Address)	((2[0-4]\d\|25[0-5]\|[01]?\d\d?)\.){3}(2[0-4]\d\|25[0-5]\|[01]?\d\d?)
電子郵件(Email)	\w+([-+.]\w+)@\w+([-.]\w+)\.\w+([-.]\w+)*
QQ號(hào)碼	[1-9]\d{4,}
HTML標(biāo)記(包含內(nèi)容或自閉合)	<(.)(.)>.<\/\1>\|<(.) \/>
密碼(由數(shù)字/大寫字母/小寫字母/標(biāo)點(diǎn)符號(hào)組成，四種都必有，8位以上)	(?=^.{8,}$)(?=.\d)(?=.\W+)(?=.[A-Z])(?=.[a-z])(?!.\n).$
日期(年-月-日)	(\d{4}\|\d{2})-((1[0-2])\|(0?[1-9]))-(([12][0-9])\|(3[01])\|(0?[1-9]))
日期(月/日/年)	((1[0-2])\|(0?[1-9]))/(([12][0-9])\|(3[01])\|(0?[1-9]))/(\d{4}\|\d{2})
時(shí)間(小時(shí):分鐘, 24小時(shí)制)	((1\|0?)[0-9]\|2[0-3]):([0-5][0-9])
漢字(字符)	[\u4e00-\u9fa5]
中文及全角標(biāo)點(diǎn)符號(hào)(字符)	[\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
中國大陸固定電話號(hào)碼	(\d{4}-\|\d{3}-)?(\d{8}\|\d{7})
中國大陸手機(jī)號(hào)碼	1\d{10}
中國大陸郵政編碼	[1-9]\d{5}
中國大陸身份證號(hào)(15位或18位)	\d{15}(\d\d[0-9xX])?
非負(fù)整數(shù)(正整數(shù)或零)	\d+
正整數(shù)	[0-9][1-9][0-9]
負(fù)整數(shù)	-[0-9][1-9][0-9]
整數(shù)	-?\d+
小數(shù)	(-?\d+)(\.\d+)?
不包含abc的單詞	\b((?!abc)\w)+\b

以上正則表達(dá)式均經(jīng)過多次測試，并不斷增加,因?yàn)椴煌绦蚧蚬ぞ叩恼齽t表達(dá)式略有區(qū)別，大家可以根據(jù)需要進(jìn)行簡單修改常用正則表達(dá)式正則表達(dá)式用于字符串處理、表單驗(yàn)證等場合，實(shí)用高效?，F(xiàn)將一些常用的表達(dá)式收集于此，以備不時(shí)之需。

說明	正則表達(dá)式
用戶名	/^[a-z0-9_-]{3,16}$/
密碼	/^[a-z0-9_-]{6,18}$/
十六進(jìn)制值	/^#?([a-f0-9]{6}\|[a-f0-9]{3})$/
電子郵箱	/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/
URL	/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-])\/?$/
IP 地址	/^(?:(?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)$/
HTML 標(biāo)簽	/^<([a-z]+)([^<]+)(?:>(.)<\/\1>\|\s+\/>)$/
Unicode編碼中的漢字范圍	/^[u4e00-u9fa5],{0,}$/
匹配中文字符的正則表達(dá)式	[\u4e00-\u9fa5]
評(píng)注：匹配中文還真是個(gè)頭疼的事，有了這個(gè)表達(dá)式就好辦了
匹配雙字節(jié)字符(包括漢字在內(nèi))	[^\x00-\xff]
評(píng)注：可以用來計(jì)算字符串的長度（一個(gè)雙字節(jié)字符長度計(jì)2，ASCII字符計(jì)1）
匹配空白行的正則表達(dá)式	\n\s*\r
評(píng)注：可以用來刪除空白行
匹配HTML標(biāo)記的正則表達(dá)式	<(\S?)[^>]>.?</\1>\|<.? />
評(píng)注：網(wǎng)上流傳的版本太糟糕，上面這個(gè)也僅僅能匹配部分，對(duì)于復(fù)雜的嵌套標(biāo)記依舊無能為力
匹配首尾空白字符的正則表達(dá)式	^\s\|\s$
評(píng)注：可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等)，非常有用的表達(dá)式
匹配Email地址的正則表達(dá)式	\w+([-+.]\w+)@\w+([-.]\w+)\.\w+([-.]\w+)*
評(píng)注：表單驗(yàn)證時(shí)很實(shí)用
匹配網(wǎng)址URL的正則表達(dá)式	[a-zA-z]+://[^\s]*
評(píng)注：網(wǎng)上流傳的版本功能很有限，上面這個(gè)基本可以滿足需求
匹配帳號(hào)是否合法(字母開頭，允許5-16字節(jié)，允許字母數(shù)字下劃線)	^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評(píng)注：表單驗(yàn)證時(shí)很實(shí)用
匹配國內(nèi)電話號(hào)碼	\d{3}-\d{8}\|\d{4}-\d{7}
評(píng)注：匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號(hào)	[1-9][0-9]{4,}
評(píng)注：騰訊QQ號(hào)從10000開始
匹配中國大陸郵政編碼	[1-9]\d{5}(?!\d)
評(píng)注：中國大陸郵政編碼為6位數(shù)字
匹配身份證	\d{15}\|\d{18}
評(píng)注：中國大陸的身份證為15位或18位
匹配ip地址	\d+\.\d+\.\d+\.\d+
評(píng)注：提取ip地址時(shí)有用
匹配特定數(shù)字：
^[1-9]\d*$	//匹配正整數(shù)
^-[1-9]\d*$	//匹配負(fù)整數(shù)
^-?[1-9]\d*$	//匹配整數(shù)
^[1-9]\d*\|0$	//匹配非負(fù)整數(shù)（正整數(shù) + 0）
^-[1-9]\d*\|0$	//匹配非正整數(shù)（負(fù)整數(shù) + 0）
^[1-9]\d\.\d\|0\.\d[1-9]\d$	//匹配正浮點(diǎn)數(shù)
^-([1-9]\d\.\d\|0\.\d[1-9]\d)$	//匹配負(fù)浮點(diǎn)數(shù)
^-?([1-9]\d\.\d\|0\.\d[1-9]\d\|0?\.0+\|0)$	//匹配浮點(diǎn)數(shù)
^[1-9]\d\.\d\|0\.\d[1-9]\d\|0?\.0+\|0$	//匹配非負(fù)浮點(diǎn)數(shù)（正浮點(diǎn)數(shù) + 0）
^(-([1-9]\d\.\d\|0\.\d[1-9]\d))\|0?\.0+\|0$	//匹配非正浮點(diǎn)數(shù)（負(fù)浮點(diǎn)數(shù) + 0）
評(píng)注：處理大量數(shù)據(jù)時(shí)有用，具體應(yīng)用時(shí)注意修正
匹配特定字符串
^[A-Za-z]+$	//匹配由26個(gè)英文字母組成的字符串
^[A-Z]+$	//匹配由26個(gè)英文字母的大寫組成的字符串
^[a-z]+$	//匹配由26個(gè)英文字母的小寫組成的字符串
^[A-Za-z0-9]+$	//匹配由數(shù)字和26個(gè)英文字母組成的字符串
^\w+$	//匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串

表達(dá)式全集正則表達(dá)式有多種不同的風(fēng)格。下表是在PCRE中元字符及其在正則表達(dá)式上下文中的行為的一個(gè)完整列表：

字符	描述
\	將下一個(gè)字符標(biāo)記為一個(gè)特殊字符、或一個(gè)原義字符、或一個(gè)向后引用、或一個(gè)八進(jìn)制轉(zhuǎn)義符。例如，“n”匹配字符“n”?！癨n”匹配一個(gè)換行符。序列“\\”匹配“\”而“\(”則匹配“(”。
^	匹配輸入字符串的開始位置。如果設(shè)置了RegExp對(duì)象的Multiline屬性，^也匹配“\n”或“\r”之后的位置。
$	匹配輸入字符串的結(jié)束位置。如果設(shè)置了RegExp對(duì)象的Multiline屬性，$也匹配“\n”或“\r”之前的位置。
*	匹配前面的子表達(dá)式零次或多次。例如，zo能匹配“z”以及“zoo”。等價(jià)于{0,}。
+	匹配前面的子表達(dá)式一次或多次。例如，“zo+”能匹配“zo”以及“zoo”，但不能匹配“z”。+等價(jià)于{1,}。
?	匹配前面的子表達(dá)式零次或一次。例如，“do(es)?”可以匹配“do”或“does”中的“do”。?等價(jià)于{0,1}。
{n}	n是一個(gè)非負(fù)整數(shù)。匹配確定的n次。例如，“o{2}”不能匹配“Bob”中的“o”，但是能匹配“food”中的兩個(gè)o。
{n,}	n是一個(gè)非負(fù)整數(shù)。至少匹配n次。例如，“o{2,}”不能匹配“Bob”中的“o”，但能匹配“foooood”中的所有o?！皁{1,}”等價(jià)于“o+”?！皁{0,}”則等價(jià)于“o*”。
{n,m}	m和n均為非負(fù)整數(shù)，其中n<=m。最少匹配n次且最多匹配m次。例如，“o{1,3}”將匹配“fooooood”中的前三個(gè)o。“o{0,1}”等價(jià)于“o?”。請(qǐng)注意在逗號(hào)和兩個(gè)數(shù)之間不能有空格。
?	當(dāng)該字符緊跟在任何一個(gè)其他限制符（*,+,?，{n}，{n,}，{n,m}）后面時(shí)，匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串，而默認(rèn)的貪婪模式則盡可能多的匹配所搜索的字符串。例如，對(duì)于字符串“oooo”，“o+?”將匹配單個(gè)“o”，而“o+”將匹配所有“o”。
.	匹配除“\n”之外的任何單個(gè)字符。要匹配包括“\n”在內(nèi)的任何字符，請(qǐng)使用像“[.\n]”的模式。
(pattern)	匹配pattern并獲取這一匹配。所獲取的匹配可以從產(chǎn)生的Matches集合得到，在VBScript中使用SubMatches集合，在JScript中則使用$0…$9屬性。要匹配圓括號(hào)字符，請(qǐng)使用“$”或“$”。
(?:pattern)	匹配pattern但不獲取匹配結(jié)果，也就是說這是一個(gè)非獲取匹配，不進(jìn)行存儲(chǔ)供以后使用。這在使用或字符“(\|)”來組合一個(gè)模式的各個(gè)部分是很有用。例如“industr(?:y\|ies)”就是一個(gè)比“industry\|industries”更簡略的表達(dá)式。
(?=pattern)	正向預(yù)查，在任何匹配pattern的字符串開始處匹配查找字符串。這是一個(gè)非獲取匹配，也就是說，該匹配不需要獲取供以后使用。例如，“Windows(?=95\|98\|NT\|2000)”能匹配“Windows2000”中的“Windows”，但不能匹配“Windows3.1”中的“Windows”。預(yù)查不消耗字符，也就是說，在一個(gè)匹配發(fā)生后，在最后一次匹配之后立即開始下一次匹配的搜索，而不是從包含預(yù)查的字符之后開始。
(?!pattern)	負(fù)向預(yù)查，在任何不匹配pattern的字符串開始處匹配查找字符串。這是一個(gè)非獲取匹配，也就是說，該匹配不需要獲取供以后使用。例如“Windows(?!95\|98\|NT\|2000)”能匹配“Windows3.1”中的“Windows”，但不能匹配“Windows2000”中的“Windows”。預(yù)查不消耗字符，也就是說，在一個(gè)匹配發(fā)生后，在最后一次匹配之后立即開始下一次匹配的搜索，而不是從包含預(yù)查的字符之后開始
x\|y	匹配x或y。例如，“z\|food”能匹配“z”或“food”?！?z\|f)ood”則匹配“zood”或“food”。
[xyz]	字符集合。匹配所包含的任意一個(gè)字符。例如，“[abc]”可以匹配“plain”中的“a”。
[^xyz]	負(fù)值字符集合。匹配未包含的任意字符。例如，“[^abc]”可以匹配“plain”中的“p”。
[a-z]	字符范圍。匹配指定范圍內(nèi)的任意字符。例如，“[a-z]”可以匹配“a”到“z”范圍內(nèi)的任意小寫字母字符。
[^a-z]	負(fù)值字符范圍。匹配任何不在指定范圍內(nèi)的任意字符。例如，“[^a-z]”可以匹配任何不在“a”到“z”范圍內(nèi)的任意字符。
\b	匹配一個(gè)單詞邊界，也就是指單詞和空格間的位置。例如，“er\b”可以匹配“never”中的“er”，但不能匹配“verb”中的“er”。
\B	匹配非單詞邊界。“er\B”能匹配“verb”中的“er”，但不能匹配“never”中的“er”。
\cx	匹配由x指明的控制字符。例如，\cM匹配一個(gè)Control-M或回車符。x的值必須為A-Z或a-z之一。否則，將c視為一個(gè)原義的“c”字符。
\d	匹配一個(gè)數(shù)字字符。等價(jià)于[0-9]。
\D	匹配一個(gè)非數(shù)字字符。等價(jià)于[^0-9]。
\f	匹配一個(gè)換頁符。等價(jià)于\x0c和\cL。
\n	匹配一個(gè)換行符。等價(jià)于\x0a和\cJ。
\r	匹配一個(gè)回車符。等價(jià)于\x0d和\cM。
\s	匹配任何空白字符，包括空格、制表符、換頁符等等。等價(jià)于[\f\n\r\t\v]。
\S	匹配任何非空白字符。等價(jià)于[^\f\n\r\t\v]。
\t	匹配一個(gè)制表符。等價(jià)于\x09和\cI。
\v	匹配一個(gè)垂直制表符。等價(jià)于\x0b和\cK。
\w	匹配包括下劃線的任何單詞字符。等價(jià)于“[A-Za-z0-9_]”。
\W	匹配任何非單詞字符。等價(jià)于“[^A-Za-z0-9_]”。
\xn	匹配n，其中n為十六進(jìn)制轉(zhuǎn)義值。十六進(jìn)制轉(zhuǎn)義值必須為確定的兩個(gè)數(shù)字長。例如，“\x41”匹配“A”。“\x041”則等價(jià)于“\x04&1”。正則表達(dá)式中可以使用ASCII編碼。.
\num	匹配num，其中num是一個(gè)正整數(shù)。對(duì)所獲取的匹配的引用。例如，“(.)\1”匹配兩個(gè)連續(xù)的相同字符。
\n	標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)向后引用。如果\n之前至少n個(gè)獲取的子表達(dá)式，則n為向后引用。否則，如果n為八進(jìn)制數(shù)字（0-7），則n為一個(gè)八進(jìn)制轉(zhuǎn)義值。
\nm	標(biāo)識(shí)一個(gè)八進(jìn)制轉(zhuǎn)義值或一個(gè)向后引用。如果\nm之前至少有nm個(gè)獲得子表達(dá)式，則nm為向后引用。如果\nm之前至少有n個(gè)獲取，則n為一個(gè)后跟文字m的向后引用。如果前面的條件都不滿足，若n和m均為八進(jìn)制數(shù)字（0-7），則\nm將匹配八進(jìn)制轉(zhuǎn)義值nm。
\nml	如果n為八進(jìn)制數(shù)字（0-3），且m和l均為八進(jìn)制數(shù)字（0-7），則匹配八進(jìn)制轉(zhuǎn)義值nml。
\un	匹配n，其中n是一個(gè)用四個(gè)十六進(jìn)制數(shù)字表示的Unicode字符。例如，\u00A9匹配版權(quán)符號(hào)（?）。

以下是以PHP的語法所寫的示例驗(yàn)證字符串是否只含數(shù)字與英文，字符串長度并在4~16個(gè)字符之間?<?php$str = 'a1234';if (preg_match("^[a-zA-Z0-9]{4,16}$", $str)) {echo "驗(yàn)證成功";} else {echo "驗(yàn)證失敗";}?>簡易的臺(tái)灣身份證字號(hào)驗(yàn)證<?php$str = 'a1234';if (preg_match("/^\w[12]\d{8}$/", $str)) {echo "驗(yàn)證成功";} else {echo "驗(yàn)證失敗";}?>以下示例是用 Perl 語言寫的，與上面的示例功能相同?print $str = "a1234" =~ m:^[a-zA-Z0-9]{4,16}$: ? "COMFIRM" : "FAILED";print $str = "a1234" =~ m"^\w[12]\d{8}$" ? "COMFIRM" : "INVAILD";Validated XHTML 1.0 Strict?Validated CSS 2.1如何寫出高效率的正則表達(dá)式如果純粹是為了挑戰(zhàn)自己的正則水平，用來實(shí)現(xiàn)一些特效（例如使用正則表達(dá)式計(jì)算質(zhì)數(shù)、解線性方程），效率不是問題；如果所寫的正則表達(dá)式只是為了滿足一兩次、幾十次的運(yùn)行，優(yōu)化與否區(qū)別也不太大。但是，如果所寫的正則表達(dá)式會(huì)百萬次、千萬次地運(yùn)行，效率就是很大的問題了。我這里總結(jié)了幾條提升正則表達(dá)式運(yùn)行效率的經(jīng)驗(yàn)（工作中學(xué)到的，看書學(xué)來的，自己的體會(huì)），貼在這里。如果您有其它的經(jīng)驗(yàn)而這里沒有提及，歡迎賜教。為行文方便，先定義兩個(gè)概念。誤匹配：指正則表達(dá)式所匹配的內(nèi)容范圍超出了所需要范圍，有些文本明明不符合要求，但是被所寫的正則式“擊中了”。例如，如果使用\d{11}來匹配11位的手機(jī)號(hào)，\d{11}不單能匹配正確的手機(jī)號(hào)，它還會(huì)匹配98765432100這樣的明顯不是手機(jī)號(hào)的字符串。我們把這樣的匹配稱之為誤匹配。漏匹配：指正則表達(dá)式所匹配的內(nèi)容所規(guī)定的范圍太狹窄，有些文本確實(shí)是所需要的，但是所寫的正則沒有將這種情況囊括在內(nèi)。例如，使用\d{18}來匹配18位的身份證號(hào)碼，就會(huì)漏掉結(jié)尾是字母X的情況。寫出一條正則表達(dá)式，既可能只出現(xiàn)誤匹配（條件寫得極寬松，其范圍大于目標(biāo)文本），也可能只出現(xiàn)漏匹配（只描述了目標(biāo)文本中多種情況種的一種），還可能既有誤匹配又有漏匹配。例如，使用\w+\.com來匹配.com結(jié)尾的域名，既會(huì)誤匹配abc_.com這樣的字串（合法的域名中不含下劃線，\w包含了下劃線這種情況），又會(huì)漏掉ab-c.com這樣的域名（合法域名中可以含中劃線，但是\w不匹配中劃線）。精準(zhǔn)的正則表達(dá)式意味著既無誤匹配且無漏匹配。當(dāng)然，現(xiàn)實(shí)中存在這樣的情況：只能看到有限數(shù)量的文本，根據(jù)這些文本寫規(guī)則，但是這些規(guī)則將會(huì)用到海量的文本中。這種情況下，盡可能地（如果不是完全地）消除誤匹配以及漏匹配，并提升運(yùn)行效率，就是我們的目標(biāo)。本文所提出的經(jīng)驗(yàn)，主要是針對(duì)這種情況。掌握語法細(xì)節(jié)。正則表達(dá)式在各種語言中，其語法大致相同，細(xì)節(jié)各有千秋。明確所使用語言的正則的語法的細(xì)節(jié)，是寫出正確、高效正則表達(dá)式的基礎(chǔ)。例如，perl中與\w等效的匹配范圍是[a-zA-Z0-9_]；perl正則式不支持肯定逆序環(huán)視中使用可變的重復(fù)（variable repetition inside lookbehind，例如(?<=.*)abc），但是.Net語法是支持這一特性的；又如，JavaScript連逆序環(huán)視（Lookbehind,如(?<=ab)c）都不支持，而perl和python是支持的?！毒ㄕ齽t表達(dá)式》第3章《正則表達(dá)式的特性和流派概覽》明確地列出了各大派系正則的異同，這篇文章也簡要地列出了幾種常用語言、工具中正則的比較。對(duì)于具體使用者而言，至少應(yīng)該詳細(xì)了解正在使用的那種工作語言里正則的語法細(xì)節(jié)。先粗后精，先加后減。使用正則表達(dá)式語法對(duì)于目標(biāo)文本進(jìn)行描述和界定，可以像畫素描一樣，先大致勾勒出框架，再逐步在局步實(shí)現(xiàn)細(xì)節(jié)。仍舉剛才的手機(jī)號(hào)的例子，先界定\d{11}，總不會(huì)錯(cuò)；再細(xì)化為1[358]\d{9}，就向前邁了一大步（至于第二位是不是3、5、8，這里無意深究，只舉這樣一個(gè)例子，說明逐步細(xì)化的過程）。這樣做的目的是先消除漏匹配（剛開始先盡可能多地匹配，做加法），然后再一點(diǎn)一點(diǎn)地消除誤匹配（做減法）。這樣有先有后，在考慮時(shí)才不易出錯(cuò)，從而向“不誤不漏”這個(gè)目標(biāo)邁進(jìn)。留有余地。所能看到的文本sample是有限的，而待匹配檢驗(yàn)的文本是海量的，暫時(shí)不可見的。對(duì)于這樣的情況，在寫正則表達(dá)式時(shí)要跳出所能見到的文本的圈子，開拓思路，作出“戰(zhàn)略性前瞻”。例如，經(jīng)常收到這樣的垃圾短信：“發(fā)*票”、“發(fā)#漂”。如果要寫規(guī)則屏蔽這樣煩人的垃圾短信，不但要能寫出可以匹配當(dāng)前文本的正則表達(dá)式發(fā)[*#](?:票|漂)，還要能夠想到發(fā).(?:票|漂|飄)之類可能出現(xiàn)的“變種”。這在具體的領(lǐng)域或許會(huì)有針對(duì)性的規(guī)則，不多言。這樣做的目的是消除漏匹配，延長正則表達(dá)式的生命周期。明確。具體說來，就是謹(jǐn)慎用點(diǎn)號(hào)這樣的元字符，盡可能不用星號(hào)和加號(hào)這樣的任意量詞。只要能確定范圍的，例如\w，就不要用點(diǎn)號(hào)；只要能夠預(yù)測重復(fù)次數(shù)的，就不要用任意量詞。例如，寫析取twitter消息的腳本，假設(shè)一條消息的xml正文部分結(jié)構(gòu)是…且正文中無尖括號(hào)，那么[^<]{1,480}這種寫法的思路要好于.*，原因有二：一是使用[^<]，它保證了文本的范圍不會(huì)超出下一個(gè)小于號(hào)所在的位置；二是明確長度范圍，{1,480}，其依據(jù)是一條twitter消息大致能的字符長度范圍。當(dāng)然，480這個(gè)長度是否正確還可推敲，但是這種思路是值得借鑒的。說得狠一點(diǎn)，“濫用點(diǎn)號(hào)、星號(hào)和加號(hào)是不環(huán)保、不負(fù)責(zé)任的做法”。不要讓稻草壓死駱駝。每使用一個(gè)普通括號(hào)()而不是非捕獲型括號(hào)(?:…)，就會(huì)保留一部分內(nèi)存等著你再次訪問。這樣的正則表達(dá)式、無限次地運(yùn)行次數(shù)，無異于一根根稻草的堆加，終于能將駱駝壓死。養(yǎng)成合理使用(?:…)括號(hào)的習(xí)慣。寧簡勿繁。將一條復(fù)雜的正則表達(dá)式拆分為兩條或多條簡單的正則表達(dá)式，編程難度會(huì)降低，運(yùn)行效率會(huì)提升。例如用來消除行首和行尾空白字符的正則表達(dá)式s/^\s+|\s+$//g;，其運(yùn)行效率理論上要低于s/^\s+//g; s/\s+$//g; 。這個(gè)例子出自《精通正則表達(dá)式》第五章，書中對(duì)它的評(píng)論是“它幾乎總是最快的，而且顯然最容易理解”。既快又容易理解，何樂而不為？工作中我們還有其它的理由要將C==(A|B)這樣的正則表達(dá)式拆為A和B兩條表達(dá)式分別執(zhí)行。例如，雖然A和B這兩種情況只要有一種能夠擊中所需要的文本模式就會(huì)成功匹配，但是如果只要有一條子表達(dá)式（例如A）會(huì)產(chǎn)生誤匹配，那么不論其它的子表達(dá)式（例如B）效率如何之高，范圍如何精準(zhǔn)，C的總體精準(zhǔn)度也會(huì)因A而受到影響。巧妙定位。有時(shí)候，我們需要匹配的the，是作為單詞的the（兩邊有空格），而不是作為單詞一部分的t-h-e的有序排列（例如together中的the）。在適當(dāng)?shù)臅r(shí)候用上^，$，\b等等定位錨點(diǎn)，能有效提升找到成功匹配、淘汰不成功匹配的效率。

轉(zhuǎn)載于:https://www.cnblogs.com/elesos/p/6840471.html

總結(jié)

以上是生活随笔為你收集整理的注册用户名非法关键字限制的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Windows热键注册原理
下一篇： PTA---换硬币 (20 分)

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

注册 用户名 非法关键字限制

總結(jié)

注册用户名非法关键字限制