MySQL 正则表达式查询
MySQL中正式表達式通常被用來檢索或替換符合某個模式的文本內容,根據指定的匹配模式匹配文中符合要求的特殊字符串。
例如,從一個文件中提取電話號碼,查找一篇文章中重復的單詞或替換用戶輸入的敏感語匯等,這些地方都可以使用正則表達式。正則表達式強大而且靈活,常用于復雜的查詢。
MySQL 中使用 REGEXP 關鍵字指定正則表達式的字符匹配模式,下表列出了 REGEXP 操作符中常用的匹配列表。
查詢以特定字符或字符串開頭的記錄
字符“^”匹配以特定字符或者字符串開頭的文本。
在 tb_departments 表中,查詢 dept_name 字段以字母“C”開頭的記錄,輸入的 SQL 語句如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP '^C';在 tb_departments 表中,查詢 dept_name 字段以“Ch”開頭的記錄,輸入的 SQL 語句如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP '^Ch';查詢以特定字符或字符串結尾的記錄
字符“$”匹配以特定字符或者字符串結尾的文本。
在 tb_departments 表中,查詢 dept_name 字段以字母“y”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP 'y$'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 4 | Economy | 44444 | B | | 5 | History | 55555 | B | +---------+-----------+-----------+-----------+ 2 rows in set (0.00 sec)在 tb_departments 表中有兩條記錄的 dept_name 字段值是以字母 y 結尾的,返回結果有 2 條記錄。
在 tb_departments 表中,查詢 dept_name 字段以“my”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP 'my$'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 4 | Economy | 44444 | B | +---------+-----------+-----------+-----------+ 1 row in set (0.00 sec)只有 Economy 是以“my”結尾的,所以查詢結果中只有 1 條記錄。
用符號“.”代替字符串中的任意一個字符
在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”與字母“y”,且兩個字母之間只有一個字母的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP 'o.y'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 4 | Economy | 44444 | B | | 5 | History | 55555 | B | +---------+-----------+-----------+-----------+ 2 rows in set (0.00 sec)查詢語句中“o.y”指定匹配字符中要有字母 o 和 y,且兩個字母之間包含單個字符,并不限定匹配的字符的位置和所在查詢字符串的總長度,因此 Economy 和 History 都符合匹配條件。
使用“*”和“+”來匹配多個字符
星號“*”匹配前面的字符任意多次,包括 0 次。加號“+”匹配前面的字符至少一次。
在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP '^Ch*'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 1 | Computer | 11111 | A | | 3 | Chinese | 33333 | B | +---------+-----------+-----------+-----------+ 2 rows in set (0.00 sec)星號“*”可以匹配任意多個字符,Computer 中字母 C 后面并沒有出現字母 h,但是也滿足匹配條件。
在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”至少一次的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP '^Ch+'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 3 | Chinese | 33333 | B | +---------+-----------+-----------+-----------+ 1 row in set (0.00 sec)“h+”匹配字母“h”至少一次,只有 Chinese 滿足匹配條件。
匹配指定字符串
正則表達式可以匹配指定字符串,只要這個字符串在查詢文本中即可,若要匹配多個字符串,則多個字符串之間使用分隔符“|”隔開。
在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP 'in'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 3 | Chinese | 33333 | B | +---------+-----------+-----------+-----------+ 1 row in set (0.00 sec)可以看到,dept_name 字段的 Chinese 中包含字符串“in”,滿足匹配條件。
在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”或者“on”的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP 'in|on'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 3 | Chinese | 33333 | B | | 4 | Economy | 44444 | B | +---------+-----------+-----------+-----------+ 2 rows in set (0.00 sec)可以看到,dept_name 字段的 Chinese 中包含字符串“in”,Economy 中包含字符串“on”,滿足匹配條件。
提示:LIKE 運算符也可以匹配指定的字符串,但與 REGEXP 不同,LIKE 匹配的字符串如果在文本中間出現,就找不到它,相應的行也不會返回。而 REGEXP 在文本內進行匹配,如果被匹配的字符串在文本中出現,REGEXP 將會找到它,相應的行也會被返回。
匹配指定字符串中的任意一個
方括號“[]”指定一個字符集合,只匹配其中任何一個字符,即為所查找的文本。
在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”或者“e”的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP '[io]'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 1 | Computer | 11111 | A | | 3 | Chinese | 33333 | B | | 4 | Economy | 44444 | B | | 5 | History | 55555 | B | +---------+-----------+-----------+-----------+ 4 rows in set (0.00 sec)從查詢結果可以看到,所有返回的記錄的 dept_name 字段的值中都包含字母 o 或者 e,或者兩個都有。
方括號“[]”還可以指定數值集合。
在 tb_departments 表中,查詢 dept_call 字段值中包含 1、2 或者 3 的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_call REGEXP '[123]'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 1 | Computer | 11111 | A | | 2 | Math | 22222 | A | | 3 | Chinese | 33333 | B | +---------+-----------+-----------+-----------+ 3 rows in set (0.00 sec)查詢結果中,dept_call 字段值中有 1、2、3 三個數字中的一個即為匹配記錄字段。
匹配集合“[123]”也可以寫成“[1-3]”,即指定集合區間。例如,“[a-z]”表示集合區間為a~z的字母,“[0-9]”表示集合區間為所有數字。
匹配指定字符以外的字符
“[^字符集合]”匹配不在指定集合中的任何字符。
在 tb_departments 表中,查詢 dept_name 字段值包含字母 a~t 以外的字符的記錄,輸入的 SQL 語句和執行結果如下所示。
mysql> SELECT * FROM tb_departments-> WHERE dept_name REGEXP '[^a-t]'; +---------+-----------+-----------+-----------+ | dept_id | dept_name | dept_call | dept_type | +---------+-----------+-----------+-----------+ | 1 | Computer | 11111 | A | | 4 | Economy | 44444 | B | | 5 | History | 55555 | B | +---------+-----------+-----------+-----------+ 3 rows in set (0.00 sec)返回記錄中的 dept_name 字段值中包含了指定字母和數字以外的值,如 u、y 等,這些字母均不在 a~t 中,滿足匹配條件。
總結
以上是生活随笔為你收集整理的MySQL 正则表达式查询的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C++ 文本文件的读取和写入
- 下一篇: Redis和数据库的结合