當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

正则表达式匹配（动规）

發布時間：2023/12/13 编程问答 28 豆豆

生活随笔收集整理的這篇文章主要介紹了正则表达式匹配（动规）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

題目
思路
- 轉移方程
- 特征
- 再探 i 和 j
代碼

題目

請實現一個函數用來匹配包含 . 和 * 的正則表達式。模式中的字符 . 表示任意一個字符，而 * 表示它前面的字符可以出現任意次（含0次）。在本題中，匹配是指字符串的所有字符匹配整個模式。例如，字符串 aaa 與模式 a.a 和 ab*ac*a 匹配，但與 aa.a 和 ab*a 均不匹配。

來源：力扣（LeetCode）

思路

再一次膜拜大佬作者：jyd
本文基于大佬的思路做自己的細節解析。

其實動規的難點一直在于“找規律”。（恐怕這也是所有算法題的難點，哈哈）

本題其實就是在考察程序員思考問題的全面性。

轉移方程

先建立這道題的轉移方程：

用 f[i][j] 代表 s 的前 i 個和 p 的前 j 個能否匹配。

當正則表達式中為正常字符和 . 時，問題是很好解決的：

f[i][j]=f[i?1][j?1]

前 i 個 s 和前 j 個 p 是否匹配還要看前 i-1 個 s 和前 j-1 個 p 是否匹配。

難點就在于是字符 + * 時該怎么處理：

分為將字符看成出現0次（也就是不看這兩位）和出現多次（看這個組合）：

不看：直接砍掉正則串的后面兩個， f[i][j] = f[i][j-2]
看：正則串不動，主串前移一個，f[i][j] = f[i-1][j]

上面兩點，大部分題解已經說的很明白了，但其實又很抽象。我們不妨用例子來看一下：

第一種比較好理解 —— f[i][j] = f[i][j-2]

s=abcd
p=abcde*

將主串的最后一位視為 i（a），正則串最后一位視為 j（*）。顯而易見兩個字符串是完全匹配的。只需要 * 前面的 e（j-1）出現0次就可（正則串里面的 d 就是 j-2）。

第二種理解起來可能有點抽象 —— f[i][j] = f[i-1][j]

s=abccc
p=abc*

此時 i為c 、j為*，因為 *前面的字符可以出現多次，也就是出現1次的遞歸操作。因此此時我們做的操作就是：

已經知道了 i 是 j（也就是*前的字符），那么再試著看看 i-1 還是不是 j。

也就是原本相互匹配的字符我們不看了（都做-1操作），i 和 j 彼此是匹配的，理應再看 i-1 和 j-1，但是我們想要 j 多出現幾次，因此 j-1 的操作沒有執行。這就是下圖中，jyd大佬所說的 p[j-2]多出現1次。

圖中總說 s[i-1] p[j-1] 為什么不是直接用 s[i] p[j] 呢？這個問題講完初始化dp數組首行我們再細說。

特征

弄懂了主要的驗證是否匹配的操作，接下來我們需要弄懂一些特例：

首先明晰一點：正則串和主串都是可以為空串的。

空主串和空正則是匹配的。
非空串和空正則必不匹配。
空主串和非空正則，不能直接判定匹配與否。
非空串和非空正則，那肯定是需要計算的了。

我們可以根據上面的特征，來初始化dp二維數組。

行代表s，列代表p，dp[0][j] 代表s為空，dp[i][0]代表p為空。

第四點其實就是我們的轉移方程。因此我們來詳解一下第三點：

當s= '' '' 時，p=a*b*c* 和 p=ab* 前者可以做到和空主串完美匹配，后者卻不行。因此我們可以得出以下規律：

因此可以得到初始化dp首行的代碼（首列無需做多余更改，空正則除了匹配空主串，其余皆不匹配）：

// 初始化dp首行 dp[0][0] = 1; for(size_t i = 2; i < cols; i += 2){dp[0][i] = dp[0][i-2] && p[i-1] =='*'; }

再探 i 和 j

我讀完大佬寫的題解的時候其實還是很懵懂的，真正豁然開朗是看了大佬的圖解。大佬做圖解一直有一手的~

下面結合圖解來講一下我們遺留的問題，dp[i][j] 和與之相對應的 s[i-1] p[j-1]。

我們借用一下大佬的圖來看一下：

我們會發現，前面提到：

第一行，也就是下標為0的那行，代表 s 為空串
第一列，也就是下標為0的那列，代表 p 為空串

我們是從第二行（下標為1的行）和第二列（下標為1的列）開始保存 s 和 p 的非空部分的。

因此，舉個具體的例子：dp[1][1]其邏輯含義是，保存的值表示前1個s 和前1個p 是否匹配。在物理上代表 s[0] 和 p[0] 組成的點。因此我們也就不難理解大佬圖解中頻繁出現的 dp[i][j] 和 s[i-1] p[j-1] 之間的關系了。

代碼

class Solution { public:bool isMatch(string s, string p) {int rows = s.size()+1;int cols = p.size()+1;vector<vector<int>> dp(rows, vector<int>(cols, 0));// 初始化dp首行dp[0][0] = 1;for(size_t i = 2; i < cols; i += 2){dp[0][i] = dp[0][i-2] && p[i-1] =='*';}// 動規for(size_t i = 1; i < rows; i++){for(size_t j = 1; j < cols; j++){if(p[j-1] != '*'){if(dp[i-1][j-1] && (s[i-1]==p[j-1] || p[j-1] == '.')){dp[i][j] = 1;}}else{if(dp[i][j-2] || (dp[i-1][j] && (s[i-1] == p[j-2] || p[j-2] == '.'))){dp[i][j] = 1;}}}}return dp[rows-1][cols-1];} };

總結

以上是生活随笔為你收集整理的正则表达式匹配（动规）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

正则表达式

上一篇：二维数组的查找
下一篇： oracle推送短信,ORACLE 10