正则表达式匹配(动规)
文章目錄
- 題目
- 思路
- 轉(zhuǎn)移方程
- 特征
- 再探 i 和 j
- 代碼
題目
請實(shí)現(xiàn)一個(gè)函數(shù)用來匹配包含 . 和 * 的正則表達(dá)式。模式中的字符 . 表示任意一個(gè)字符,而 * 表示它前面的字符可以出現(xiàn)任意次(含0次)。在本題中,匹配是指字符串的所有字符匹配整個(gè)模式。例如,字符串 aaa 與模式 a.a 和 ab*ac*a 匹配,但與 aa.a 和 ab*a 均不匹配。
來源:力扣(LeetCode)
思路
再一次膜拜大佬 作者:jyd
本文基于大佬的思路做自己的細(xì)節(jié)解析。
其實(shí)動規(guī)的難點(diǎn)一直在于“找規(guī)律”。(恐怕這也是所有算法題的難點(diǎn),哈哈)
本題其實(shí)就是在考察程序員思考問題的全面性。
轉(zhuǎn)移方程
先建立這道題的轉(zhuǎn)移方程:
用 f[i][j] 代表 s 的前 i 個(gè)和 p 的前 j 個(gè)能否匹配。
當(dāng)正則表達(dá)式中為 正常字符 和 . 時(shí),問題是很好解決的:
f[i][j]=f[i?1][j?1]前 i 個(gè) s 和 前 j 個(gè) p 是否匹配還要看 前 i-1 個(gè) s 和 前 j-1 個(gè) p 是否匹配。
難點(diǎn)就在于是 字符 + * 時(shí)該怎么處理:
分為將字符看成 出現(xiàn)0次(也就是不看這兩位)和 出現(xiàn)多次(看這個(gè)組合):
- 不看:直接砍掉正則串的后面兩個(gè), f[i][j] = f[i][j-2]
- 看:正則串不動,主串前移一個(gè),f[i][j] = f[i-1][j]
上面兩點(diǎn),大部分題解已經(jīng)說的很明白了,但其實(shí)又很抽象。我們不妨用例子來看一下:
- 第一種比較好理解 —— f[i][j] = f[i][j-2]
s=abcd
p=abcde*
將主串的最后一位視為 i(a),正則串最后一位視為 j(*)。顯而易見兩個(gè)字符串是完全匹配的。只需要 * 前面的 e(j-1) 出現(xiàn)0次就可(正則串里面的 d 就是 j-2)。
- 第二種理解起來可能有點(diǎn)抽象 —— f[i][j] = f[i-1][j]
s=abccc
p=abc*
此時(shí) i為c 、j為*,因?yàn)?*前面的字符 可以 出現(xiàn)多次,也就是出現(xiàn)1次的遞歸操作。因此此時(shí)我們做的操作就是:
- 已經(jīng)知道了 i 是 j(也就是*前的字符) ,那么再試著看看 i-1 還是不是 j。
也就是原本相互匹配的字符我們不看了(都做-1操作),i 和 j 彼此是匹配的,理應(yīng)再看 i-1 和 j-1,但是我們想要 j 多出現(xiàn)幾次,因此 j-1 的操作沒有執(zhí)行。這就是下圖中,jyd大佬所說的 p[j-2]多出現(xiàn)1次。
圖中總說 s[i-1] p[j-1] 為什么不是直接用 s[i] p[j] 呢?這個(gè)問題講完初始化dp數(shù)組首行我們再細(xì)說。
特征
弄懂了主要的驗(yàn)證是否匹配的操作,接下來我們需要弄懂一些特例:
首先明晰一點(diǎn):正則串和主串都是可以為空串的。
- 空主串和空正則是匹配的。
- 非空串和空正則必不匹配。
- 空主串和非空正則,不能直接判定匹配與否。
- 非空串和非空正則,那肯定是需要計(jì)算的了。
我們可以根據(jù)上面的特征,來初始化dp二維數(shù)組。
行代表s,列代表p,dp[0][j] 代表s為空,dp[i][0]代表p為空。
第四點(diǎn)其實(shí)就是我們的轉(zhuǎn)移方程。因此我們來詳解一下第三點(diǎn):
當(dāng)s= '' '' 時(shí),p=a*b*c* 和 p=ab* 前者可以做到和空主串完美匹配,后者卻不行。因此我們可以得出以下規(guī)律:
因此可以得到初始化dp首行的代碼(首列無需做多余更改,空正則除了匹配空主串,其余皆不匹配):
再探 i 和 j
我讀完大佬寫的題解的時(shí)候其實(shí)還是很懵懂的,真正豁然開朗是看了大佬的圖解。大佬做圖解一直有一手的~
下面結(jié)合圖解來講一下我們遺留的問題,dp[i][j] 和與之相對應(yīng)的 s[i-1] p[j-1]。
我們借用一下大佬的圖來看一下:
我們會發(fā)現(xiàn),前面提到:
- 第一行,也就是下標(biāo)為0的那行,代表 s 為空串
- 第一列,也就是下標(biāo)為0的那列,代表 p 為空串
我們是從第二行(下標(biāo)為1的行)和第二列(下標(biāo)為1的列)開始保存 s 和 p 的非空部分的。
因此,舉個(gè)具體的例子:dp[1][1]其邏輯含義是,保存的值表示 前1個(gè)s 和前1個(gè)p 是否匹配。在物理上代表 s[0] 和 p[0] 組成的點(diǎn)。因此我們也就不難理解大佬圖解中頻繁出現(xiàn)的 dp[i][j] 和 s[i-1] p[j-1] 之間的關(guān)系了。
代碼
class Solution { public:bool isMatch(string s, string p) {int rows = s.size()+1;int cols = p.size()+1;vector<vector<int>> dp(rows, vector<int>(cols, 0));// 初始化dp首行dp[0][0] = 1;for(size_t i = 2; i < cols; i += 2){dp[0][i] = dp[0][i-2] && p[i-1] =='*';}// 動規(guī)for(size_t i = 1; i < rows; i++){for(size_t j = 1; j < cols; j++){if(p[j-1] != '*'){if(dp[i-1][j-1] && (s[i-1]==p[j-1] || p[j-1] == '.')){dp[i][j] = 1;}}else{if(dp[i][j-2] || (dp[i-1][j] && (s[i-1] == p[j-2] || p[j-2] == '.'))){dp[i][j] = 1;}}}}return dp[rows-1][cols-1];} };總結(jié)
以上是生活随笔為你收集整理的正则表达式匹配(动规)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 二维数组的查找
- 下一篇: oracle推送短信,ORACLE 10