python字符串中最长的连续升序子串_Leetcode刷题练Python无重复字符的最长子串
這是一道字符串處理算法的題目,在日常編程中,處理字符串是常見任務。該題目會涉及到一個概念“滑動窗口”。
一、題目描述
給定一個字符串,請你找出其中不含有重復字符的?最長子串?的長度。
示例?1:
輸入:?"abcabcbb"輸出:?3解釋: 因為無重復字符的最長子串是 "abc",所以其長度為?3。
示例?2:
輸入:?"bbbbb"輸出:?1解釋:?因為無重復字符的最長子串是 "b",所以其長度為?1。
示例?3:
輸入:?"pwwkew"輸出:?3解釋:?因為無重復字符的最長子串是?"wke",所以其長度為?3。? 請注意,你的答案必須是 子串 的長度,"pwke"?是一個子序列,不是子串。
二、解題思路
先來定義一下“子串”,根據題目描述,“子串”就是字符串中截取某一部分,長度從1到該字符串的長度。比如“abc”的子串集合是:
['a', 'b', 'c', 'ab', 'bc', 'abc']
用?Python?生成這個集合很容易,你是否想到了?
那么問題來了,任意長度為n的字符串一共有多少個這樣的“子串”呢?答案是:(n+1)?*?n?/?2?。從上面的例子很容易得出這個答案:begin等于0時,長度可以有?n?-?0?個,begin等于1時,長度可以有?n?-?1個,以此類推,總數就是:
n + (n-1) + ... + 1 => (n+1)*n / 2
(1)暴力解法
明白了“子串”的概念和獲取方法,自然而然的就得到了最樸素也是最“暴力”的解法:遍歷字符串得到所有“子串”,然后判斷每個“子串”是否有重復字符,最終就會得到無重復最長子串了。
這個“暴力”算法中,計算所有子串的時間復雜度是?O(n2),而判斷一個子字符串是否有重復字符,又要從頭到尾遍歷一遍該字符串,所有最終的時間復雜度可以達到?O(n3)。
這個解法是不能被接受的,提到它全是因為前面對“子串”的解釋及其數量計算,來練習Python對字符串的操作。
(2)滑動窗口
“滑動窗口”這個概念在計算機算法中非常常見。該算法可以把嵌套的循環轉化為單循環從而降低時間復雜度。它在很多不同的領域都有應用:
TCP協議的滑動窗口進行流量控制
NLP(自然語言處理)中的 N-gram
圖像處理中的物體識別
有興趣的同學可以深入了解上面提到的應用領域。
下面我們看看,“滑動窗口”如何進行字符串處理。結合題目中的例子“abcabcbb”這個字符串,我們來看看如何找它的無重復最長子串。
首先,我們定義窗口的兩端:begin和end,分別表示要找的子串的開頭和結尾。
開始的時候,begin和end都指向0的位置即‘a’,然后end不斷后移(窗口變寬),當遇到第二個‘a’時(遇見重復字符)就得到一個子串,其長度就是end和begin位置的差。
如何判斷是否遇到了重復字符‘a’呢?需要一個字典作為輔助數據結構,把end從頭開始遇到的每個字符及其索引位置都放到字典里面,end每次移動到新字符就查一下字典即可。
通過字典,我們遇到第二個‘a’時就可以找到存在字典里面的第一個‘a’的位置。為了繼續尋找無重復子串,begin就要指向第一個‘a’后面一個的位置即‘b’。然后end繼續后移到‘b’,有發現它與前面的‘b’重復,計算子串長度賦值給最大長度(需要比較),同時begin要移動第一個‘b’后面的位置即‘c’。
這樣依次移動end到字符串末尾就可以找到最長的子串,“子串窗口”也就從頭移到了末尾。而只需要end從頭到尾的一次循環即可。
把這個過程用Python實現如下:
提交后就可以看到結果?!皥绦袝r間”還只是個參考,再一次提交相同代碼結果不是圖中的擊敗91%,而變成了百分之十幾。
Python送書活動還在繼續,歡迎參加:
拼手氣送?Python 書籍
一個十年Python碼奴與運營汪的結合體
長按掃碼關注
總結
以上是生活随笔為你收集整理的python字符串中最长的连续升序子串_Leetcode刷题练Python无重复字符的最长子串的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python filter map区别_
- 下一篇: python 拓扑排序 dfs bfs_