二分查找法的实现和应用汇总
此文轉(zhuǎn)自:http://www.cnblogs.com/ider/archive/2012/04/01/binary_search.html
?
在學(xué)習(xí)算法的過程中,我們除了要了解某個(gè)算法的基本原理、實(shí)現(xiàn)方式,更重要的一個(gè)環(huán)節(jié)是利用big-O理論來分析算法的復(fù)雜度。在時(shí)間復(fù)雜度和空間復(fù)雜度之間,我們又會(huì)更注重時(shí)間復(fù)雜度。
時(shí)間復(fù)雜度按優(yōu)劣排差不多集中在:
O(1), O(log n), O(n), O(n log n), O(n2), O(nk), O(2n)
到目前位置,似乎我學(xué)到的算法中,時(shí)間復(fù)雜度是O(log n),好像就數(shù)二分查找法,其他的諸如排序算法都是 O(n log n)或者O(n2)。但是也正是因?yàn)橛卸值?O(log n), 才讓很多 O(n2)縮減到只要O(n log n)。
?
關(guān)于二分查找法
二分查找法主要是解決在“一堆數(shù)中找出指定的數(shù)”這類問題。
而想要應(yīng)用二分查找法,這“一堆數(shù)”必須有一下特征:
- 存儲(chǔ)在數(shù)組中
- 有序排列
所以如果是用鏈表存儲(chǔ)的,就無法在其上應(yīng)用二分查找法了。(曽在面試被問二分查找法可以什么數(shù)據(jù)結(jié)構(gòu)上使用:數(shù)組?鏈表?)
至于是順序遞增排列還是遞減排列,數(shù)組中是否存在相同的元素都不要緊。不過一般情況,我們還是希望并假設(shè)數(shù)組是遞增排列,數(shù)組中的元素互不相同。
?
二分查找法的基本實(shí)現(xiàn)
二分查找法在算法家族大類中屬于“分治法”,分治法基本都可以用遞歸來實(shí)現(xiàn)的,二分查找法的遞歸實(shí)現(xiàn)如下:
View Code 1 int bsearch(int array[], int low, int high, int target) 2 { 3 if (low > high) return -1; 4 5 int mid = (low + high)/2; 6 if (array[mid]> target) 7 return binarysearch(array, low, mid -1, target); 8 if (array[mid]< target) 9 return binarysearch(array, mid+1, high, target); 10 11 //if (midValue == target) 12 return mid; 13 }?不過所有的遞歸都可以自行定義stack來解遞歸,所以二分查找法也可以不用遞歸實(shí)現(xiàn),而且它的非遞歸實(shí)現(xiàn)甚至可以不用棧,因?yàn)槎值倪f歸其實(shí)是尾遞歸,它不關(guān)心遞歸前的所有信息。
?
View Code 1 int bsearchWithoutRecursion(int array[], int low, int high, int target) 2 { 3 while(low <= high) 4 { 5 int mid = (low + high)/2; 6 if (array[mid] > target) 7 high = mid - 1; 8 else if (array[mid] < target) 9 low = mid + 1; 10 else //find the target 11 return mid; 12 } 13 //the array does not contain the target 14 return -1; 15 }?
只用小于比較(<)實(shí)現(xiàn)二分查找法
在前面的二分查找實(shí)現(xiàn)中,我們既用到了小于比較(<)也用到了大于比較(>),也可能還需要相等比較(==)。
而實(shí)際上我們只需要一個(gè)小于比較(<)就可以。因?yàn)殄e(cuò)邏輯上講a>b和b<a應(yīng)該是有相當(dāng)?shù)倪壿嬛?#xff1b;而a==b則是等價(jià)于 !((a<b)||(b<a)),也就是說a既不小于b,也不大于b。
當(dāng)然在程序的世界里, 這種關(guān)系邏輯其實(shí)并不是完全正確。另外,C++還允許對(duì)對(duì)象進(jìn)行運(yùn)算符的重載,因此開發(fā)人員完全可以隨意設(shè)計(jì)和實(shí)現(xiàn)這些關(guān)系運(yùn)算符的邏輯值。
不過在整型數(shù)據(jù)面前,這些關(guān)系運(yùn)算符之間的邏輯關(guān)系還是成立的,而且在開發(fā)過程中,我們還是會(huì)遵循這些邏輯等價(jià)關(guān)系來重載關(guān)系運(yùn)算符。
干嘛要搞得那么羞澀,只用一個(gè)關(guān)系運(yùn)算符呢?因?yàn)檫@樣可以為二分查找法寫一個(gè)template,又能減少對(duì)目標(biāo)對(duì)象的要求。模板會(huì)是這樣的:
?
View Code 1 template <typename T, typename V> 2 inline int BSearch(T& array, int low, int high, V& target) 3 { 4 while(!(high < low)) 5 { 6 int mid = (low + high)/2; 7 if (target < array[mid]) 8 high = mid - 1; 9 else if (array[mid] < target) 10 low = mid + 1; 11 else //find the target 12 return mid; 13 } 14 //the array does not contain the target 15 return -1; 16 }?
?
我們只需要求target的類型V有重載小于運(yùn)算符就可以。而對(duì)于V的集合類型T,則需要有[]運(yùn)算符的重載。當(dāng)然其內(nèi)部實(shí)現(xiàn)必須是O(1)的復(fù)雜度,否則也就失去了二分查找的效率。
?
用二分查找法找尋邊界值
之前的都是在數(shù)組中找到一個(gè)數(shù)要與目標(biāo)相等,如果不存在則返回-1。我們也可以用二分查找法找尋邊界值,也就是說在有序數(shù)組中找到“正好大于(小于)目標(biāo)數(shù)”的那個(gè)數(shù)。
用數(shù)學(xué)的表述方式就是:
???? 在集合中找到一個(gè)大于(小于)目標(biāo)數(shù)t的數(shù)x,使得集合中的任意數(shù)要么大于(小于)等于x,要么小于(大于)等于t。
?
舉例來說:
給予數(shù)組和目標(biāo)數(shù)
1 int array = {2, 3, 5, 7, 11, 13, 17}; 2 int target = 7;?
那么上界值應(yīng)該是11,因?yàn)樗皠倓偤谩贝笥?;下屆值則是5,因?yàn)樗皠倓偤谩毙∮?。
用二分查找尋找上界:
View Code 1 //Find the fisrt element, whose value is larger than target, in a sorted array 2 int BSearchUpperBound(int array[], int low, int high, int target) 3 { 4 //Array is empty or target is larger than any every element in array 5 if(low > high || target >= array[high]) return -1; 6 7 int mid = (low + high) / 2; 8 while (high > low) 9 { 10 if (array[mid] > target) 11 high = mid; 12 else 13 low = mid + 1; 14 15 mid = (low + high) / 2; 16 } 17 18 return mid; 19 }?
與精確查找不同之處在于,精確查找分成三類:大于,小于,等于(目標(biāo)數(shù))。而界限查找則分成了兩類:大于和不大于。
如果當(dāng)前找到的數(shù)大于目標(biāo)數(shù)時(shí),它可能就是我們要找的數(shù),所以需要保留這個(gè)索引,也因此if (array[mid] > target)時(shí) high=mid; 而沒有減1。
用二分查找法找尋下界:
View Code 1 //Find the last element, whose value is less than target, in a sorted array 2 int BSearchLowerBound(int array[], int low, int high, int target) 3 { 4 //Array is empty or target is less than any every element in array 5 if(high < low || target <= array[low]) return -1; 6 7 int mid = (low + high + 1) / 2; //make mid lean to large side 8 while (low < high) 9 { 10 if (array[mid] < target) 11 low = mid; 12 else 13 high = mid - 1; 14 15 mid = (low + high + 1) / 2; 16 } 17 18 return mid; 19 }下屆尋找基本與上屆相同,需要注意的是在取中間索引時(shí),使用了向上取整。若同之前一樣使用向下取整,那么當(dāng)low == high-1,而array[low] 又小于 target時(shí)就會(huì)形成死循環(huán)。因?yàn)閘ow無法往上爬超過high。
?
這兩個(gè)實(shí)現(xiàn)都是找嚴(yán)格界限,也就是要大于或者小于。如果要找松散界限,也就是找到大于等于或者小于等于的值(即包含自身),只要對(duì)代碼稍作修改就好了:
去掉判斷數(shù)組邊界的等號(hào):
target >= array[high]改為 target > array[high]在與中間值的比較中加上等號(hào):
array[mid] > target改為array[mid] >= target?
用二分查找法找尋區(qū)域
之前我們使用二分查找法時(shí),都是基于數(shù)組中的元素各不相同。假如存在重復(fù)數(shù)據(jù),而數(shù)組依然有序,那么我們還是可以用二分查找法判別目標(biāo)數(shù)是否存在。不過,返回的index就只能是隨機(jī)的重復(fù)數(shù)據(jù)中的某一個(gè)。
此時(shí),我們會(huì)希望知道有多少個(gè)目標(biāo)數(shù)存在。或者說我們希望數(shù)組的區(qū)域。
結(jié)合前面的界限查找,我們只要找到目標(biāo)數(shù)的嚴(yán)格上屆和嚴(yán)格下屆,那么界限之間(不包括界限)的數(shù)據(jù)就是目標(biāo)數(shù)的區(qū)域了。
?
View Code 1 //return type: pair<int, int> 2 //the fisrt value indicate the begining of range, 3 //the second value indicate the end of range. 4 //If target is not find, (-1,-1) will be returned 5 pair<int, int> SearchRange(int A[], int n, int target) 6 { 7 pair<int, int> r(-1, -1); 8 if (n <= 0) return r; 9 10 int lower = BSearchLowerBound(A, 0, n-1, target); 11 lower = lower + 1; //move to next element 12 13 if(A[lower] == target) 14 r.first = lower; 15 else //target is not in the array 16 return r; 17 18 int upper = BSearchUpperBound(A, 0, n-1, target); 19 upper = upper < 0? (n-1):(upper - 1); //move to previous element 20 21 //since in previous search we had check whether the target is 22 //in the array or not, we do not need to check it here again 23 r.second = upper; 24 25 return r; 26 }?
它的時(shí)間復(fù)雜度是兩次二分查找所用時(shí)間的和,也就是O(log n) + O(log n),最后還是O(log n)。
?
在輪轉(zhuǎn)后的有序數(shù)組上應(yīng)用二分查找法
之前我們說過二分法是要應(yīng)用在有序的數(shù)組上,如果是無序的,那么比較和二分就沒有意義了。
不過還有一種特殊的數(shù)組上也同樣可以應(yīng)用,那就是“輪轉(zhuǎn)后的有序數(shù)組(Rotated Sorted Array)”。它是有序數(shù)組,取期中某一個(gè)數(shù)為軸,將其之前的所有數(shù)都輪轉(zhuǎn)到數(shù)組的末尾所得。比如{7, 11, 13, 17, 2, 3, 5}就是一個(gè)輪轉(zhuǎn)后的有序數(shù)組。非嚴(yán)格意義上講,有序數(shù)組也屬于輪轉(zhuǎn)后的有序數(shù)組——我們?nèi)∈自刈鳛檩S進(jìn)行輪轉(zhuǎn)。
下邊就是二分查找法在輪轉(zhuǎn)后的有序數(shù)組上的實(shí)現(xiàn)(假設(shè)數(shù)組中不存在相同的元素)
?
View Code 1 int SearchInRotatedSortedArray(int array[], int low, int high, int target) 2 { 3 while(low <= high) 4 { 5 int mid = (low + high) / 2; 6 if (target < array[mid]) 7 if (array[mid] < array[high])//the higher part is sorted 8 high = mid - 1; //the target would only be in lower part 9 else //the lower part is sorted 10 if(target < array[low])//the target is less than all elements in low part 11 low = mid + 1; 12 else 13 high = mid - 1; 14 15 else if(array[mid] < target) 16 if (array[low] < array[mid])// the lower part is sorted 17 low = mid + 1; //the target would only be in higher part 18 else //the higher part is sorted 19 if (array[high] < target)//the target is larger than all elements in higher part 20 high = mid - 1; 21 else 22 low = mid + 1; 23 else //if(array[mid] == target) 24 return mid; 25 } 26 27 return -1; 28 }?
對(duì)比普通的二分查找法,為了確定目標(biāo)數(shù)會(huì)落在二分后的那個(gè)部分,我們需要更多的判定條件。但是我們還是實(shí)現(xiàn)了O(log n)的目標(biāo)。
二分查找法的缺陷
二分查找法的O(log n)讓它成為十分高效的算法。不過它的缺陷卻也是那么明顯的。就在它的限定之上:
必須有序,我們很難保證我們的數(shù)組都是有序的。當(dāng)然可以在構(gòu)建數(shù)組的時(shí)候進(jìn)行排序,可是又落到了第二個(gè)瓶頸上:它必須是數(shù)組。
數(shù)組讀取效率是O(1),可是它的插入和刪除某個(gè)元素的效率卻是O(n)。因而導(dǎo)致構(gòu)建有序數(shù)組變成低效的事情。
?
解決這些缺陷問題更好的方法應(yīng)該是使用二叉查找樹了,最好自然是自平衡二叉查找樹了,自能高效的(O(n log n))構(gòu)建有序元素集合,又能如同二分查找法一樣快速(O(log n))的搜尋目標(biāo)數(shù)。
?
?
?
轉(zhuǎn)載于:https://www.cnblogs.com/acmer-roney/archive/2012/09/07/2675309.html
總結(jié)
以上是生活随笔為你收集整理的二分查找法的实现和应用汇总的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 王长松:传统文化与中医养生(东南大学)汇
- 下一篇: 闲聊位置之 POI数据