二分尋找演算法在C/C++程式中的應用樣本_C 語言

來源:互聯網
上載者:User

 二分尋找演算法的思想很簡單,《編程珠璣》中的描述: 在一個包含t的數組內,二分尋找通過對範圍的跟綜來解決問題。開始時,範圍就是整個數組。通過將範圍中間的元素與t比較並丟棄一半範圍,範圍就被縮小。這個過程一直持續,直到在t被發現,或者那個能夠包含t的範圍已成為空白。
        Donald Knuth在他的《Sorting and Searching》一書中指出,儘管第一個二分尋找演算法早在1946年就被發表,但第一個沒有bug的二分尋找演算法卻是在12年後才被發表出來。其中常見的一個bug是對中間值下標的計算,如果寫成(low+high)/2,當low+high很大時可能會溢出,從而導致數組訪問出錯。改進的方法是將計算方式寫成如下形式:low+ ( (high-low) >>1)即可。下面給出修改後的演算法代碼:

int binarysearch1(int a[],int n,int x) {  int l,u,m;  l=0;u=n;  while(l<u)  {   m=l+((u-l)>>1);   if(x<a[m])    u=m;   else if(x==a[m])    return m;   else    l=m+1;  }  return -1; } 

       這裡注意一點,由於使用的是不對稱區間,所以下標的調整看上去有點不規整。一個是u=m,另一個是l=m+1。其實很好理解,調整前區間的形式應該是 [ )的形式,如果中間值比尋找值小,那麼調整的是左邊界,也就是閉的部分,所以加1;否則,調整是右邊界,是開的部分,所以不用減1。調整後仍是[ )的形式。當然也可以寫成對稱的形式。代碼如下:

int binarysearch1(int a[],int n,int x) {  int l,u,m;  l=0;u=n-1;  while(l<=u)  {   m=l+((u-l)>>1);   if(x<a[m])    u=m-1;   else if(x==a[m])    return m;   else    l=m+1;  }  return -1; } 

       這樣也看上去比較規整,但是有個不足。如果想把程式改成“純指標”的形式,就會有麻煩。修改成純指標的代碼如下:

int binarysearch2(int *a,int n,int x) {  int *l,*u,*m;  l=a;u=a+n-1;  while(l<=u)  {   m=l+((u-l)>>1);   if(x<*m)    u=m-1;   else if(x==*m)    return m-a;   else    l=m+1;  }  return -1; } 

       當n為0時,會引用無效地址。而用非對稱區間則不會有這個問題。代碼如下:

int binarysearch2(int *a,int n,int x) {  int *l,*u,*m;  l=a;u=a+n;  while(l<u)  {   m=l+((u-l)>>1);   if(x<*m)    u=m;   else if(x==*m)    return m-a;   else    l=m+1;  }  return -1; } 

       上面給出的二分尋找是迭代法實現,當然也可以用遞迴的方式實現。代碼如下:

int binarysearch3(int a[],int l,int u,int x)  int m=l+((u-l)>>1); if(l<=u) {  if(x<a[m])   return binarysearch3(a,l,m-1,x);  else if(x==a[m])   return m;  else   return binarysearch3(a,m+1,u,x); } return -1; 

    
       上述這些二分演算法,若數組元素重複,返回的是重複元素的某一個元素。如果希望返回被尋找元素第一次出現的位置,則需要修改代碼。下面給出了一種解法:

int binarysearch4(int a[],int n,int x) {  int l,u,m;  int flag=-1;  l=0;u=n;  while(l<u)  {   m=l+((u-l)>>1);   if(x<a[m])    u=m;   else if(x==a[m])    flag=u=m;   else    l=m+1;  }  return flag; } 

       下面是《編程珠璣》上的解法:

int binarysearch4(int a[],int n,int x) {  int l,u,m;  l=-1;u=n;  while(l+1<u)  {   m=l+((u-l)>>1);   if(a[m]<x)    l=m;   else    u=m;  }  return (u>=n||a[u]!=x)?-1:u; } 

 
        至此二分演算法的代碼討論結束,下面討論一下程式的測試問題。《代碼之美》有一章專門介紹二分尋找演算法的測試,非常漂亮。這裡班門弄斧,簡單給出幾個測試案例。針對binarysearch1。測試程式如下:

#include <iostream> #include <cassert> #include <algorithm> #include <ctime> using namespace std;  int calmid(int l,int u) { return l+((u-l)>>1); } int binarysearch1(int a[],int n,int x);  #define bs1 binarysearch1  int main() {  long start,end;  start=clock();   int a[9]={-2147483648,-13,-10,-5,-3,0,1,400,2147483647};  //中值下標計算的測試  assert(calmid(0,1)==0);  assert(calmid(0,2)==1);  assert(calmid(1000000,2000000)==1500000);  assert(calmid(2147483646,2147483647)==2147483646);  assert(calmid(2147483645,2147483647)==2147483646);   //煙霧測試 (Smoke Test)  assert(bs1(a,9,0)==5);  assert(bs1(a,9,1)==6);  assert(bs1(a,9,2)==-1);   //邊界測試  assert(bs1(a,0,1)==-1);       //0個元素  assert(bs1(a,1,-2147483648)==0);  //1個元素 成功  assert(bs1(a,1,-2147483647)==-1);  //1個元素 失敗   assert(bs1(a,9,-2147483648)==0);  //首個元素  assert(bs1(a,9,-3)==4);       //中間元素  assert(bs1(a,9,2147483647)==8);  //末尾元素   //自動化測試  int b[10000];  int i,j;  for(i=0;i<10000;i++)  {   b[i]=i*10;   for(j=0;j<=i;j++)   {    assert(bs1(b,i+1,j*10)==j);    assert(bs1(b,i+1,j*10-5)==-1);   }  }   //自動化測試 引入隨機數  srand(time(0));  for(i=0;i<10000;i++)  {   b[i]=rand()%1000000;   sort(&b[0],&b[i]);   for(j=0;j<=i;j++)   {    int x=rand();    int k=bs1(b,i+1,x);    if(k!=-1)     assert(b[k]==x);   }  }   end=clock();  cout<<(end-start)/1000.0<<'s'<<endl;  return 0; } 

       注意到數組的元素有正數,負數,零,最大值,最小值。通常會忘掉負數的測試,引入最大值和最小值,主要是為了邊界測試。
       第一,測試了中值下標的計算。另外寫了一個小函數,單獨測試。考慮到記憶體可能放不下這麼大的數組,因此只是類比測試,並沒有真正申請這麼大的空間,但是對於中值下標的測試足夠了。
       第二,煙霧測試 (Smoke Test)。即做一些最基本的測試。測試通過後進行邊界測試。
       第三,邊界測試。這裡有三種類型,一是針對數組元素個數,分別是0個,1個。二是針對元素位置,分別是首個元素,中間元素,末尾元素。三是針對元素值,有最大值,最小值,0等測試。
       第四,自動化測試。這裡自動產生測試的數組,然後針對每個元素進行成功尋找測試。
       第五,自動化測試,只不過數組的元素是隨機值。
       第五,效能測試。這裡相關代碼沒有列出。以上測試都通過時,可以修改尋找演算法,添加效能測試的代碼。其實可以簡單添加一個比較的計數器。傳回值從原來的尋找結果改為比較的計數器值即可。代碼比較簡單,就不列了。

Note:二分尋找容易忽略的一個bug
對於二分尋找演算法,相信大家肯定不會陌生。演算法從一個排好序的數組中找指定的元素,如果找到了返回該元素在數組中的索引,否則返回-1。下面給出瞭解法。

//a為排好序的數組,n為數組的大小,x為指定元素 int binarySearch(int a[], int n, int x) {  int left = 0, right = n-1, middle = 0;  int tmp = 0;  while(left <= right)  {    middle = (left + right)/2;    tmp = a[middle];    if(x < tmp) right = middle - 1;    else if(x > tmp) left = middle + 1;    else return middle;  }  return -1; } 

      乍看沒有錯誤,但是不幸的是,該程式存在一個bug。當數組極大時,(left+right)可能為負數,則數組下標溢出,程式崩潰。
解決的方案:將middle=(left+right)/2改為middle=left+(right-left)/2即可。即利用減法代替加法,從而消除上溢。
      參考自《代碼之美》

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.