找出一堆資料中最小的K個數問題

來源:互聯網
上載者:User

題目:輸入n個整數,輸出其中最小的k個。

例如輸入1,2,3,4,5,6,7和8這8個數字,則最小的4個數字為1,2,3和4。

分析:這道題最簡單的思路莫過於把輸入的n個整數排序,這樣排在最前面的k個數就是最小的k個數。只是這種思路的時間複雜度為O(nlogn)。我們試著尋找更快的解決思路。

我們可以開闢一個長度為k的數組。每次從輸入的n個整數中讀入一個數。如果數組中已經插入的元素少於k個,則將讀入的整數直接放到數組中。否則長度為k的數組已經滿了,不能再往數組裡插入元素,只能替換了。如果讀入的這個整數比數組中已有k個整數的最大值要小,則用讀入的這個整數替換這個最大值;如果讀入的整數比數組中已有k個整數的最大值還要大,則讀入的這個整數不可能是最小的k個整數之一,拋棄這個整數。這種思路相當於只要排序k個整數,因此時間複雜可以降到O(n+nlogk)。通常情況下k要遠小於n,所以這種辦法要優於前面的思路。

這是我能夠想出來的最快的解決方案。不過從給面試官留下更好印象的角度出發,我們可以進一步把代碼寫得更漂亮一些。從上面的分析,當長度為k的數組已經滿了之後,如果需要替換,每次替換的都是數組中的最大值。在常用的資料結構中,能夠在O(1)時間裡得到最大值的資料結構為最大堆。因此我們可以用堆(heap)來代替數組。

另外,自己重頭開始寫一個最大堆需要一定量的代碼。我們現在不需要重新去發明車輪,因為前人早就發明出來了。同樣,STL中的set和multiset為我們做了很好的堆的實現,我們可以拿過來用。既偷了懶,又給面試官留下熟悉STL的好印象,何樂而不為之?

參考代碼:

[cpp]
view plaincopy
  1. #include <set>  
  2. #include <vector>  
  3. #include <iostream>  
  4.   
  5. using namespace std;  
  6.   
  7. typedef multiset<int, greater<int> > IntHeap;  
  8.   
  9. ///////////////////////////////////////////////////////////////////////  
  10. // find k least numbers in a vector  
  11. ///////////////////////////////////////////////////////////////////////  
  12. void FindKLeastNumbers  
  13. (  
  14.       const vector<int>& data,               // a vector of data  
  15.       IntHeap& leastNumbers,                 // k least numbers, output  
  16.       unsigned int k                                
  17. )  
  18. {  
  19.       leastNumbers.clear();  
  20.   
  21.       if(k == 0 || data.size() < k)  
  22.             return;  
  23.   
  24.       vector<int>::const_iterator iter = data.begin();  
  25.       for(; iter != data.end(); ++ iter)  
  26.       {  
  27.             // if less than k numbers was inserted into leastNumbers  
  28.             if((leastNumbers.size()) < k)  
  29.                   leastNumbers.insert(*iter);  
  30.   
  31.             // leastNumbers contains k numbers and it's full now  
  32.             else  
  33.             {  
  34.                   // first number in leastNumbers is the greatest one  
  35.                   IntHeap::iterator iterFirst = leastNumbers.begin();  
  36.   
  37.                   // if is less than the previous greatest number   
  38.                   if(*iter < *(leastNumbers.begin()))  
  39.                   {  
  40.                         // replace the previous greatest number  
  41.                         leastNumbers.erase(iterFirst);  
  42.                         leastNumbers.insert(*iter);  
  43.                   }  
  44.             }  
  45.       }  
  46. }  

//補充的代碼

[cpp]
view plaincopy
  1. /* 
  2. 解題報告: 
  3. 1、最簡單的辦法,給所有資料按升序或降序排序,從中取出相應的k個就可以了,最快的時間複雜度為nlog(n) 
  4. 2、可以考慮維護一個堆,這個堆的中元素的個數為k,然後遍曆元素,這時有兩種情況: 
  5.     1、堆中元素的個數小於k,這時直接插入即可 
  6.     2、元素的個數為k,這時如果遍曆到的元素小於堆中最大的那個元素就將堆中的這個元素刪除,將遍曆到的元素插入即可  
  7. */  
  8.   
  9. #include <iostream>  
  10. #include <set>  
  11. #include <vector>  
  12. using namespace std;  
  13.   
  14. typedef multiset<int, greater<int> > intHeap;  
  15.   
  16. void FindNumbers(vector<int> &data, int k, intHeap &numbers)  
  17. {  
  18.     numbers.clear();  
  19.     if (0==k || data.size()<k)  
  20.         return ;  
  21.     vector<int>::const_iterator iter = data.begin();  
  22.     for (; iter!=data.end(); iter++)  
  23.     {  
  24.         if (numbers.size() < k)  
  25.         {  
  26.             numbers.insert(*iter);  
  27.         }  
  28.         else  
  29.         {  
  30.             intHeap::iterator heapIter = numbers.begin();  
  31.             if (*iter < *(numbers.begin()))  
  32.             {  
  33.                 numbers.erase(heapIter);  
  34.                 numbers.insert(*iter);  
  35.             }  
  36.         }  
  37.     }  
  38. }  
  39.   
  40. int main()  
  41. {  
  42.     int n;  
  43.     vector<int> data;  
  44.     intHeap numbers;  
  45.     while (cin>>n)  
  46.     {  
  47.         for (int i=0; i<n; ++i)  
  48.         {  
  49.             int nTemp;  
  50.             cin>>nTemp;  
  51.             data.push_back(nTemp);  
  52.         }  
  53.         FindNumbers(data, 4, numbers);  
  54.         intHeap::const_iterator iter = numbers.begin();  
  55.         for (; iter!=numbers.end(); ++iter)  
  56.         {  
  57.             cout<<*iter<<" ";  
  58.         }  
  59.         cout<<endl;  
  60.     }  
  61.     return 0;  
  62. }  

//我的借鑒方法

[cpp]
view plaincopy
  1. #include <iostream>  
  2. #include <algorithm>  
  3. #include <vector>  
  4. #include <cmath>  
  5. #include <set>  
  6.   
  7. using namespace std;  
  8.   
  9. //print an array of int  
  10. inline void print(int *arr, //the array of int  
  11.                   int n //the length of array  
  12.                  )  
  13. {  
  14.     for(int i=0;i<n;i++)  
  15.         cout<<arr[i]<<"\t";  
  16.     cout<<endl;  
  17.   
  18. }  
  19. typedef multiset<int, greater<int> > IntHeap;  
  20.   
  21.   
  22. ///////////////////////////////////////////////////////////////////////  
  23. // find k least numbers in a vector  
  24. ///////////////////////////////////////////////////////////////////////  
  25. void FindKLeastNumbers(  
  26.    //   vector<int>& data,             // a vector of data  
  27.       int *array,  
  28.       unsigned int len,  
  29.       IntHeap& leastNumbers,                 // k least numbers, output  
  30.       unsigned int k )  
  31. {  
  32.   
  33.       std::vector <int> data(array, array + len);  
  34.   
  35.       leastNumbers.clear();  
  36.   
  37.       if(k == 0 || data.size() < k)  
  38.             return;  
  39.   
  40.       vector<int>::const_iterator iter = data.begin();  
  41.       for(; iter != data.end(); ++ iter)  
  42.       {  
  43.             // if less than k numbers was inserted into leastNumbers  
  44.             if((leastNumbers.size()) < k)  
  45.                   leastNumbers.insert(*iter);  
  46.   
  47.             // leastNumbers contains k numbers and it's full now  
  48.             else  
  49.             {  
  50.                   // first number in leastNumbers is the greatest one  
  51.                   IntHeap::iterator iterFirst = leastNumbers.begin();  
  52.   
  53.                   // if is less than the previous greatest number   
  54.                   if(*iter < *(leastNumbers.begin()))  
  55.                   {  
  56.                         // replace the previous greatest number  
  57.                         leastNumbers.erase(iterFirst);  
  58.                         leastNumbers.insert(*iter);  
  59.                   }  
  60.             }  
  61.       }  
  62. }  
  63.   
  64.   
  65. void main()  
  66. {  
  67.     int arr[ 10 ] = {3, 4, 8, 6, 0, 1, 5, 7, 2, 9};  
  68.   
  69.     int len = sizeof(arr) / sizeof(int);  
  70.   
  71.     int LeastNumers = 5;  
  72.   
  73.     IntHeap numbers;  
  74.       
  75.     FindKLeastNumbers(arr,len,numbers,LeastNumers);  
  76.   
  77.     IntHeap::const_iterator iter = numbers.begin();  
  78.     for (; iter != numbers.end(); ++iter)  
  79.     {  
  80.             cout<<*iter<<" ";  
  81.     }  
  82.     cout<<endl;  
  83. }

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.