作者: winter
這裡描述的是一種很常見的情況:當你在某個緩衝中儲存資料時,常常需要在運行時調整該緩衝的大小,以便能容納更多的資料。傳統的記憶體再分配技術非常繁瑣,而且容易出錯:在 C 語言中,一般都是每次在需要擴充緩衝的時候調用 realloc()。在 C++ 中情況更糟,你甚至無法在函數中為 new 操作分配的數組重新申請記憶體。你不僅要自己做分配處理,而且還必須把原來緩衝中的資料拷貝到新的目的緩衝,然後釋放先前數組的緩衝。本文將針對這個問題提供一個安全、簡易並且是自動化的 C++ 記憶體再分配技術——即使用 STL 的 vector。
用 STL vector 對象取代內建的數組來儲存擷取的資料,既安全又簡單,並且是自動化的。
進一步的問題分析
在提出解決方案之前,我先給出一個具體的例子來說明 C++ 重新分配記憶體的弊病和複雜性。假設你有一個編目應用程式,它讀取使用者輸入的 ISBNs,然後將之插入一個數組,直到使用者輸入 0 為止。如果使用者插入的資料多於數組的容量,那麼你必須相應地增加它的大小:
#include <iostream>
using namespace std;
int main()
...{
int size=2; // 初始化數組大小;在運行時調整。
int *p = new int[size];
int isbn;
for(int n=0; ;++n)
...{
cout<< "enter an ISBN; press 0 to stop ";
cin>>isbn;
if (isbn==0)
break;
if (n==size) // 數組是否到達上限?
reallocate(p, size);
p[n]=isbn; // 將元素插入擴容的數組
}
delete [] p; // 不要忘了這一步!
}
注意上述這個向數組插入資料的過程是多麼的繁瑣。每次反覆,迴圈都要檢查緩衝是否達到上限。如果是,則程式調用使用者定義的函數 reallocate(),該函數實現如下:
#include <algorithm> // for std::copy
int reallocate(int* &p, int& size)
...{
size*=2; // double the array''s size with each reallocation
int * temp = new int[size];
std::copy(p, p+(size/2), temp);
delete [] p; // release original, smaller buffer
p=temp; // reassign p to the newly allocated buffer
}
reallocate() 使用 STL std::copy() 演算法對緩衝進行合理的擴充——每次擴充都放大一倍。這種方法可以避免預先分配過多的記憶體,從量上減少需要重新分配的記憶體。這個技術需要得到充分的測試和調試,當初學者實現時尤其如此。此外,reallocate() 並不通用,它只能處理整型數組的情形。對於其它資料類型,它無能為力,你必須定義該函數額外的版本或將它模板化。幸運的是,有一個更巧妙的辦法來實現。
建立和最佳化 vector
每一個 STL 容器都具備一個分配器(allocator),它是一個內建的記憶體管理器,能自動按需要重新分配容器的儲存空間。因此,上面的程式可以得到大大簡化,並擺脫 reallocator 函數。
第一步:建立 vector
用 vector 對象取代內建的數組來儲存擷取的資料。main() 中的迴圈讀取 ISBN,檢查它是否為 0,如果不為 0 ,則通過調用 push_back() 成員函數將值插入vector:
#include <iostream>
#include <vector>
using namespace std;
int main()
...{
vector <int> vi;
int isbn;
while(true)
...{
cout << "enter an ISBN; press 0 to stop ";
cin>> isbn;
if (isbn==0)
break;
vi.push_back(isbn); // insert element into vector
}
}
在 vector 物件建構期間,它先分配一個由其實現定義的預設的緩衝大小。一般 vector 分配的資料存放區初始空間是 64-256 儲存槽(slots)。當 vector 感覺儲存空間不夠時,它會自動重新分配更多的記憶體。實際上,只要你願意,你可以調用 push_back() 任何多次,甚至都不用知道一次又一次的分配是在哪裡發生的。
為了存取 vector 元素,使用重載的 [] 操作符。下列迴圈在螢幕上顯示所有 vector 元素:
for (int n=0; n<vi.size(); ++n)
...{
cout<<"ISBN: "<<vi[n]<<endl;
}
第二步:最佳化
在大多數情況下,你應該讓 vector 自動管理自己的記憶體,就像我們在上面程式中所做的那樣。但是,在注重時間的任務中,改寫預設的分配方案也是很有用的。假設我們預Crowdsourced Security Testing道 ISBNs 的數量至少有 2000。那麼就可以在物件建構期間指出容量,以便 vector 具有至少 2000 個元素的容量:
vector <int> vi(2000); // 初始容量為 2000 個元素
除此之外,我們還可以調用 resize() 成員函數:
vi.resize(2000);// 建立不小於 2000 個元素的空間
這樣,便避免了中間的再分配,從而提高了效率。