1.錯誤的map刪除操作
假設有個map容器,用於儲存大學班級中各個家鄉省份對應的學生數,key為省份中文全拼,value為學生數。現需要刪除人數為0的記錄,刪除代碼如下:
map<string,int > countMap;for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();++it){if(it->second==0){ countMap.erase(it); }}
猛一看,沒問題,仔細一看,有巨坑,STL容器的刪除和插入操作隱藏的陷阱主要有如下兩條。
(1)對於節點式容器(map, list, set)元素的刪除,插入操作會導致指向該元素的迭代器失效,其他元素迭代器不受影響;
(2)對於順序式容器(vector,string,deque)元素的刪除、插入操作會導致指向該元素以及後面的元素的迭代器失效。
所以,在刪除一個元素的時候,是沒有什麼問題的。即:
for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();++it){ if(it->second==0) { countMap.erase(it); break; }}
但是,當刪除多個元素時,程式會出現崩潰。原因是通過迭代器刪除指定的元素時,指向那個元素的迭代器將失效,如果再次對失效的迭代器進行++操作,則會帶來未定義行為,程式崩潰。解決方案有二,還是以上面的map容器為例,樣本刪除操作的正確實現:
方法一:當刪除特定值的元素時,刪除元素前儲存當前被刪除元素的下一個元素的迭代器。
map<string,int >::iterator nextIt=countMap.begin();for(map<string,int>::iterator it=countMap.begin();;){ if(nextIt!=countMap.end()) { ++nextIt; } else { break; } if(it->second==0) { countMap.erase(it); } it=nextIt;}
如何更加簡潔的實現該方法呢?下面給出該方法的《Effective STL》一書的具體實現:
for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();){ if(it->second==0) { countMap.erase(it++); } else { ++it; }}
該實現方式利用了後置++操作符的特性,在erase操作之前,迭代器已經指向了下一個元素。
再者map.erase()返回指向緊接著被刪除元素的下一個元素的迭代器,所以可以實現如下:
for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();){ if(it->second==0) { it=countMap.erase(it); } else { ++it; }}
方法二:當刪除滿足某些條件的元素,可以使用remove_copy_if & swap方法。先通過函數模板remove_copy_if 按照條件拷貝(copy)需要的元素到臨時容器中,剩下未被拷貝的元素就相當於被“刪除(remove)”了,然後在將兩個容器中的元素交換(swap)即可,可以直接調用map的成員函數swap。參考代碼:
#include <iostream>#include <string>#include <map>#include <algorithm>#include <iterator> using namespace std;map<string,int> mapCount;//不拷貝的條件bool notCopy(pair<string,int> key_value){ return key_value.second==0;}int main(){ mapCount.insert(make_pair("tanwan",0)); mapCount.insert(make_pair("anhui",1)); mapCount.insert(make_pair("shanghai",0)); mapCount.insert(make_pair("shandong",1)); map<string,int> mapCountTemp;//臨時map容器 //之所以要用迭代器適配器inserter函數模板是因為通過調用insert()成員函數來插入元素,並由使用者指定插入位置 remove_copy_if(mapCount.begin(),mapCount.end(),inserter(mapCountTemp,mapCountTemp.begin()),notCopy); mapCount.swap(mapCountTemp);//實現兩個容器的交換 cout<<mapCount.size()<<endl; //輸出2 cout<<mapCountTemp.size()<<endl; //輸出4 for(map<string,int>::iterator it=mapCount.begin();it!=mapCount.end();++it) { cout<<it->first<<" "<<it->second<<endl; }}
程式輸出結果:
24anhui 1shandong 1
這種方法的缺點:雖然實現兩個map的交換的時間複雜度是常量級,一般情況下,拷貝帶來的時間開銷會大於刪除指定元素的時間開銷,並且臨時map容器也增加了空間的開銷。
2.STL中容器的迭代器的底層實現機制
提到STL,必須要馬上想到其主要的6個組成組件,分別是:容器、迭代器、演算法、仿函數、適配器和空間分配器,迭代器是串連容器和演算法的一種重要橋樑。
STL中容器迭代器的本質是類對象,其作用類似於資料庫中的遊標(cursor),除此之外迭代器也是一種設計模式。我們可以對它進行遞增(或選擇下一個)來訪問容器中的元素,而無需知道它內部是如何?的。其行為很像指標,都可以用來訪問指定的元素。但是二者是完全不同的東西,指標代表元素的記憶體位址,即對象在記憶體中的儲存位置,而迭代器則代表元素在容器中的相對位置。
要自訂一個迭代器,就要重載迭代器一些基本操作符:*(解引用)、++(自增)、==(等於)、!=(不等於)、=(賦值),以便它在range for語句中使用。range for是C++11中新增的語句,如我們對一個集合使用語句for (auto i : collection ) 時,它的含義其實為:
for(auto __begin = collection.begin(),auto __end = collection.end();__begin!=__end;++__begin){ i = *__begin; ...//迴圈體}
begin和end是集合的成員函數,它返回一個迭代器。如果讓一個類可以有range for的操作,它必須滿足以下幾條:
(1)擁有begin和end函數,它們均返回迭代器 ,其中end函數返回一個指向集合末尾,但是不包含末尾元素的值,即用集合範圍來表示,一個迭代器的範圍是 [ begin, end ) 一個左閉右開區間。
(2)必須重載++、!=和解引用(*)運算子。迭代器看起來會像一個指標,但是不是指標。迭代器必須可以通過++最後滿足!=條件,這樣才能夠終止迴圈。
下面給出最簡單的實現代碼。我們定義一個CPPCollection類,裡面有個字串數組,我們讓它能夠通過range for將每個字串輸出來。
class CPPCollection {public: //迭代器類 class Iterator { public: int index;//元素下標 CPPCollection& outer; Iterator(CPPCollection &o, int i):outer(o), index(i){} void operator++() { index++; } std::string operator*() const { return outer.str[index]; } bool operator!=(Iterator i) { return i.index!=index; } };public: CPPCollection() { string strTemp[10]={"a", "b", "c", "d", "e", "f", "g", "h", "i", "j"}; int i=0; for(auto strIt:strTemp) { str[i++]=strIt; } } Iterator begin() { return Iterator(*this,0); } Iterator end() { return Iterator(*this, 10); }private: std::string str[10];};
我們定義了個內部的嵌套類Iterator,並為它重載了++、*、!=運算子。由於C++中的內部嵌套類與外圍的類沒有聯絡,為了訪問外部類對象的值,我們必須要傳入一個引用(或指標,本例中傳入引用)。Iterator的自增方法其實就是增加內部的一個索引值。判斷!=的方法是和另外一個迭代器做比較,這個迭代器一般是集合的末尾,當我們的索引值等於末尾的索引值end時,認為迭代器已經達到了末尾。 在CPPCollection類中,定義了begin()、end()分別返回開頭、結束迭代器,調用如下代碼:
CPPCollection cpc; for (auto i : cpc) { std::cout <<i<<std::endl; } //或者 CPPCollection cpc; for(CPPCollection::Iterator i= cpc.begin();i!=cpc.end();++i) { std::cout<<*i<<std::endl; }
即可遍曆集合中的所有元素了。
在泛型演算法中,為了對集合中的每一個元素進行操作,我們通常要傳入集合的迭代器頭、迭代器尾,以及謂詞,例如std::find_if(vec.begin(),vec.end(),…)
,這種泛型演算法其實就是在迭代器的首位反覆迭代,然後運行相應的行為。
參考文獻
[1]編寫高品質代碼:改善C++程式的150個建議.李健.機械工業出版社.
相關文章:
C# 2.0 Specification(迭代器)(二)
C#中使用迭代器處理等待任務_基礎知識
C# 2.0 Specification(迭代器)(一)