International - English

Cart Console

Topic Center

Contact Sales

首頁 > 開發者 > C#

（C++）錯誤的map刪除操作和STL中容器的迭代器的底層實現機制

最後更新：2018-08-02 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

1.錯誤的map刪除操作

假設有個map容器，用於儲存大學班級中各個家鄉省份對應的學生數，key為省份中文全拼，value為學生數。現需要刪除人數為0的記錄，刪除代碼如下：

map<string,int > countMap;for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();++it){if(it->second==0){        countMap.erase(it);    }}

猛一看，沒問題，仔細一看，有巨坑，STL容器的刪除和插入操作隱藏的陷阱主要有如下兩條。
（1）對於節點式容器(map, list, set)元素的刪除，插入操作會導致指向該元素的迭代器失效，其他元素迭代器不受影響；
（2）對於順序式容器(vector，string，deque)元素的刪除、插入操作會導致指向該元素以及後面的元素的迭代器失效。

所以，在刪除一個元素的時候，是沒有什麼問題的。即：

for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();++it){    if(it->second==0)    {        countMap.erase(it);        break;    }}

但是，當刪除多個元素時，程式會出現崩潰。原因是通過迭代器刪除指定的元素時，指向那個元素的迭代器將失效，如果再次對失效的迭代器進行++操作，則會帶來未定義行為，程式崩潰。解決方案有二，還是以上面的map容器為例，樣本刪除操作的正確實現：

方法一：當刪除特定值的元素時，刪除元素前儲存當前被刪除元素的下一個元素的迭代器。

map<string,int >::iterator nextIt=countMap.begin();for(map<string,int>::iterator it=countMap.begin();;){    if(nextIt!=countMap.end())    {        ++nextIt;    }    else    {         break;    }    if(it->second==0)    {        countMap.erase(it);    }    it=nextIt;}

如何更加簡潔的實現該方法呢？下面給出該方法的《Effective STL》一書的具體實現：

for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();){    if(it->second==0)    {        countMap.erase(it++);    }    else    {        ++it;    }}

該實現方式利用了後置++操作符的特性，在erase操作之前，迭代器已經指向了下一個元素。

再者map.erase()返回指向緊接著被刪除元素的下一個元素的迭代器，所以可以實現如下：

for(map<string,int>::iterator it=countMap.begin();it!=countMap.end();){    if(it->second==0)    {        it=countMap.erase(it);    }       else    {        ++it;    }}

方法二：當刪除滿足某些條件的元素，可以使用remove_copy_if & swap方法。先通過函數模板remove_copy_if 按照條件拷貝（copy）需要的元素到臨時容器中，剩下未被拷貝的元素就相當於被“刪除（remove）”了，然後在將兩個容器中的元素交換（swap）即可，可以直接調用map的成員函數swap。參考代碼：

#include <iostream>#include <string>#include <map>#include <algorithm>#include <iterator>  using namespace std;map<string,int> mapCount;//不拷貝的條件bool notCopy(pair<string,int> key_value){    return key_value.second==0;}int main(){    mapCount.insert(make_pair("tanwan",0));    mapCount.insert(make_pair("anhui",1));    mapCount.insert(make_pair("shanghai",0));    mapCount.insert(make_pair("shandong",1));    map<string,int> mapCountTemp;//臨時map容器    //之所以要用迭代器適配器inserter函數模板是因為通過調用insert()成員函數來插入元素，並由使用者指定插入位置    remove_copy_if(mapCount.begin(),mapCount.end(),inserter(mapCountTemp,mapCountTemp.begin()),notCopy);    mapCount.swap(mapCountTemp);//實現兩個容器的交換    cout<<mapCount.size()<<endl;     //輸出2    cout<<mapCountTemp.size()<<endl; //輸出4    for(map<string,int>::iterator it=mapCount.begin();it!=mapCount.end();++it)    {        cout<<it->first<<" "<<it->second<<endl;    }}

程式輸出結果：

24anhui 1shandong 1

這種方法的缺點：雖然實現兩個map的交換的時間複雜度是常量級，一般情況下，拷貝帶來的時間開銷會大於刪除指定元素的時間開銷，並且臨時map容器也增加了空間的開銷。

2.STL中容器的迭代器的底層實現機制

提到STL，必須要馬上想到其主要的6個組成組件，分別是：容器、迭代器、演算法、仿函數、適配器和空間分配器，迭代器是串連容器和演算法的一種重要橋樑。

STL中容器迭代器的本質是類對象，其作用類似於資料庫中的遊標（cursor），除此之外迭代器也是一種設計模式。我們可以對它進行遞增（或選擇下一個）來訪問容器中的元素，而無需知道它內部是如何?的。其行為很像指標，都可以用來訪問指定的元素。但是二者是完全不同的東西，指標代表元素的記憶體位址，即對象在記憶體中的儲存位置，而迭代器則代表元素在容器中的相對位置。

要自訂一個迭代器，就要重載迭代器一些基本操作符：*（解引用）、++（自增）、==（等於）、!=（不等於）、=（賦值），以便它在range for語句中使用。range for是C++11中新增的語句，如我們對一個集合使用語句for （auto i : collection ）時，它的含義其實為：

for(auto __begin = collection.begin(),auto __end = collection.end();__begin!=__end;++__begin){     i = *__begin;    ...//迴圈體}

begin和end是集合的成員函數，它返回一個迭代器。如果讓一個類可以有range for的操作，它必須滿足以下幾條：
（1）擁有begin和end函數，它們均返回迭代器，其中end函數返回一個指向集合末尾，但是不包含末尾元素的值，即用集合範圍來表示，一個迭代器的範圍是 [ begin, end ）一個左閉右開區間。
（2）必須重載++、！=和解引用（*）運算子。迭代器看起來會像一個指標，但是不是指標。迭代器必須可以通過++最後滿足！=條件，這樣才能夠終止迴圈。

下面給出最簡單的實現代碼。我們定義一個CPPCollection類，裡面有個字串數組，我們讓它能夠通過range for將每個字串輸出來。

class CPPCollection {public:    //迭代器類    class Iterator    {    public:        int index;//元素下標        CPPCollection& outer;        Iterator(CPPCollection &o, int i):outer(o), index(i){}        void operator++()        {            index++;        }        std::string operator*() const        {            return outer.str[index];        }        bool operator!=(Iterator i)        {            return i.index!=index;        }    };public:    CPPCollection()    {        string strTemp[10]={"a", "b", "c", "d", "e", "f", "g", "h", "i", "j"};        int i=0;        for(auto strIt:strTemp)        {            str[i++]=strIt;        }    }    Iterator begin()    {        return Iterator(*this,0);    }    Iterator end()    {        return Iterator(*this, 10);    }private:    std::string str[10];};

我們定義了個內部的嵌套類Iterator,並為它重載了++、*、！=運算子。由於C++中的內部嵌套類與外圍的類沒有聯絡，為了訪問外部類對象的值，我們必須要傳入一個引用（或指標，本例中傳入引用）。Iterator的自增方法其實就是增加內部的一個索引值。判斷！=的方法是和另外一個迭代器做比較，這個迭代器一般是集合的末尾，當我們的索引值等於末尾的索引值end時，認為迭代器已經達到了末尾。在CPPCollection類中，定義了begin（）、end（）分別返回開頭、結束迭代器，調用如下代碼：

　　CPPCollection cpc;　　for (auto i : cpc)　　{    　　std::cout <<i<<std::endl;　　}　　//或者　　CPPCollection cpc;　　for(CPPCollection::Iterator i= cpc.begin();i!=cpc.end();++i)　　{        std::cout<<*i<<std::endl;   }

即可遍曆集合中的所有元素了。

在泛型演算法中，為了對集合中的每一個元素進行操作，我們通常要傳入集合的迭代器頭、迭代器尾，以及謂詞，例如std::find_if（vec.begin(),vec.end(),…），這種泛型演算法其實就是在迭代器的首位反覆迭代，然後運行相應的行為。

參考文獻

[1]編寫高品質代碼：改善C++程式的150個建議.李健.機械工業出版社.

C# 2.0 Specification(迭代器)（二）

C#中使用迭代器處理等待任務_基礎知識

C# 2.0 Specification(迭代器)（一）

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

聯繫我們

該頁面正文內容均來源於網絡整理，並不代表阿里雲官方的觀點，該頁面所提到的產品和服務也與阿里云無關，如果該頁面內容對您造成了困擾，歡迎寫郵件給我們，收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容，歡迎發送郵件至： info-contact@alibabacloud.com 進行舉報並提供相關證據，工作人員會在 5 個工作天內聯絡您，一經查實，本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More