STL有許多比較對象是否有同樣的值的情況。比如,當你用find來定位區間中第一個有特定值的對象的位置,find必須可以比較兩個對象,看看一個的值是否與另一個相等。(operator==)。
同樣,當你嘗試向set中插入一個新元素時,set::insert必須可以判斷那個元素的值是否已經在set中了。find演算法和set的insert成員函數是很多必須判斷兩個值是否相同的函數的代表。但它們以不同的方式完成,find對“相同”的定義是相等,基於operator==。set::insert對“相同”的定義是等價,通常基於operator<。因為定義不同,所以有可能一個定義判定兩個對象有相同的值而另一個定義判定它們沒有。所以,如果你想有效使用STL,那麼你必須明白相等(==)和等價(equal)的區別。
從操作上來說,相等的概念是基於operator==的。如果運算式“x == y”返回true,x和y有相等的值,否則它們沒有。這很直截了當,但要牢牢記住,因為x和y有相等的值並不意味著所有它們的成員有相等的值。比如,我們可能有一個內部記錄了最後一次訪問的Widget類。
class Widget {
public:
...
private:
TimeStamp lastAccessed;
...
};
我們可以有一個用於Widget的忽略這個域的operator==:
bool operator==(const Widget& lhs, const Widget& rhs) {
// 忽略lastAccessed域的代碼
}
在這裡,兩個Widget即使它們的lastAccessed域不同也可以有相等的值。
等價是基於在一個有序區間中對象值的相對位置。等價一般在每種標準關聯容器(比如,set、multiset、map和multimap)的一部分——排序次序方面有意義。兩個對象x和y如果在關聯容器c的排序次序中沒有哪個排在另一個之前,那麼它們關於c使用的排序次序有等價的值。這聽起來很複雜,實際上卻不。考慮一下,舉一個例子,一個set<Widget> s。兩個Widget w1和w2,如果在s的排序次序中沒有哪個在另一個之前,那麼關於s它們有等價的值。set<Widget>的預設比較函數是less<Widget>,而預設的less<Widget>簡單地對Widget調用operator<,所以w1和w2關於operator<有等價的值如果下面運算式為真:
!(w1 < w2)// w1 < w2時它非真&&// 而且!(w2<w1)// w2 < w1時它非真
這個有意義:兩個值如果沒有哪個在另一個之前(關於某個排序標準),那麼它們等價(按照那個標準)。
在一般情況下,用於關聯容器的比較函數不是operator<或甚至less,它是使用者定義的判斷式。(關於判斷式的更多資訊參見條款39。)每個標準關聯容器通過它的key_comp成員函數來訪問排序判斷式,所以如果下式求值為真,兩個對象x和y關於一個關聯容器c的排序標準有等價的值:
!c.key_comp()(x, y) && !c.key_comp()(y, x)// 在c的排序次序中// 如果x在y之前它非真,// 同時在c的排序次序中// 如果y在x之前它非真
運算式!c.key_comp()(x, y)看起來很醜陋,但一旦你知道c.key_comp()返回一個函數(或一個函數對象),醜陋就消散了。!c.key_comp()(x, y)只不過是調用key_comp返回的函數(或函數對象),並把x和y作為實參。然後對結果取反,c.key_comp()(x, y)僅當在c的排序次序中x在y之前時返回真,所以!c.key_comp()(x, y)僅當在c的排序次序中x不在y之前時為真。
要完全領會相等和等價的含義,考慮一個忽略大小寫set<string>,也就是set的比較函數忽略字串中字元大小寫set<string>。這樣的比較函數會認為“STL”和“stL”是等價的。條款35示範了怎麼實現一個函數,ciStringCompare,它進行了忽略大小寫比較,但set要一個比較函數的類型,不是真的函數。要天平這個鴻溝,我們寫一個operator()調用了ciStringCompare的仿函數類:
struct CIStringCompare:// 用於忽略大小寫public// 字串比較的類;binary_function<string, string, bool> {// 關於這個基類的資訊// 參見條款40bool operator()(const string& lhs,const string& rhs) const{return ciStringCompare(lhs, rhs);// 關於ciStringCompare}// 是怎麼實現的參見條款35}
給定CIStringCompare,要建立一個忽略大小寫set<string>就很簡單了:
set<string, CIStringCompare> ciss;// ciss = “case-insensitive// string set”
如果我們向這個set中插入“Persephone”和“persephone”,只有第一個字串加入了,因為第二個等價於第一個:
ciss.insert("Persephone");// 一個新元素添加到set中ciss.insert("persephone");// 沒有新元素添加到set中
如果我們現在使用set的find成員函數搜尋字串“persephone”,搜尋會成功,
if (ciss.find("persephone") != ciss.end())...// 這個測試會成功
但如果我們用非成員的find演算法,搜尋會失敗:
if (find(ciss.begin(), ciss.end(),"persephone") != ciss.end())...// 這個測試會失敗
那是因為“persephone”等價於“Persephone”(關於比較仿函數CIStringCompare),但不等於它(因為string("persephone") != string("Persephone"))。這個例子示範了為什麼你應該跟隨條款44的建議優先選擇成員函數(就像set::find)而不是非成員兄弟(就像find)的一個理由。
你可能會奇怪為什麼標準關聯容器是基於等價而不是相等。畢竟,大多數程式員對相等有感覺而缺乏等價的感覺。(如果不是這樣,那就不需要本條款了。)答案乍看起來很簡單,但你看得越近,就會發現越多問題。
標準關聯容器保持有序,所以每個容器必須有一個定義了怎麼保持東西有序的比較函數(預設是less)。等價是根據這個比較函數定義的,所以標準關聯容器的使用者只需要為他們要使用的任意容器指定一個比較函數(決定排序次序的那個)。如果關聯容器使用相等來決定兩個對象是否有相同的值,那麼每個關聯容器就需要,除了它用於排序的比較函數,還需要一個用於判斷兩個值是否相等的比較函數。(預設的,這個比較函數大概應該是equal_to,但有趣的是equal_to從沒有在STL中用做預設比較函數。當在STL中需要相等時,習慣是簡單地直接調用operator==。比如,這是非成員find演算法所作的。)
讓我們假設我們有一個類似set的STL容器叫做set2CF,“set with two comparison functions”。第一個比較函數用來決定set的排序次序,第二個用來決定是否兩個對象有相同的值。現在考慮這個set2CF:
set2CF<string, CIStringCompare, equal_to<string> > s;
在這裡,s內部排序它的字串時不考慮大小寫,等價標準直覺上是這樣:如果兩個字串中一個等於另一個,那麼它們有相同的值。讓我們向s中插入哈迪斯強娶的新娘(Persephone)的兩個拼字:
s.insert("Persephone");s.insert("persephone");
著該怎麼辦?如果我們說"Persephone" != "persephone"然後兩個都插入s,它們應該是什麼順序?記住排序函數不能分別告訴它們。我們可以以任意順序插入,因此放棄以確定的順序遍曆set內容的能力嗎?(不能已確定的順序遍曆關聯容器元素已經折磨著multiset和multimap了,因為標準沒有規定等價的值(對於multiset)或鍵(對於multimap)的相對順序。)或者我們堅持s的內容的一個確定順序並忽略第二次插入的嘗試(“persephone”的那個)? 如果我們那麼做,這裡會發生什嗎?
if (s.find("persephone") != s.end())...// 這個測試成功或失敗?
大概find使用了等價檢查,但如果我們為了維護s中元素的一個確定順序而忽略了第二個insert的調用,這個find會失敗,即使“persephone”的插入由於它是一個重複的值的原則而被忽略!
總之,通過只使用一個比較函數並使用等價作為兩個值“相等”的意義的仲裁者,標準關聯容器避開了很多會由允許兩個比較函數而引發的困難。一開始行為可能看起來有些奇怪(特別是當你發現成員和非成員find可能返回不同結果),但最後,它避免了會由在標準關聯容器中混用相等和等價造成的混亂。
有趣的是,一旦你離開有序的關聯容器的領域,情況就變了,相等對等價的問題會——已經——重臨了。有兩個基於散列表的非標準(但很常見)關聯容器的一般設計。一個設計是基於相等,而另一個是基於等價。我鼓勵你轉到條款25去學更多這樣的容器和設計以決定該用哪個。