什麼是泛型
我們在編寫程式時,經常遇到兩個模組的功能非常相似,只是一個是處理int資料,另一個是處理string資料,或者其他自訂的資料類型,但我們沒有辦法,只能分別寫多個方法處理每個資料類型,因為方法的參數類型不同。有沒有一種辦法,在方法中傳入通用的資料類型,這樣不就可以合并代碼了嗎。泛型的出現就是專門解決這個問題的。讀完本篇文章,你會對泛型有更深的瞭解。
為什麼要使用泛型
為了瞭解這個問題,我們先看下面的代碼,代碼省略了一些內容,但功能是實現一個棧,這個棧只能處理int資料類型:
public class Stack
{
private int[] m_item;
public int Pop(){...}
public void Push(int item){...}
public Stack(int i)
{
this.m_item = new int[i];
}
}
上面代碼啟動並執行很好,但是,當我們需要一個棧來儲存string類型時,該怎麼辦呢。很多人都會想到把上面的代碼複製一份,把int改成string不就行了。當然,這樣做本身是沒有任何問題的,但一個優秀的程式是不會這樣做的,因為他想到若以後再需要long、Node類型的棧該怎樣做呢。還要再複製嗎。優秀的程式員會想到用一個通用的資料類型object來實現這個棧:
public class Stack
{
private object[] m_item;
public object Pop(){...}
public void Push(object item){...}
public Stack(int i)
{
this.m_item = new[i];
}
}
這個棧寫的不錯,他非常靈活,可以接收任何資料類型,可以說是一勞永逸。但全面地講,也不是沒有缺陷的,主要表現在:
當Stack處理實值型別時,會出現裝箱、折箱操作,這將在託管堆上分配和回收大量的變數,若資料量大,則效能損失非常嚴重。
在處理參考型別時,雖然沒有裝箱和折箱操作,但將用到資料類型的強制轉換操作,增加處理器的負擔。
在資料類型的強制轉換上還有更嚴重的問題(假設stack是Stack的一個執行個體):
Node1 x = new Node1();
stack.Push(x);
Node2 y = (Node2)stack.Pop();
上面的代碼在編譯時間是完全沒問題的,但由於Push了一個Node1類型的資料,但在Pop時卻要求轉換為Node2類型,這將出現程式運行時的類型轉換異常,但卻逃離了編譯器的檢查。
針對object類型棧的問題,我們引入泛型,他可以優雅地解決這些問題。泛型用用一個通過的資料類型T來代替object,在類執行個體化時指定T的類型,運行時(Runtime)自動編譯為本地代碼,運行效率和代碼品質都有很大提高,並且保證資料類型安全。
使用泛型
下面是用泛型來重寫上面的棧,用一個通用的資料類型T來作為一個預留位置,等待在執行個體化時用一個實際的類型來代替。讓我們來看看泛型的威力:
public class Stack<T>
{
private T[] m_item;
public T Pop(){...}
public void Push(T item){...}
public Stack(int i)
{
this.m_item = new T[i];
}
}
類的寫法不變,只是引入了通用資料類型T就可以適用於任何資料類型,並且型別安全的。這個類的調用方法:
//執行個體化只能儲存int類型的類
Stack<int> a = new Stack<int>(100);
a.Push(10);
a.Push("8888"); //這一行編譯不通過,因為類a只接收int類型的資料
int x = a.Pop();
//執行個體化只能儲存string類型的類
Stack<string> b = new Stack<string>(100);
b.Push(10); //這一行編譯不通過,因為類b只接收string類型的資料
b.Push("8888");
string y = b.Pop();
這個類和object實現的類有截然不同的區別:
1. 他是型別安全的。執行個體化了int類型的棧,就不能處理string類型的資料,其他資料類型也一樣。
2. 無需裝箱和折箱。這個類在執行個體化時,按照所傳入的資料類型產生本地代碼,本地代碼資料類型已確定,所以無需裝箱和折箱。
3. 無需類型轉換。
泛型類執行個體化的理論
C#泛型類在編譯時間,先產生中間代碼IL,通用類型T只是一個預留位置。在執行個體化類時,根據使用者指定的資料類型代替T並由即時編譯器(JIT)產生本地代碼,這個本地代碼中已經使用了實際的資料類型,等同於用實際類型寫的類,所以不同的封閉類的本地代碼是不一樣的。按照這個原理,我們可以這樣認為:
泛型類的不同的封閉類是分別不同的資料類型。
例:Stack<int>和Stack<string>是兩個完全沒有任何關係的類,你可以把他看成類A和類B,這個解釋對泛型類的靜態成員的理解有很大協助。
泛型類中資料類型的約束
程式員在編寫泛型類時,總是會對通用資料類型T進行有意或無意地有假想,也就是說這個T一般來說是不能適應所有類型,但怎樣限制調用者傳入的資料類型呢。這就需要對傳入的資料類型進行約束,約束的方式是指定T的祖先,即繼承的介面或類。因為C#的單根繼承性,所以約束可以有多個介面,但最多隻能有一個類,並且類必須在介面之前。這時就用到了C#2.0的新增關鍵字:
public class Node<T, V> where T : Stack, IComparable
where V: Stack
{...}
以上的泛型類的約束表明,T必須是從Stack和IComparable繼承,V必須是Stack或從Stack繼承,否則將無法通過編譯器的類型檢查,編譯失敗。
通用類型T沒有特指,但因為C#中所有的類都是從object繼承來,所以他在類Node的編寫中只能調用object類的方法,這給程式的編寫造成了困難。比如你的類設計只需要支援兩種資料類型int和string,並且在類中需要對T類型的變數比較大小,但這些卻無法實現,因為object是沒有比較大小的方法的。 瞭解決這個問題,只需對T進行IComparable約束,這時在類Node裡就可以對T的執行個體執行CompareTo方法了。這個問題可以擴充到其他使用者自訂的資料類型。
如果在類Node裡需要對T重新進行執行個體化該怎麼辦呢。因為類Node中不知道類T到底有哪些建構函式。為瞭解決這個問題,需要用到new約束:
public class Node<T, V> where T : Stack, new()
where V: IComparable
需要注意的是,new約束只能是無參數的,所以也要求相應的類Stack必須有一個無參建構函式,否則編譯失敗。
C#中資料類型有兩大類:參考型別和實值型別。參考型別如所有的類,實值型別一般是語言的最基本類型,如int, long, struct等,在泛型的約束中,我們也可以大範圍地限制類型T必須是參考型別或必須是實值型別,分別對應的關鍵字是class和struct:
public class Node<T, V> where T : class
where V: struct
泛型方法
泛型不僅能作用在類上,也可單獨用在類的方法上,他可根據方法參數的類型自動適應各種參數,這樣的方法叫泛型方法。看下面的類:
public class Stack2
{
public void Push<T>(Stack<T> s, params T[] p)
{
foreach (T t in p)
{
s.Push(t);
}
}
}
原來的類Stack一次只能Push一個資料,這個類Stack2擴充了Stack的功能(當然也可以直接寫在Stack中),他可以一次把多個資料壓入Stack中。其中Push是一個泛型方法,這個方法的調用樣本如下:
Stack<int> x = new Stack<int>(100);
Stack2 x2 = new Stack2();
x2.Push(x, 1, 2, 3, 4, 6);
string s = "";
for (int i = 0; i < 5; i++)
{
s += x.Pop().ToString();
} //至此,s的值為64321
泛型中的靜態成員變數
在C#1.x中,我們知道類的靜態成員變數在不同的類執行個體間是共用的,並且他是通過類名訪問的。C#2.0中由於引進了泛型,導致靜態成員變數的機制出現了一些變化:靜態成員變數在相同封閉類間共用,不同的封閉類間不共用。
這也非常容易理解,因為不同的封閉類雖然有相同的類名稱,但由於分別傳入了不同的資料類型,他們是完全不同的類,比如:
Stack<int> a = new Stack<int>();
Stack<int> b = new Stack<int>();
Stack<long> c = new Stack<long>();
類執行個體a和b是同一類型,他們之間共用靜態成員變數,但類執行個體c卻是和a、b完全不同的類型,所以不能和a、b共用靜態成員變數。
泛型中的靜態建構函式
靜態建構函式的規則:只能有一個,且不能有參數,他只能被.NET運行時自動調用,而不能人工調用。
泛型中的靜態建構函式的原理和非泛型類是一樣的,只需把泛型中的不同的封閉類理解為不同的類即可。以下兩種情況可激發靜態建構函式:
1. 特定的封閉類第一次被執行個體化。
2. 特定封閉類中任一靜態成員變數被調用。
泛型類中的方法重載
方法的重載在.Net Framework中被大量應用,他要求重載具有不同的簽名。在泛型類中,由於通用類型T在類編寫時並不確定,所以在重載時有些注意事項,這些事項我們通過以下的例子說明:
public class Node<T, V>
{
public T add(T a, V b) //第一個add
{
return a;
}
public T add(V a, T b) //第二個add
{
return b;
}
public int add(int a, int b) //第三個add
{
return a + b;
}
}
上面的類很明顯,如果T和V都傳入int的話,三個add方法將具有同樣的簽名,但這個類仍然能通過編譯,是否會引起調用混淆將在這個類執行個體化和調用add方法時判斷。請看下面調用代碼:
Node<int, int> node = new Node<int, int>();
object x = node.add(2, 11);
這個Node的執行個體化引起了三個add具有同樣的簽名,但卻能調用成功,因為他優先匹配了第三個add。但如果刪除了第三個add,上面的調用代碼則無法編譯通過,提示方法產生的混淆,因為運行時無法在第一個add和第二個add之間選擇。
Node<string, int> node = new Node<string, int>();
object x = node.add(2, "11");
這兩行調用代碼可正確編譯,因為傳入的string和int,使三個add具有不同的簽名,當然能找到唯一匹配的add方法。