C#中的類型轉換
最後更新:2017-02-28
來源:互聯網
上載者:User
轉換 C# 出來也有些日子了,最近由於編程的需要,對 C# 的類型轉換做了一些研究,其內容涉及 C# 的裝箱/拆箱/別名、數實值型別間相互轉換、字元的 ASCII 碼和 Unicode 碼、數值字串和數值之間的轉換、字串和字元數組/位元組數組之間的轉換、各種數實值型別和位元組數組之間的轉換、十六進位數輸出以及日期型資料的一些轉換處理,在這裡與大家分享——
1. 裝箱、拆箱還是別名
許多 C#.NET 的書上都有介紹 int -> Int32 是一個裝箱的過程,反之則是拆箱的過程。許多其它變數類型也是如此,如:short <-> Int16,long <-> Int64 等。對於一般的程式員來說,大可不必去瞭解這一過程,因為這些裝箱和拆箱的動作都是可以自動完成的,不需要寫代碼進行幹預。但是我們需要記住這些類型之間的關係,所以,我們使用“別名”來記憶它們之間的關係。
C# 是全物件導向的語言,比 Java 的物件導向都還徹底——它把單一資料型別通過預設的裝箱動作封裝成了類。Int32、Int16、Int64 等就是相應的類名,而那些我們熟悉的、簡單易記的名稱,如 int、short、long 等,我們就可以把它稱作是 Int32、Int16、Int64 等類型的別名。
那麼除了這三種類型之外,還有哪些類有“別名”呢?常用的有如下一些:
bool -> System.Boolean (布爾型,其值為 true 或者 false)
char -> System.Char (字元型,佔有兩個位元組,表示 1 個 Unicode 字元)
byte -> System.Byte (位元組型,占 1 位元組,表示 8 位正整數,範圍 0 ~ 255)
sbyte -> System.SByte (帶符號位元組型,占 1 位元組,表示 8 位整數,範圍 -128 ~ 127)
ushort -> System.UInt16 (無符號短整型,占 2 位元組,表示 16 位正整數,範圍 0 ~ 65,535)
uint -> System.UInt32 (無符號整型,占 4 位元組,表示 32 位正整數,範圍 0 ~ 4,294,967,295)
ulong -> System.UInt64 (無符號長整型,占 8 位元組,表示 64 位元正整數,範圍 0 ~ 大約 10 的 20 次方)
short -> System.Int16 (短整型,占 2 位元組,表示 16 位整數,範圍 -32,768 ~ 32,767)
int -> System.Int32 (整型,占 4 位元組,表示 32 位整數,範圍 -2,147,483,648 到 2,147,483,647)
long -> System.Int64 (長整型,占 8 位元組,表示 64 位元整數,範圍大約 -(10 的 19) 次方 到 10 的 19 次方)
float -> System.Single (單精確度浮點型,占 4 個位元組)
double -> System.Double (雙精確度浮點型,占 8 個位元組)
我們可以用下列代碼做一個實驗:
private void TestAlias() {
// this.textBox1 是一個文字框,類型為 System.Windows.Forms.TextBox
// 設計中已經將其 Multiline 屬性設定為 true
byte a = 1; char b = 'a'; short c = 1;
int d = 2; long e = 3; uint f = 4; bool g = true;
this.textBox1.Text = "";
this.textBox1.AppendText("byte -> " + a.GetType().FullName + "\n");
this.textBox1.AppendText("char -> " + b.GetType().FullName + "\n");
this.textBox1.AppendText("short -> " + c.GetType().FullName + "\n");
this.textBox1.AppendText("int -> " + d.GetType().FullName + "\n");
this.textBox1.AppendText("long -> " + e.GetType().FullName + "\n");
this.textBox1.AppendText("uint -> " + f.GetType().FullName + "\n");
this.textBox1.AppendText("bool -> " + g.GetType().FullName + "\n");
}
在表單中建立一個按鈕,並在它的單擊事件中調用該 TestAlias() 函數,我們將看到運行結果如下:
byte -> System.Byte
char -> System.Char
short -> System.Int16
int -> System.Int32
long -> System.Int64
uint -> System.UInt32
bool -> System.Boolean
這足以說明各別名對應的類!
2. 數實值型別之間的相互轉換
這裡所說的數實值型別包括 byte, short, int, long, fload, double 等,根據這個排列順序,各種類型的值依次可以向後自動進行轉換。舉個例來說,把一個 short 型的資料賦值給一個 int 型的變數,short 值會自動行轉換成 int 型值,再賦給 int 型變數。如下例:
private void TestBasic() {
byte a = 1; short b = a; int c = b;
long d = c; float e = d; double f = e;
this.textBox1.Text = "";
this.textBox1.AppendText("byte a = " + a.ToString() + "\n");
this.textBox1.AppendText("short b = " + b.ToString() + "\n");
this.textBox1.AppendText("int c = " + c.ToString() + "\n");
this.textBox1.AppendText("long d = " + d.ToString() + "\n");
this.textBox1.AppendText("float e = " + e.ToString() + "\n");
this.textBox1.AppendText("double f = " + f.ToString() + "\n");
}
譯順利通過,運行結果是各變數的值均為 1;當然,它們的類型分別還是 System.Byte 型……System.Double 型。現在我們來試試,如果把賦值的順序反過來會怎麼樣呢?在 TestBasic() 函數中追加如下語句:
int g = 1;
short h = g;
this.textBox1.AppendText("h = " + h.ToString() + "\n");
結果編譯報錯:
G:\Projects\Visual C#\Convert\Form1.cs(118): 無法將類型“int”隱式轉換為“short”
其中,Form1.cs 的 118 行即 short h = g 所在行。
這個時候,如果我們堅持要進行轉換,就應該使用強制類型轉換,這在 C 語言中常有提及,就是使用“(類型名) 變數名”形式的語句來對資料進行強制轉換。如上例修改如下:
short g = 1;
byte h = (byte) g; // 將 short 型的 g 的值強制轉換成 short 型後再賦給變數 h
this.textBox1.AppendText("h = " + h.ToString() + "\n");
編譯通過,運行結果輸出了 h = 1,轉換成功。
但是,如果我們使用強制轉換,就不得不再考慮一個問題:short 型的範圍是 -32768 ~ 23767,而 byte 型的範圍是 0 ~ 255,那麼,如果變數 g 的大小超過了 byte 型的範圍又會出現什麼樣的情況呢?我們不妨再一次改寫代碼,將值改為 265,比 255 大 10
short g = 265; //265 = 255 + 10
byte h = (byte) g;
this.textBox1.AppendText("h = " + h.ToString() + "\n");
編譯沒有出錯,運行結果卻不是 h = 265,而是 h = 9。
因此,我們在進行轉換的時候,應當注意被轉換的資料不能超出目標類型的範圍。這不僅體現在多位元組資料類型(相對,如上例的 short) 轉換為少位元組類型(相對,如上例的 byte) 時,也體現在位元組數相同的有符號類型和無符號類型之間,如將 byte 的 129 轉換為 sbyte 就會溢出。這方面的例子大同小異,就不詳細說明了。
3. 字元的 ASCII 碼和 Unicode 碼
很多時候我們需要得到一個英文字元的 ASCII 碼,或者一個漢字字元的 Unicode 碼,或者從相關的編碼查詢它是哪一個字元的編碼。很多人,尤其是從 VB 程式序轉過來學 C# 的人,會報怨 C# 裡為什麼沒有提供現成的函數來做這個事情——因為在 VB 中有 Asc() 函數和 Chr() 函數用於這類轉換。
但是如果你學過 C,你就會清楚,我們只需要將英文字元型資料強制轉換成合適的數值型資料,就可以得到相應的 ASCII 碼;反之,如果將一個合適的數值型資料強制轉換成字元型資料,就可以得到相應的字元。
C# 中字元的範圍擴大了,不僅包含了單位元組字元,也可以包含雙位元組字元,如中文字元等。而在字元和編碼之間的轉換,則仍延用了 C 語言的做法——強制轉換。不妨看看下面的例子
private void TestChar() {
char ch = 'a'; short ii = 65;
this.textBox1.Text = "";
this.textBox1.AppendText("The ASCII code of \'" + ch + "\' is: " + (short) ch + "\n");
this.textBox1.AppendText("ASCII is " + ii.ToString() + ", the char is: " + (char) ii + "\n");
char cn = '中'; short uc = 22478;
this.textBox1.AppendText("The Unicode of \'" + cn + "\' is: " + (short) cn + "\n");
this.textBox1.AppendText("Unicode is " + uc.ToString() + ", the char is: " + (char) uc + "\n");
}
它的運行結果是
The ASCII code of 'a' is: 97
ASCII is 65, the char is: A
The Unicode of '中' is: 20013
Unicode is 22478, the char is: 城
從這個例子中,我們便能非常清楚的瞭解——通過強制轉換,可以得以字元的編碼,或者得到編碼錶示的字元。如果你需要的不是 short 型的編碼,請參考第 1 條進行轉換,即可得到 int 等類型的編碼值。
4. 數值字串和數值之間的轉換
首先,我們得搞明白,什麼是數值字串。我們知道,在 C# 中,字串是用一對雙引號包含的若干字元來表示的,如 "123"。而 "123" 又相對特殊,因為組成該字串的字元都是數字,這樣的字串,就是數值字串。在我們的眼中,這即是一串字元,也是一個數,但電腦卻只認為它是一個字串,不是數。因此,我們在某些時候,比如輸入數值的時候,把字串轉換成數值;而在另一些時候,我們需要相反的轉換。
將數值轉換成字串非常簡單,因為每一個類都有一個 void ToString() 方法。所有數值型的 void ToString() 方法都能將資料轉換為數值字串。如 123.ToSting() 就將得到字串 "123"。
那麼反過來,將數值型字串轉換成數值又該怎麼辦呢?我們仔細尋找一下,會發現 short, int, float 等數實值型別均有一個 static Parse() 函數。這個函數就是用來將字串轉換為相應數值的。我們以一個 float 類型的轉換為例: float f = float.Parse("543.21"); 其結果 f 的值為 543.21F。當然,其它的數實值型別也可以使用同樣的方法進行轉換,下面的例子可以更明確的說明轉換的方法:
private void TestStringValue() {
float f = 54.321F;
string str = "123";
this.textBox1.Text = "";
this.textBox1.AppendText("f = " + f.ToString() + "\n");
if (int.Parse(str) == 123) {
this.textBox1.AppendText("str convert to int successfully.");
} else {
this.textBox1.AppendText("str convert to int failed.");
}
}
運行結果:
f = 54.321
str convert to int successfully.
5. 字串和字元數組之間的轉換
字串類 System.String 提供了一個 void ToCharArray() 方法,該方法可以實現字串到字元數組的轉換。如下例:
private void TestStringChars() {
string str = "mytest";
char[] chars = str.ToCharArray();
this.textBox1.Text = "";
this.textBox1.AppendText("Length of \"mytest\" is " + str.Length + "\n");
this.textBox1.AppendText("Length of char array is " + chars.Length + "\n");
this.textBox1.AppendText("char[2] = " + chars[2] + "\n");
}
例中以對轉換轉換到的字元數組長度和它的一個元素進行了測試,結果如下:
Length of "mytest" is 6
Length of char array is 6
char[2] = t
可以看出,結果完全正確,這說明轉換成功。那麼反過來,要把字元數群組轉換成字串又該如何呢?
我們可以使用 System.String 類的建構函式來解決這個問題。System.String 類有兩個建構函式是通過字元數組來構造的,即 String(char[]) 和 String[char[], int, int)。後者之所以多兩個參數,是因為可以指定用字元數組中的哪一部分來構造字串。而前者則是用字元數組的全部元素來構造字串。我們以前者為例,在 TestStringChars() 函數中輸入如下語句:
char[] tcs = {'t', 'e', 's', 't', ' ', 'm', 'e'};
string tstr = new String(tcs);
this.textBox1.AppendText("tstr = \"" + tstr + "\"\n");
運行結果輸入 tstr = "test me",測試說明轉換成功。
實際上,我們在很多時候需要把字串轉換成字元數組只是為了得到該字串中的某個字元。如果只是為了這個目的,那大可不必興師動眾的去進行轉換,我們只需要使用 System.String 的 [] 運算子就可以達到目的。請看下例,再在 TestStringChars() 函數中加入如如下語名:
char ch = tstr[3];
this.textBox1.AppendText("\"" + tstr + "\"[3] = " + ch.ToString());
正確的輸出是 "test me"[3] = t,經測試,輸出正確。
6. 字串和位元組數組之間的轉換
如果還想從 System.String 類中找到方法進行字串和位元組數組之間的轉換,恐怕你會失望了。為了進行這樣的轉換,我們不得不藉助另一個類:System.Text.Encoding。該類提供了 bye[] GetBytes(string) 方法將字串轉換成位元組數組,還提供了 string GetString(byte[]) 方法將位元組數群組轉換成字串。
System.Text.Encoding 類似乎沒有可用的建構函式,但我們可以找到幾個預設的 Encoding,即 Encoding.Default(擷取系統的當前 ANSI 字碼頁的編碼)、Encoding.ASCII(擷取 7 位 ASCII 字元集的編碼)、Encoding.Unicode(擷取採用 Little-Endian 位元組順序的 Unicode 格式的編碼)、Encoding.UTF7(擷取 UTF-7 格式的編碼)、Encoding.UTF8(擷取 UTF-8 格式的編碼) 等。這裡主要說說 Encoding.Default 和 Encoding.Unicode 用於轉換的區別。
在字串轉換到位元組數組的過程中,Encoding.Default 會將每個單位元組字元,如半形英文,轉換成 1 個位元組,而把每個雙位元組字元,如漢字,轉換成 2 個位元組。而 Encoding.Unicode 則會將它們都轉換成兩個位元組。我們可以通過下列簡單的瞭解一下轉換的方法,以及使用 Encoding.Default 和 Encodeing.Unicode 的區別:
private void TestStringBytes() {
string s = "C#語言";
byte[] b1 = System.Text.Encoding.Default.GetBytes(s);
byte[] b2 = System.Text.Encoding.Unicode.GetBytes(s);
string t1 = "", t2 = "";
foreach (byte b in b1) {
t1 += b.ToString("") + " ";
}
foreach (byte b in b2) {
t2 += b.ToString("") + " ";
}
this.textBox1.Text = "";
this.textBox1.AppendText("b1.Length = " + b1.Length + "\n");
this.textBox1.AppendText(t1 + "\n");
this.textBox1.AppendText("b2.Length = " + b2.Length + "\n");
this.textBox1.AppendText(t2 + "\n");
}
運行結果如下,不說詳述,相信大家已經明白了。
b1.Length = 6
67 35 211 239 209 212
b2.Length = 8
67 0 35 0 237 139 0 138
將位元組數群組轉換成字串,使用 Encoding 類的 string GetString(byte[]) 或 string GetString(byte[], int, int) 方法,具體使用何種 Encoding 還是由編碼決定。在 TestStringBytes() 函數中添加如下語句作為執行個體:
byte[] bs = {97, 98, 99, 100, 101, 102};
string ss = System.Text.Encoding.ASCII.GetString(bs);
this.textBox1.AppendText("The string is: " + ss + "\n");
運行結果為:The string is: abcdef
7. 各種數實值型別和位元組數組之間的轉換
在第 1 條中我們可以查到各種數值型需要使用多少位元組的空間來儲存資料。將某種數實值型別的資料轉換成位元組數組的時候,得到的一定是相應大小的位元組數組;同樣,需要把位元組數群組轉換成數實值型別,也需要這個位元組數組大於相應數實值型別的位元組數。
現在介紹此類轉換的主角:System.BitConverter。該類提供了 byte[] GetBytes(...) 方法將各種數實值型別轉換成位元組數組,也提供了 ToInt32、ToInt16、ToInt64、ToUInt32、ToSignle、ToBoolean 等方法將位元組數群組轉換成相應的數實值型別。
由於這類轉換通常只是在需要進行較細微的編碼/解碼操作時才會用到,所以這裡就不詳細敘述了,僅把 System.BitConverter 類介紹給大家。
8. 轉換成十六進位
任何資料在電腦內部都是以二進位儲存的,所以進位與資料的儲存無關,只與輸入輸出有關。所以,對於進位轉換,我們只關心字串中的結果。
在上面的第 4 條中提到了 ToString() 方法可以將數值轉換成字串,不過在字串中,結果是以十進位顯示的。現在我們帶給它加一些參數,就可以將其轉換成十六進位——使用 ToString(string) 方法。
這裡需要一個 string 類型的參數,這就是格式說明符。十六進位的格式說明符是 "x" 或者 "X",使用這兩種格式說明符的區別主要在於 A-F 六個數字:"x" 代表 a-f 使用小寫字母表示,而 "X" 而表示 A-F 使用大字字母表示。如下例:
private void TestHex() {
int a = 188;
this.textBox1.Text = "";
this.textBox1.AppendText("a(10) = " + a.ToString() + "\n");
this.textBox1.AppendText("a(16) = " + a.ToString("x") + "\n");
this.textBox1.AppendText("a(16) = " + a.ToString("X") + "\n");
}
運行結果如下:
a(10) = 188
a(16) = bc
a(16) = BC
這時候,我們可能有另一種需求,即為了顯示結果的整齊,我們需要控制十六進位表示的長度,如果長度不夠,用前置的 0 填補。解決這個問題,我們只需要在格式說明符“x”或者“X”後寫上表示長度的數字就行了。比如,要限制在 4 個字元的長度,可以寫成“X4”。在上例中追加一句:
this.textBox1.AppendText("a(16) = " + a.ToString("X4") + "\n");
其結果將輸出 a(16) = 00BC。
現在,我們還要說一說如何將一個表示十六進位數的字串轉換成整型。這一轉換,同樣需要藉助於 Parse() 方法。這裡,我需要 Parse(string, System.Globalization.NumberStyles) 方法。第一個參數是表示十六進位數的字串,如“AB”、“20”(表示十進位的 32) 等。第二個參數 System.Globalization.NumberStyles 是一個枚舉類型,用來表示十六進位的枚舉值是 HexNumber。因此,如果我們要將“AB”轉換成整型,就應該這樣寫:int b = int.Parse("AB", System.Globalization.NumberStyles.HexNumber),最後得到的 b 的值是 171。
9. 日期型資料和長整型資料之間的轉換
為什麼要將日期型資料轉換為長整型資料呢?原因很多,但就我個人來說,經常將它用於資料庫的日期儲存。由於各種資料庫對日期型的定義和處理是不一樣的,各種語言對日期型資料的定義的處理也各不相同,因為,我寧願將日期型資料轉換成長整型再儲存到資料庫中。雖然也可以使用字串來儲存,但使用字串也會涉及到許多問題,如地區等問題,而且,它需要比儲存長整型資料更多的空間。
日期型資料,在 C# 中的參與運算的時候,應該也是轉換為長整型資料來運算的。它的長整型值是自 0001 年 1 月 1 日午夜 12:00 以來所經過時間以 100 毫微秒為間隔表示時的數字。這個數在 C# 的 DateTime 中被稱為 Ticks(刻度)。DateTime 類型有一個名為 Ticks 的長整型唯讀屬性,就儲存著這個值。如此,要從一個 DataTime 型資料得到 long 型值就非常簡單了,只需要讀出 DataTime 對象的 Ticks 值即可,如:
long longDate = DateTime.Now.Ticks;
DateTime 的建構函式中也提供了相應的,從長整型資料構造 DateTime 型資料的函數:DateTime(long)。如:
DateTime theDate = new DateTime(longDate);
但這樣對於很多 VB6 程式員來說,是給他們出了一道難題,因為 VB6 中的日期型資料內部是以 Double 型表示的,將其轉換為長整型後得到的僅僅是日期,而沒有時間。如何協調這兩種日期類型呢?
System.DateTime 提供了 double ToOADate() 和 static DateTime FromOADate(double) 兩個函數來解決這個問題。前者將當前對象按原來的 double 值輸出,後者則從一個 double 值獲得一個 System.DateTime 對象。舉例如下:
private void TestDateTimeLong() {
double doubleDate = DateTime.Now.ToOADate();
DateTime theDate = DateTime.FromOADate(doubleDate);
this.textBox1.Text = "";
this.textBox1.AppendText("Double value of now: " + doubleDate.ToString() + "\n");
this.textBox1.AppendText("DateTime from double value: " + theDate.ToString() + "\n");
}
運行結果:
Double value of now: 37494.661541713
DateTime from double value: 2002-8-26 15:52:37
10. 格式化日期型資料
編程的過程中,通常需要將日期型資料按照一定的格式輸出,當然,輸出結果肯定是字串。為此,我們需要使用 System.DateTime 類的 ToString() 方法,並為其指定格式字串。
MSDN 中,System.Globalization.DateTimeFormatInfo 類的概述裡對模式字串有非常詳細的說明,因此,這裡我只對常用的一些格式進行說明,首先請看下錶:
d 月中的某一天 一位元的日期沒有前置字元為零
dd 月中的某一天 一位元的日期有一個前置字元為零
ddd 周中某天的縮寫名稱 在 AbbreviatedDayNames 中定義
dddd 周中某天的完整名稱 在 DayNames 中定義
M 月份數字 一位元的月份沒有前置字元為零
MM 月份數字 一位元的月份有一個前置字元為零
MMM 月份的縮寫名稱 在 AbbreviatedMonthNames 中定義
MMMM 月份的完整名稱 在 MonthNames 中定義
y 不包含紀元的年份 如果不包含紀元的年份小於 10,則顯示不具有前置字元為零的年份
yy 不包含紀元的年份 如果不包含紀元的年份小於 10,則顯示具有前置字元為零的年份
yyyy 包括紀元的四位元的年份
h 12 小時制的小時 一位元的小時數沒有前置字元為零
hh 12 小時制的小時 一位元的小時數有前置字元為零
H 24 小時制的小時 一位元的小時數沒有前置字元為零
HH 24 小時制的小時 一位元的小時數有前置字元為零
m 分鐘 一位元的分鐘數沒有前置字元為零
mm 分鐘 一位元的分鐘數有一個前置字元為零
s 秒 一位元的秒數沒有前置字元為零
ss 秒 一位元的秒數有一個前置字元為零
為了便於大家的理解,不妨試試下面的程式:
private void TestDateTimeToString() {
DateTime now = DateTime.Now;
string format;
this.textBox1.Text = "";
format = "yyyy-MM-dd HH:mm:ss";
this.textBox1.AppendText(format + ": " + now.ToString(format) + "\n");
format = "yy年M日d日";
this.textBox1.AppendText(format + ": " + now.ToString(format) + "\n");
}
這段程式將輸出結果:
yyyy-MM-dd HH:mm:ss: 2002-08-26 17:03:04
yy年M日d日: 02年8日26日
這時候,又出現一個問題,如果要輸出的文本資訊中包含格式字元怎麼辦?如
format = "year: yyyy, month: MM, day: dd";
this.textBox1.AppendText(now.ToString(format) + "\n");
將輸出:
2ear: 2002, 4on下5: 08, 26a2: 26
這並不是我想要的結果,怎麼辦呢?有辦法——
format = "\"year\": yyyy, \'month\': MM, \'day\': dd";
this.textBox1.AppendText(now.ToString(format) + "\n");
看,這次運行結果對了:
year: 2002, month: 08, day: 26
可以看出,只需要使用單引號或者雙引號將文本資訊括起來就好。