在上一篇文章中,我介紹了如何用C#對檔案移動、複製與刪除。在本文中,我再介紹一下如何用C#來對文字檔進行讀寫。
電腦在最初只支援ASCII編碼,但是後來為了支援其他語言中的字元(比如漢字)以及一些特殊字元(比如€),就引入了Unicode字元集。基於Unicode字元集的編碼方式有很多,比如UTF-7、UTF-8、Unicode以及UTF-32。在Windows作業系統中,一個文字檔的前幾個位元組是用來指定該檔案的編碼方式的。如果你使用NotePad或WordPad來開啟一個文字檔,你並不用擔心該檔案的編碼方式,因為這些應用程式會先讀取檔案的前幾個位元組來確定該檔案的編碼方式,然後用正確的編碼將文本中的每個字元顯示出來。下面的圖中,可以看到當用NotePad記事本儲存一個文檔時,可以選擇的編碼(Encoding)方式有哪些。
用.Net讀取文字檔或寫入文字檔,你都不須要擔心編碼方式。.Net已經將這些封裝好了。在讀取一個文字檔的時候,如果你已經知道文本使用的是什麼編碼方式,你可以指定使用哪種編碼方式讀取文本,否則如果不指定編碼方式,.Net會讀取文本的前幾個位元組來確定使用哪種編碼方式讀取檔案內容的。在寫入文字檔的時候,你也可以指定你想使用的編碼方式。如果你沒有指定編碼,.Net會根據寫入的文本是否含有特殊字元來決定編碼方式。如果沒有特殊字元,就採用ASCII編碼,如果有特殊字元,就採用UTF-8編碼。
(一) 讀取檔案
如果你要讀取的檔案內容不是很多,可以使用 File.ReadAllText(FilePath) 或指定編碼方式 File.ReadAllText(FilePath, Encoding)的方法。它們都一次將常值內容全部讀完,並返回一個包含全部常值內容的字串
string str = File.ReadAllText(@"c:\temp\ascii.txt"); // 也可以指定編碼方式 string str2 = File.ReadAllText(@"c:\temp\ascii.txt", Encoding.ASCII);
也可以使用方法File.ReadAllLines。該方法返回一個字串數組。每一行都是一個數組元素。
string[] strs = File.ReadAllLines(@"c:\temp\ascii.txt"); // 也可以指定編碼方式 string[] strs2 = File.ReadAllLines(@"c:\temp\ascii.txt", Encoding.ASCII);
當文本的內容比較大時,我們就不要將常值內容一次讀完,而應該採用流(Stream)的方式來讀取內容。.Net為我們封裝了StreamReader類。初始化StreamReader類有很多種方式。下面我羅列出幾種
StreamReader sr1 = new StreamReader(@"c:\temp\utf-8.txt"); // 同樣也可以指定編碼方式 StreamReader sr2 = new StreamReader(@"c:\temp\utf-8.txt", Encoding.UTF8);FileStream fs = new FileStream(@"C:\temp\utf-8.txt", FileMode.Open, FileAccess.Read, FileShare.None); StreamReader sr3 = new StreamReader(fs); StreamReader sr4 = new StreamReader(fs, Encoding.UTF8);FileInfo myFile = new FileInfo(@"C:\temp\utf-8.txt"); // OpenText 建立一個UTF-8 編碼的StreamReader對象 StreamReader sr5 = myFile.OpenText();// OpenText 建立一個UTF-8 編碼的StreamReader對象 StreamReader sr6 = File.OpenText(@"C:\temp\utf-8.txt");
初始化完成之後,你可以每次讀一行,也可以每次讀一個字元 ,還可以每次讀幾個字元,甚至也可以一次將所有內容讀完。
// 讀一行 string nextLine = sr.ReadLine();// 讀一個字元 int nextChar = sr.Read();// 讀100個字元 int nChars = 100; char[] charArray = new char[nChars]; int nCharsRead = sr.Read(charArray, 0, nChars); // 全部讀完 string restOfStream = sr.ReadToEnd();
使用完StreamReader之後,不要忘記關閉它: sr.Closee();
假如我們需要一行一行的讀,將整個文字檔讀完,下面看一個完整的例子:
StreamReader sr = File.OpenText(@"C:\temp\ascii.txt"); string nextLine; while ((nextLine = sr.ReadLine()) != null) { Console.WriteLine(nextLine); } sr.Close();
(二) 寫入檔案
寫檔案和讀檔案一樣,如果你要寫入的內容不是很多,可以使用File.WriteAllText方法來一次將內容全部寫如檔案。如果你要將一個字串的內容寫入檔案,可以用File.WriteAllText(FilePath) 或指定編碼方式 File.WriteAllText(FilePath, Encoding)方法。
string str1 = "Good Morning!"; File.WriteAllText(@"c:\temp\test\ascii.txt", str1); // 也可以指定編碼方式 File.WriteAllText(@"c:\temp\test\ascii-2.txt", str1, Encoding.ASCII);
如果你有一個字串數組,你要將每個字串元素都寫入檔案中,可以用File.WriteAllLines方法:
string[] strs = { "Good Morning!", "Good Afternoon!" }; File.WriteAllLines(@"c:\temp\ascii.txt", strs); File.WriteAllLines(@"c:\temp\ascii-2.txt", strs, Encoding.ASCII);
使用File.WriteAllText或File.WriteAllLines方法時,如果指定的檔案路徑不存在,會建立一個新檔案;如果檔案已經存在,則會覆蓋原檔案。
當要寫入的內容比較多時,同樣也要使用流(Stream)的方式寫入。.Net封裝的類是StreamWriter。初始化StreamWriter類同樣有很多方式:
// 如果檔案不存在,建立檔案; 如果存在,覆蓋檔案 StreamWriter sw1 = new StreamWriter(@"c:\temp\utf-8.txt"); // 也可以指定編碼方式 // true 是 append text, false 為覆蓋原檔案 StreamWriter sw2 = new StreamWriter(@"c:\temp\utf-8.txt", true, Encoding.UTF8);// FileMode.CreateNew: 如果檔案不存在,建立檔案;如果檔案已經存在,拋出異常 FileStream fs = new FileStream(@"C:\temp\utf-8.txt", FileMode.CreateNew, FileAccess.Write, FileShare.Read); // UTF-8 為預設編碼 StreamWriter sw3 = new StreamWriter(fs); StreamWriter sw4 = new StreamWriter(fs, Encoding.UTF8);// 如果檔案不存在,建立檔案; 如果存在,覆蓋檔案 FileInfo myFile = new FileInfo(@"C:\temp\utf-8.txt"); StreamWriter sw5 = myFile.CreateText();
初始化完成後,可以用StreamWriter對象一次寫入一行,一個字元,一個字元數組,甚至一個字元數組的一部分。
// 寫一個字元 sw.Write('a');// 寫一個字元數組 char[] charArray = new char[100]; // initialize these characters sw.Write(charArray);// 寫一個字元數組的一部分 sw.Write(charArray, 10, 15);
同樣,StreamWriter對象使用完後,不要忘記關閉。sw.Close(); 最後來看一個完整的使用StreamWriter一次寫入一行的例子:
FileInfo myFile = new FileInfo(@"C:\temp\utf-8.txt"); StreamWriter sw = myFile.CreateText();string[] strs = { "早上好", "下午好" }; foreach (var s in strs) { sw.WriteLine(s); } sw.Close();