有時候我們可能會把CSV中的資料匯入到某個資料庫的表中,比如做報表分析的時候。
對於這個問題,我想一點也難不倒程式人員吧!但是要是SQL Server能夠完成這個任務,豈不是更好!
對,SQL Server確實有這個功能。
首先先讓我們看一下CSV檔案,該檔案儲存在我的D:盤下,名為csv.txt,內容是:
現在就是SQL Server的關鍵區段了;
我們使用的是SQL Server的BULK INSERT命令,關於該命令的詳細解釋,請點擊此處;
我們先在SQL Server中建立用於儲存該資訊的一張資料表,
CREATE TABLE CSVTable(
Name NVARCHAR(MAX),
Email NVARCHAR(MAX),
Area NVARCHAR(MAX)
)
然後執行下面的語句:
BULK INSERT CSVTableFROM 'D:\csv.txt'WITH(FIELDTERMINATOR = ',',ROWTERMINATOR = '\n')SELECT * FROM CSVTable
按F5,執行結果如下:
怎麼樣?是不是比用程式簡單!
但是現在有幾個問題需要考慮一下:
1,CSV檔案中有的列值是用雙引號,有的列值則沒有雙引號:
如果再次運行上面的語句,得到結果就和上一個結果不同了:
其中有的列就包含雙引號了,這應該不是我們想要的結果,要解決這個問題,我們只能利用暫存資料表了,先把CSV匯入到暫存資料表中,然後在從這個暫存資料表中匯入到最終表的過程中把雙引號去掉。
2,CSV檔案的列值全部是由雙引號組成的:
這個問題要比上一個稍微複雜點,除了要先把CSV檔案匯入到暫存資料表中,還必須修改一下在把CSV檔案匯入到暫存資料表的代碼:
注意圈中的部分。
3,CSV檔案的列要多於資料表的列:
而我們的資料表只有三列,如果在執行上面的匯入代碼,會產生什麼結果呢?
結果就是:
它把後邊的全部放在了Area列中了,要處理這個問題,其實也很簡單,就是我們把我們想要的列值在資料表中都按順序建立一列,而把不需要的列值,也在資料表中建立一個,只不過只是一個臨時列,在把這個資料表匯入到最終表的時候,忽略這個臨時列就行了。
--EOF--
Author:興百放
Web:http://xbf321.cnblogs.com/
Time:2010.3.14