最近工作處理了一些有關Oracle字元資料類型的問題,特做如下整理,希望和大家共同學習:
一、首先對char與varchar2類型做下比較:
區別:
1.CHAR的長度是固定的,而VARCHAR2的長度是可以變化的, 比如,儲存字串“abc",對於CHAR (20),表示你儲存的字元將佔20個位元組(包括17個Null 字元),而同樣的VARCHAR2 (20)則只佔用3個位元組的長度,20隻是最大值,當你儲存的字元小於20時,按實際長度儲存。
例:
SQL> create table testchar(c1 char(20), c2 varchar2(20));
表已建立。
SQL> insert into testchar values('dylan','dylan');
已建立 1 行。
SQL> commit;
提交完成。
SQL> select length(t.c1), length(t.c2) from testchar t;
LENGTH(T.C1) LENGTH(T.C2)
------------ ------------
20 5
2.CHAR的效率比VARCHAR2的效率稍高。
3.目前VARCHAR是VARCHAR2的同義字。工業標準的VARCHAR類型可以儲存Null 字元串,但是oracle不這樣做,儘管它保留以後這樣做的權利。Oracle自己開發了一個資料類型VARCHAR2,這個類型不是一個標準的VARCHAR,它將在資料庫中varchar列可以儲存Null 字元串的特性改為儲存NULL值。如果你想有向後相容的能力,Oracle建議使用VARCHAR2而不是VARCHAR。
何時該用CHAR,何時該用varchar2?
CHAR與VARCHAR2是一對矛盾的統一體,兩者是互補的關係.
VARCHAR2比CHAR節省空間的,在效率上比CHAR會稍微差一些,即要想獲得效率,就必須犧牲一定的空間,這也就是我們在資料庫設計上常說的‘以空間換效率’。
VARCHAR2雖然比CHAR節省空間的,但是如果一個VARCHAR2列經常被修改,而且每次被修改的資料的長度不同,這會引起‘行遷移’ (Row Migration)現象,而這造成多餘的I/O,是資料庫設計和調整中要儘力避免的,在這種情況下用CHAR代替VARCHAR2會更好一些。
二、關於oracle中文字元佔用多少儲存空間問題
方法一:
一個漢字在Oracle資料庫裡佔多少位元組跟資料庫的字元集有關,UTF8時,長度為3.
測試一個漢字在各種字元集中到底佔用多少位元組:
SQL> select lengthb('漢') from dual;
LENGTHB('漢')
-------------
2
方法二:
查看oracle資料庫當前字元集:
SQL> select * from nls_database_parameters where parameter='NLS_CHARACTERSET';
PARAMETER VALUE
------------------------------ ----------------------------------------------------------------
NLS_CHARACTERSET ZHS16GBK
一個英文字母是一個字元,一個中文漢字是幾個字元呢?我們知道,一個中文漢字是雙位元組字元,但它有幾個字元與其資料庫字元集有關。如果資料庫字元集使用單位元組US7ASCII,則一個中文漢字是二個字元;如果資料庫字元集使用雙位元組字元集ZHS16GBK,則一個中文漢字是一個字元。有關這一點可以使用 Oracle的函數Substr得到證明。
使用US7ASCⅡ字元集時:
SQL> select substr('南京大學',1,2) from dual;
SUBS
----
南
使用ZHS16GBK字元集時:
SQL> select substr('南京大學',1,2) from dual;
SUBS
----
南京