符串或串(String)是由零個或多個字元組成的有限序列。一般記為 s='a1a2•••an'(n>=0)。它是程式設計語言中表示文本的資料類型。
通常以串的整體作為操作對象,如:在串中尋找某個子串、求取一個子串、在串的某個位置上插入一個子串以及刪除一個子串等。兩個字串相等的充要條件是:長度相等,並且各個對應位置上的字元都相等。設p、q是兩個串,求q在p中首次出現的位置的運算叫做模式比對。串的兩種最基本的儲存方式是順序儲存方式和連結儲存方式。
下面我們來看看MySQL中的字串函數
假如結果的長度大於 max_allowed_packet 系統變數的最大值時,字串值函數的傳回值為NULL。
對於在字串位置操作的函數,第一個位置的編號為 1。
◆ ASCII(str)
傳回值為字串str 的最左字元的數值。假如str為空白字串,則傳回值為 0 。假如str 為NULL,則傳回值為 NULL。 ASCII()用於帶有從 0到255的數值的字元。
mysql> SELECT ASCII('2');
-> 50
mysql> SELECT ASCII(2);
-> 50
mysql> SELECT ASCII('dx');
-> 100
見 ORD()函數。
◆ BIN(N)
傳回值為N的二進位值的字串表示,其中 N 為一個longlong (BIGINT) 數字。這等同於 CONV(N,10,2)。假如N 為NULL,則傳回值為 NULL。
mysql> SELECT BIN(12);-> '1100'
◆ BIT_LENGTH(str)
傳回值為二進位的字串str 長度。
mysql> SELECT BIT_LENGTH('text');-> 32
◆ CHAR(N,... [USING charset])
CHAR()將每個參數N理解為一個整數,其傳回值為一個包含這些整數的代碼值所給出的字元的字串。NULL值被省略。
mysql> SELECT CHAR(77,121,83,81,'76');-> 'MySQL'mysql> SELECT CHAR(77,77.3,'77.3');-> 'MMM'
大於 255的CHAR()參數被轉換為多結果字元。 例如,CHAR(256) 相當於 CHAR(1,0), 而CHAR(256*256) 則相當於 CHAR(1,0,0):
mysql> SELECT HEX(CHAR(1,0)), HEX(CHAR(256));+----------------+----------------+| HEX(CHAR(1,0)) | HEX(CHAR(256)) |+----------------+----------------+| 0100 | 0100 |+----------------+----------------+mysql> SELECT HEX(CHAR(1,0,0)), HEX(CHAR(256*256));+------------------+--------------------+| HEX(CHAR(1,0,0)) | HEX(CHAR(256*256)) |+------------------+--------------------+| 010000 | 010000 |+------------------+--------------------+
CHAR()的傳回值為一個二進位字串。可選擇使用USING語句產生一個給出的字元集中的字串:
mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));+---------------------+--------------------------------+| CHARSET(CHAR(0x65)) | CHARSET(CHAR(0x65 USING utf8)) |+---------------------+--------------------------------+| binary | utf8 |+---------------------+--------------------------------+
如果 USING已經產生,而結果字串不符合給出的字元集,則會發出警告。同樣,如果嚴格的SQL模式被啟用,則CHAR()的結果會成為 NULL。
◆ CHAR_LENGTH(str)
傳回值為字串str 的長度,長度的單位為字元。一個多位元組字元算作一個單字元。對於一個包含五個二位元組字元集, LENGTH()傳回值為 10, 而CHAR_LENGTH()的傳回值為5。
◆ CHARACTER_LENGTH(str)
CHARACTER_LENGTH()是CHAR_LENGTH()的同義字。
◆ COMPRESS(string_to_compress)
壓縮一個字串。這個函數要求 MySQL已經用一個諸如zlib的壓縮庫壓縮過。 否則,傳回值始終是NULL。UNCOMPRESS() 可將壓縮過的字串進行解壓縮。
mysql> SELECT LENGTH(COMPRESS(REPEAT('a',1000)));-> 21mysql> SELECT LENGTH(COMPRESS(''));-> 0mysql> SELECT LENGTH(COMPRESS('a'));-> 13mysql> SELECT LENGTH(COMPRESS(REPEAT('a',16)));-> 15
壓縮後的字串的內容按照以下方式儲存:
Null 字元串按照Null 字元串儲存。
非Null 字元串未壓縮字串的四位元組長度進行儲存(首先為低位元組),後面是壓縮字串。如果字串以空格結尾,就會在後加一個"."號,以防止當結果值是儲存在CHAR或VARCHAR類型的欄位列時,出現自動把結尾空格去掉的現象。(不推薦使用 CHAR 或VARCHAR 來儲存壓縮字串。最好使用一個 BLOB 列代替)。
◆ CONCAT(str1,str2,...)
返回結果為串連參數產生的字串。如有任何一個參數為NULL ,則傳回值為 NULL。或許有一個或多個參數。 如果所有參數均為非二進位字串,則結果為非二進位字串。 如果自變數中含有任一二進位字串,則結果為一個二進位字串。一個數字參數被轉化為與之相等的二進位字串格式;若要避免這種情況,可使用顯式類型 cast, 例如: SELECT CONCAT(CAST(int_col AS CHAR), char_col)
mysql> SELECT CONCAT('My', 'S', 'QL');-> 'MySQL'mysql> SELECT CONCAT('My', NULL, 'QL');-> NULLmysql> SELECT CONCAT(14.3);-> '14.3'
◆ CONCAT_WS(separator,str1,str2,...)
CONCAT_WS() 代表 CONCAT With Separator ,是CONCAT()的特殊形式。 第一個參數是其它參數的分隔字元。分隔字元的位置放在要串連的兩個字串之間。分隔字元可以是一個字串,也可以是其它參數。如果分隔字元為 NULL,則結果為 NULL。函數會忽略任何分隔字元參數後的 NULL 值。
mysql> SELECT CONCAT_WS(',','First name','Second name','Last Name');-> 'First name,Second name,Last Name'mysql> SELECT CONCAT_WS(',','First name',NULL,'Last Name');-> 'First name,Last Name'
CONCAT_WS()不會忽略任何Null 字元串。 (然而會忽略所有的 NULL)。
◆ CONV(N,from_base,to_base)
不同數基間轉換數字。傳回值為數位N字串表示,由from_base基轉化為 to_base 基。如有任意一個參數為NULL,則傳回值為 NULL。自變數 N 被理解為一個整數,但是可以被指定為一個整數或字串。最小基數為 2 ,而最大基數則為 36。 If to_base 是一個負數,則 N 被看作一個帶符號數。否則, N 被看作無符號數。 CONV() 的運行精確度為 64位元。
mysql> SELECT CONV('a',16,2);-> '1010'mysql> SELECT CONV('6E',18,8);-> '172'mysql> SELECT CONV(-17,10,-18);-> '-H'mysql> SELECT CONV(10+'10'+'10'+0xa,10,10);-> '40'
◆ ELT(N,str1,str2,str3,...)
若N = 1,則傳回值為 str1 ,若N = 2,則傳回值為 str2 ,以此類推。若N 小於1或大於參數的數目,則傳回值為 NULL 。 ELT() 是 FIELD()的補數。
mysql> SELECT ELT(1, 'ej', 'Heja', 'hej', 'foo');-> 'ej'mysql> SELECT ELT(4, 'ej', 'Heja', 'hej', 'foo');-> 'foo'
◆ EXPORT_SET(bits,on,off[,separator[,number_of_bits]])
傳回值為一個字串,其中對於bits值中的每個位組,可以得到一個 on 字串,而對於每個清零位元位,可以得到一個off 字串。bits 中的位元值按照從右至左的順序接受檢驗 (由低位位元到高位位元)。字串被分隔字串分開(預設為逗號‘,'),按照從左至右的順序被添加到結果中。number_of_bits 會給出被檢驗的二進位位元 (預設為 64)。
mysql> SELECT EXPORT_SET(5,'Y','N',',',4);-> 'Y,N,Y,N'mysql> SELECT EXPORT_SET(6,'1','0',',',10);-> '0,1,1,0,0,0,0,0,0,0'
◆ FIELD(str,str1,str2,str3,...)
傳回值為str1, str2, str3,……列表中的str 指數。在找不到str 的情況下,傳回值為 0 。
如果所有對於FIELD() 的參數均為字串,則所有參數均按照字串進行比較。如果所有的參數均為數字,則按照數字進行比較。否則,參數按照雙倍進行比較。
如果str 為NULL,則傳回值為0 ,原因是NULL不能同任何值進行同等比較。FIELD() 是ELT()的補數。
mysql> SELECT FIELD('ej', 'Hej', 'ej', 'Heja', 'hej', 'foo');-> 2mysql> SELECT FIELD('fo', 'Hej', 'ej', 'Heja', 'hej', 'foo');-> 0
◆ FIND_IN_SET(str,strlist)
假如字串str 在由N 子鏈組成的字串列表strlist 中, 則傳回值的範圍在 1 到 N 之間 。一個字串列表就是一個由一些被‘,'符號分開的自鏈組成的字串。如果第一個參數是一個常數字串,而第二個是type SET列,則 FIND_IN_SET() 函數被最佳化,使用位元計算。如果str不在strlist 或strlist 為空白字串,則傳回值為 0 。如任意一個參數為NULL,則傳回值為 NULL。 這個函數在第一個參數包含一個逗號(‘,')時將無法正常運行。
mysql> SELECT FIND_IN_SET('b','a,b,c,d');-> 2
◆ FORMAT(X,D)
將number X設定為格式 '#,###,###.##', 以四捨五入的方式保留到小數點後D位, 而返回結果為一個字串。
◆ HEX(N_or_S)
如果N_OR_S 是一個數字,則返回一個 十六進位值 N 的字串表示,在這裡, N 是一個longlong (BIGINT)數。這相當於 CONV(N,10,16)。
如果N_OR_S 是一個字串,則傳回值為一個N_OR_S的十六進位字串表示, 其中每個N_OR_S 裡的每個字元被轉化為兩個十六進位數字。
mysql> SELECT HEX(255);-> 'FF'mysql> SELECT 0x616263;-> 'abc'mysql> SELECT HEX('abc');-> 616263
◆ INSERT(str,pos,len,newstr)
返回字串 str, 其子字串起始於 pos 位置和長期被字串 newstr取代的len 字元。 如果pos 超過字串長度,則傳回值為原始字串。 假如len的長度大於其它字串的長度,則從位置pos開始替換。若任何一個參數為null,則傳回值為NULL。
mysql> SELECT INSERT('Quadratic', 3, 4, 'What');-> 'QuWhattic'mysql> SELECT INSERT('Quadratic', -1, 4, 'What');-> 'Quadratic'mysql> SELECT INSERT('Quadratic', 3, 100, 'What');-> 'QuWhat'
這個函數支援多位元組字元。
◆ INSTR(str,substr)
返回字串 str 中子字串的第一個出現位置。這和LOCATE()的雙參數形式相同,除非參數的順序被顛倒。
mysql> SELECT INSTR('foobarbar', 'bar');-> 4mysql> SELECT INSTR('xbar', 'foobar');-> 0
這個函數支援多位元組字元,並且只有當至少有一個參數是二進位字串時區分大小寫。
◆ LCASE(str)
LCASE() 是 LOWER()的同義字。
◆ LEFT(str,len)
返回從字串str 開始的len 最左字元。
mysql> SELECT LEFT('foobarbar', 5);-> 'fooba'
◆ LENGTH(str)
傳回值為字串str 的長度,單位為位元組。一個多位元組字元算作多位元組。這意味著 對於一個包含5個2位元組字元的字串, LENGTH() 的傳回值為 10, 而 CHAR_LENGTH()的傳回值則為5。
mysql> SELECT LENGTH('text');-> 4
◆ LOAD_FILE(file_name)
讀取檔案並將這一檔案按照字串的格式返回。 檔案的位置必須在伺服器上,你必須為檔案制定路徑全名,而且你還必須擁有FILE 特許權。檔案必須可讀取,檔案容量必須小於 max_allowed_packet位元組。
若檔案不存在,或因不滿足上述條件而不能被讀取, 則函數傳回值為 NULL。
mysql> UPDATE tbl_nameSET blob_column=LOAD_FILE('/tmp/picture')WHERE id=1;
◆ LOCATE(substr,str) , LOCATE(substr,str,pos)
第一個文法返回字串 str中子字串substr的第一個出現位置。第二個文法返回字串 str中子字串substr的第一個出現位置, 起始位置在pos。如若substr 不在str中,則傳回值為0。
mysql> SELECT LOCATE('bar', 'foobarbar');-> 4mysql> SELECT LOCATE('xbar', 'foobar');-> 0mysql> SELECT LOCATE('bar', 'foobarbar',5);-> 7
這個函數支援多位元組字元,並且只有當至少有一個參數是二進位字串時區分大小寫。
◆ LOWER(str)
返回字串 str 以及所有根據最新的字元集映射表變為小寫字母的字元 (預設為 cp1252 Latin1)。
mysql> SELECT LOWER('QUADRATICALLY');-> 'quadratically'
這個函數支援多位元組字元。
◆ LPAD(str,len,padstr)
返回字串 str, 其左邊由字串padstr 填補到len 字元長度。假如str 的長度大於len, 則傳回值被縮短至 len 字元。
mysql> SELECT LPAD('hi',4,'??');-> '??hi'mysql> SELECT LPAD('hi',1,'??');-> 'h'
◆ LTRIM(str)
返回字串 str ,其引導空白字元被刪除。
mysql> SELECT LTRIM(' barbar');-> 'barbar'
這個函數支援多位元組字元。
◆ MAKE_SET(bits,str1,str2,...)
返回一個設定值 (一個包含被‘,'號分開的字字串的字串) ,由在bits 組中具有相應的位元的字串組成。str1 對應位元 0, str2 對應位元1,以此類推。str1, str2, ...中的 NULL值不會被添加到結果中。
mysql> SELECT MAKE_SET(1,'a','b','c');-> 'a'mysql> SELECT MAKE_SET(1 | 4,'hello','nice','world');-> 'hello,world'mysql> SELECT MAKE_SET(1 | 4,'hello','nice',NULL,'world');-> 'hello'mysql> SELECT MAKE_SET(0,'a','b','c');-> ''
◆ MID(str,pos,len)
MID(str,pos,len) 是 SUBSTRING(str,pos,len)的同義字。
◆ OCT(N)
返回一個 N的八進位值的字串表示,其中 N 是一個longlong (BIGINT)數。這等同於CONV(N,10,8)。若N 為 NULL ,則傳回值為NULL。
mysql> SELECT OCT(12);-> '14'
◆ OCTET_LENGTH(str)
OCTET_LENGTH() 是 LENGTH()的同義字。
◆ ORD(str)
若字串str 的最左字元是一個多位元組字元,則返回該字元的代碼, 代碼的計算通過使用以下公式計算其組成位元組的數值而得出:
(1st byte code)+ (2nd byte code × 256)+ (3rd byte code × 2562) ...
假如最左字元不是一個多位元組字元,那麼 ORD()和函數ASCII()返回相同的值。
mysql> SELECT ORD('2');-> 50
◆ POSITION(substr IN str)
POSITION(substr IN str)是 LOCATE(substr,str)同義字。
◆ QUOTE(str)
引證一個字串,由此產生一個在SQL語句中可用作完全轉義資料值的結果。 返回的字串由單引號標註,每例都帶有單引號 (‘'')、 反斜線符號 (‘')、 ASCII NUL以及前面有反斜線符號的Control-Z 。如果自變數的值為NULL, 則返回不帶單引號的單詞 “NULL”。
mysql> SELECT QUOTE('Don't!');-> 'Don't!'mysql> SELECT QUOTE(NULL);-> NULL
◆ REPEAT(str,count)
返回一個由重複的字串str 組成的字串,字串str的數目等於count 。若 count <= 0,則返回一個Null 字元串。若str 或 count 為 NULL,則返回 NULL 。
mysql> SELECT REPEAT('MySQL', 3);-> 'MySQLMySQLMySQL'
◆ REPLACE(str,from_str,to_str)
返回字串str 以及所有被字串to_str替代的字串from_str 。
mysql> SELECT REPLACE('www.mysql.com', 'w', 'Ww');-> 'WwWwWw.mysql.com'
這個函數支援多位元組字元。
◆ REVERSE(str)
返回字串 str ,順序和字元順序相反。
mysql> SELECT REVERSE('abc');-> 'cba'
這個函數支援多位元組字元。
◆ RIGHT(str,len)
從字串str 開始,返回最右len 字元。
mysql> SELECT RIGHT('foobarbar', 4);-> 'rbar'
這個函數支援多位元組字元。
◆ RPAD(str,len,padstr)
返回字串str, 其右邊被字串 padstr填補至len 字元長度。假如字串str 的長度大於 len,則傳回值被縮短到與 len 字元相同長度。
mysql> SELECT RPAD('hi',5,'?');-> 'hi???'mysql> SELECT RPAD('hi',1,'?');-> 'h'
這個函數支援多位元組字元。
◆ RTRIM(str)
返回字串 str ,結尾空白字元被刪去。
mysql> SELECT RTRIM('barbar ');-> 'barbar'
這個函數支援多位元組字元。
◆ SOUNDEX(str)
從str返回一個soundex字串。 兩個具有幾乎同樣探測的字串應該具有同樣的 soundex 字串。一個標準的soundex 字串的長度為4個字元,然而SOUNDEX() 函數會返回一個人以長度的字串。 可使用結果中的SUBSTRING() 來得到一個標準 soundex 字串。在str中,會忽略所有未按照字母順序排列的字元。 所有不在A-Z範圍之內的國際字母符號被視為母音字母。
mysql> SELECT SOUNDEX('Hello');-> 'H400'mysql> SELECT SOUNDEX('Quadratically');-> 'Q36324'
注意:這個函數執行原始的Soundex演算法,而非更加流行的加強版本(如D. Knuth所述)。其區別在於原始版本首先會刪去母音,其次是重複,而加強版則首先刪去重複,而後刪去母音。
◆ expr1 SOUNDS LIKE expr2
這相當於SOUNDEX(expr1) = SOUNDEX(expr2)。
◆ SPACE(N)
返回一個由N 間隔符號組成的字串。
mysql> SELECT SPACE(6);-> ' '
◆ SUBSTRING(str,pos) , SUBSTRING(str FROM pos) SUBSTRING(str,pos,len) , SUBSTRING(str FROM pos FOR len)
不帶有len 參數的格式從字串str返回一個子字串,起始於位置 pos。帶有len參數的格式從字串str返回一個長度同len字元相同的子字串,起始於位置 pos。 使用 FROM的格式為標準 SQL 文法。也可能對pos使用一個負值。假若這樣,則子字串的位置起始於字串結尾的pos 字元,而不是字串的開頭位置。在以下格式的函數中可以對pos 使用一個負值。
mysql> SELECT SUBSTRING('Quadratically',5);-> 'ratically'mysql> SELECT SUBSTRING('foobarbar' FROM 4);-> 'barbar'mysql> SELECT SUBSTRING('Quadratically',5,6);-> 'ratica' mysql> SELECT SUBSTRING('Sakila', -3);-> 'ila' mysql> SELECT SUBSTRING('Sakila', -5, 3);-> 'aki'mysql> SELECT SUBSTRING('Sakila' FROM -4 FOR 2);-> 'ki'
這個函數支援多位元組字元。
注意,如果對len使用的是一個小於1的值,則結果始終為空白字串。
SUBSTR()是 SUBSTRING()的同義字。
◆ SUBSTRING_INDEX(str,delim,count)
在定界符 delim 以及count 出現前,從字串str返回自字串。若count為正值,則返回最終定界符(從左邊開始)左邊的一切內容。若count為負值,則返回定界符(從右邊開始)右邊的一切內容。
mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', 2);-> 'www.mysql'mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', -2);-> 'mysql.com'
這個函數支援多位元組字元。
◆ TRIM([{BOTH | LEADING | TRAILING} [remstr] FROM] str) TRIM(remstr FROM] str)
返回字串 str , 其中所有remstr 首碼和/或尾碼都已被刪除。若分類符BOTH、LEADIN或TRAILING中沒有一個是給定的,則假設為BOTH 。 remstr 為可選項,在未指定情況下,可刪除空格。
mysql> SELECT TRIM(' bar ');-> 'bar'mysql> SELECT TRIM(LEADING 'x' FROM 'xxxbarxxx');-> 'barxxx'mysql> SELECT TRIM(BOTH 'x' FROM 'xxxbarxxx');-> 'bar'mysql> SELECT TRIM(TRAILING 'xyz' FROM 'barxxyz');-> 'barx'
這個函數支援多位元組字元。
◆ UCASE(str)
UCASE()是UPPER()的同義字。
◆ UNCOMPRESS(string_to_uncompress)
對經COMPRESS()函數壓縮後的字串進行解壓縮。若參數為壓縮值,則結果為 NULL。這個函數要求 MySQL 已被諸如zlib 之類的壓縮庫編譯過。否則, 傳回值將始終是 NULL。
mysql> SELECT UNCOMPRESS(COMPRESS('any string'));-> 'any string'mysql> SELECT UNCOMPRESS('any string');-> NULL
◆ UNCOMPRESSED_LENGTH(compressed_string)
返回壓縮字串壓縮前的長度。
mysql> SELECT UNCOMPRESSED_LENGTH(COMPRESS(REPEAT('a',30)));-> 30
◆ UNHEX(str)
執行從HEX(str)的反向操作。就是說,它將參數中的每一對十六進位數字理解為一個數字,並將其轉化為該數字代表的字元。結果字元以二進位字串的形式返回。
mysql> SELECT UNHEX('4D7953514C');-> 'MySQL'mysql> SELECT 0x4D7953514C;-> 'MySQL'mysql> SELECT UNHEX(HEX('string'));-> 'string'mysql> SELECT HEX(UNHEX('1267'));-> '1267'
◆ UPPER(str)
返回字串str, 以及根據最新字元集映射轉化為大寫字母的字元 (預設為cp1252 Latin1).
mysql> SELECT UPPER('Hej');-> 'HEJ'
該函數支援多位元組字元。