以前一直都認為有兩個位元組來記錄長度(長度小也可以用一個位元組記錄),所以這個問題當時覺得就挺無聊的不過後來群裡有人給瞭解釋,突然才發現原來事情不是這麼簡單
MYSQL COMPACT格式,每條記錄有一個位元組來表示NULL欄位分布,如果表中有欄位允許為空白,則最大隻能定到65532,如果沒有欄位允許為空白,則那個位元組可以節省,最大可以定義到65533,不知道是不是這個原因
於是上網看了些資料,又在本地做了些實驗,原來vachar的最大長度真的是不定的(根據是否有非空欄位來決定)
在本地做了下實驗,innodb+latin的環境
複製代碼 代碼如下:
-- success
drop table if exists test;
create table test(name varchar(65533) not null)engine=innodb DEFAULT CHARSET=latin1
-- too large
drop table if exists test;
create table test(name varchar(65533))engine=innodb DEFAULT CHARSET=latin1
對於第二種情況,允許空欄位的時候是不能加到65533的長度的,最大隻能到65532,到底應該是引文的那種說法。
網上也有人做了類似的實驗,參考http://stackoverflow.com/questions/8295131/best-practise-for-sql-varchar-column-length
複製代碼 代碼如下:
name varchar(100) not null will be 1 byte (length) + up to 100 chars (latin1)
name varchar(500) not null will be 2 bytes (length) + up to 500 chars (latin1)
name varchar(65533) not null will be 2 bytes (length) + up to 65533 chars (latin1)
name varchar(65532) will be 2 bytes (length) + up to 65532 chars (latin1) + 1 null byte
總結一下,原來mysql的vachar欄位的類型雖然最大長度是65535,但是並不是能存這麼多資料,最大可以到65533(不允許非空欄位的時候),當允許非空欄位的時候只能到65532。
以下是其它網友的補充說明:
這不是一個固定的數字。本文簡要說明一下限制規則。
strlen 計算字串長度,一個中文當2字元
mb_strlen根據它的字元編碼模式,統計字元quot
count計算數組中的元素數目或對象中的屬性個數
複製代碼 代碼如下:
<?php
header('Content-Type:text/html;charset=UTF-8');
$string1="謝春業";//定義中文字元變數
$string2="xcy";//定義英文字元變數
//直接輸出看看他們的長度
echo strlen($string1);
echo "</br>";
echo strlen($string2);
echo "</br>";
//用 php 多位元組擴充函數 mb_strlen試試看
echo mb_strlen($string1,'utf8');
echo "</br>";
echo mb_strlen($string2,'utf8');
echo "</br>";
?>
輸出結果是:
9
3
3
3
1、限制規則
欄位的限制在欄位定義的時候有以下規則:
a) 儲存限制
varchar 欄位是將實際內容單獨儲存在聚簇索引之外,內容開頭用1到2個位元組表示實際長度(長度超過255時需要2個位元組),因此最大長度不能超過65535。
b) 編碼長度限制
字元類型若為gbk,每個字元最多佔2個位元組,最大長度不能超過32766;
字元類型若為utf8,每個字元最多佔3個位元組,最大長度不能超過21845。
對於英文比較多的論壇 ,使用GBK則每個字元佔用2個位元組,而使用UTF-8英文卻只佔一個位元組。
若定義的時候超過上述限制,則varchar欄位會被強行轉為text類型,併產生warning。
c) 行長度限制
導致實際應用中varchar長度限制的是一個行定義的長度。 MySQL要求一個行的定義長度不能超過65535。若定義的表長度超過這個值,則提示
ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TEXT or BLOBs。
2、計算例子
舉兩個例說明一下實際長度的計算。
a) 若一個表只有一個varchar類型,如定義為
create table t4(c varchar(N)) charset=gbk;
則此處N的最大值為(65535-1-2)/2= 32766。
減1的原因是實際行儲存從第二個位元組開始';
減2的原因是varchar頭部的2個位元組表示長度;
除2的原因是字元編碼是gbk。
b) 若一個表定義為
create table t4(c int, c2 char(30), c3 varchar(N)) charset=utf8;
則此處N的最大值為 (65535-1-2-4-30*3)/3=21812
減1和減2與上例相同;
減4的原因是int類型的c佔4個位元組;
減30*3的原因是char(30)佔用90個位元組,編碼是utf8。
如果被varchar超過上述的b規則,被強轉成text類型,則每個欄位佔用定義長度為11位元組,當然這已經不是“varchar”了。