一千個不用 Null 的理由，Null

最後更新：2018-01-12 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

一千個不用 Null 的理由，Null

港真，Null 貌似在哪裡都是個頭疼的問題，比如 Java 裡讓人頭疼的 NullPointerException，為了避免猝不及防的null 指標異常，千百年來程式猿們不得不在代碼裡小心翼翼的各種 if 判斷，麻煩而又臃腫，為此 java8 引入了 Optional 來避免這一問題。

下面咱們要聊的是 MySQL 裡的 null，在大量的 MySQL 最佳化文章和書籍裡都提到了欄位儘可能用NOT NULL，而不是NULL，除非特殊情況。但卻都只給結論不說明原因，猶如雞湯不給勺子一樣，讓不少初學者對這個結論半信半疑或者雲裡霧裡。本文今天就詳細的剖析下使用 Null 的原因，並給出一些不用 Null 的理由。

1、NULL 為什麼這麼多人用？

NULL是建立資料表時預設的，初級或不知情的或怕麻煩的程式員不會注意這點。
很多人員都以為not null 需要更多空間，其實這不是重點。
重點是很多程式員覺得NULL在開發中不用去判斷插入資料，寫sql語句的時候更方便快捷。

2、是不是以訛傳訛？

MySQL 官網文檔：

NULL columns require additional space in the rowto record whether their values are NULL. For MyISAM tables, each NULL columntakes one bit extra, rounded up to the nearest byte.

Mysql難以最佳化引用可空列查詢，它會使索引、索引統計和值更加複雜。可空列需要更多的儲存空間，還需要mysql內部進行特殊處理。可空列被索引後，每條記錄都需要一個額外的位元組，還能導致MYisam 中固定大小的索引變成可變大小的索引。

—— 出自《高效能mysql第二版》

照此分析，還真不是以訛傳訛，這是有理論依據和出處的。

3、給我一個不用 Null 的理由？

（1）所有使用NULL值的情況，都可以通過一個有意義的值的表示，這樣有利於代碼的可讀性和可維護性，並能從約束上增強業務資料的規範性。

（2）NULL值到非NULL的更新無法做到原地更新，更容易發生索引分裂，從而影響效能。

注意：但把NULL列改為NOT NULL帶來的效能提示很小，除非確定它帶來了問題，否則不要把它當成優先的最佳化措施，最重要的是使用的列的類型的適當性。

（3）NULL值在timestamp類型下容易出問題，特別是沒有啟用參數explicit_defaults_for_timestamp

（4）NOT IN、!= 等負向條件查詢在有 NULL 值的情況下返回永遠為空白結果，查詢容易出錯

create table table_2 (

`id` INT (11) NOT NULL,

user_name varchar(20) NOT NULL

)

create table table_3 (

`id` INT (11) NOT NULL,

user_name varchar(20)

)

insert into table_2 values (4,"zhaoliu_2_1"),(2,"lisi_2_1"),(3,"wangmazi_2_1"),(1,"zhangsan_2"),(2,"lisi_2_2"),(4,"zhaoliu_2_2"),(3,"wangmazi_2_2")

insert into table_3 values (1,"zhaoliu_2_1"),(2, null)

-- 1、NOT IN子查詢在有NULL值的情況下返回永遠為空白結果，查詢容易出錯

select user_name from table_2 where user_name not in (select user_name from table_3 where id!=1)

mysql root@10.48.186.32:t_test_zz5431> select user_name from table_2 where user_name not

-> in (select user_name from table_3 where id!=1);

+-------------+

| user_name |

|-------------|

+-------------+

0 rows in set

Time: 0.008s

mysql root@10.48.186.32:t_test_zz5431>

-- 2、單列索引不存null值，複合索引不存全為null的值，如果列允許為null，可能會得到“不符合預期”的結果集

-- 如果name允許為null，索引不儲存null值，結果集中不會包含這些記錄。所以，請使用not null約束以及預設值。

select * from table_3 where name != 'zhaoliu_2_1'

-- 3、如果在兩個欄位進行拼接：比如題號+分數，首先要各欄位進行非null判斷，否則只要任意一個欄位為空白都會造成拼接的結果為null。

select CONCAT("1",null) from dual; -- 執行結果為null。

-- 4、如果有 Null column 存在的情況下，count(Null column)需要格外注意，null 值不會參與統計。

mysql root@10.48.186.32:t_test_zz5431> select * from table_3;

+------+-------------+

| id | user_name |

|------+-------------|

| 1 | zhaoliu_2_1 |

| 2 | <null> |

| 21 | zhaoliu_2_1 |

| 22 | <null> |

+------+-------------+

4 rows in set

Time: 0.007s

mysql root@10.48.186.32:t_test_zz5431> select count(user_name) from table_3;

+--------------------+

| count(user_name) |

|--------------------|

| 2 |

+--------------------+

1 row in set

Time: 0.007s

-- 5、注意 Null 欄位的判斷方式， = null 將會得到錯誤的結果。

mysql root@localhost:cygwin> create index IDX_test on table_3 (user_name);

Query OK, 0 rows affected

Time: 0.040s

mysql root@localhost:cygwin> select * from table_3 where user_name is null\G

***************************[ 1. row ]***************************

id | 2

user_name | None

1 row in set

Time: 0.002s

mysql root@localhost:cygwin> select * from table_3 where user_name = null\G

0 rows in set

Time: 0.002s

mysql root@localhost:cygwin> desc select * from table_3 where user_name = 'zhaoliu_2_1'\G

***************************[ 1. row ]***************************

id | 1

select_type | SIMPLE

table | table_3

type | ref

possible_keys | IDX_test

key | IDX_test

key_len | 23

ref | const

rows | 1

Extra | Using where

1 row in set

Time: 0.006s

mysql root@localhost:cygwin> desc select * from table_3 where user_name = null\G

***************************[ 1. row ]***************************

id | 1

select_type | SIMPLE

table | None

type | None

possible_keys | None

key | None

key_len | None

ref | None

rows | None

Extra | Impossible WHERE noticed after reading const tables

1 row in set

Time: 0.002s

mysql root@localhost:cygwin> desc select * from table_3 where user_name is null\G

***************************[ 1. row ]***************************

id | 1

select_type | SIMPLE

table | table_3

type | ref

possible_keys | IDX_test

key | IDX_test

key_len | 23

ref | const

rows | 1

Extra | Using where

1 row in set

Time: 0.002s

mysql root@localhost:cygwin>

（5）Null 列需要更多的儲存空間：需要一個額外位元組作為判斷是否為 NULL 的標誌位

alter table table_3 add index idx_user_name (user_name);

alter table table_2 add index idx_user_name (user_name);

explain select * from table_2 where user_name='zhaoliu_2_1';

explain select * from table_3 where user_name='zhaoliu_2_1';

可以看到同樣的 varchar(20) 長度，table_2 要比 table_3 索引長度大，這是因為：

兩張表的字元集不一樣，且欄位一個為 NULL 一個非 NULL。

key_len 的計算規則和三個因素有關：資料類型、字元編碼、是否為 NULL

key_len 62 == 20*3（utf8 3位元組） + 2 （儲存 varchar 變長字元長度 2位元組，定長欄位無需額外的位元組）

key_len 83 == 20*4（utf8mb4 4位元組） + 1 (是否為 Null 的標識) + 2 （儲存 varchar 變長字元長度 2位元組，定長欄位無需額外的位元組）

所以說索引欄位最好不要為NULL，因為NULL會使索引、索引統計和值更加複雜，並且需要額外一個位元組的儲存空間。基於以上這些理由和原因，我想咱們不用 Null 的理由應該是夠了。

來源：xrzs，

my.oschina.net/leejun2005/blog/1342985

分享朋友圈也是另一種讚賞

The more we share, The more we have

歡迎加入資料君高效資料分析社區

加我私人進入大資料乾貨群：tongyuannow

目前100000+人已關注加入我們

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

一千個不用 Null 的理由，Null

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support