分組統計
在介紹GROUP BY 和 HAVING 子句前,我們必需先講講sql語言中一種特殊的函數:彙總函式,例如SUM, COUNT, MAX, AVG等。這些函數和其它函數的根本區別就是它們一般作用在多條記錄上。
SELECT SUM(population) FROM bbc
這裡的SUM作用在所有返回記錄的population欄位上,結果就是該查詢只返回一個結果,即所有國家的總人口數。
通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函數對屬於一組的資料起作用。當你指定 GROUP BY region 時, 屬於同一個region(地區)的一組資料將只能返回一行值,也就是說,表中所有除region(地區)外的欄位,只能通過 SUM, COUNT等彙總函式運算後返回一個值。
HAVING子句可以讓我們篩選成組後的各組資料,WHERE子句在彙總前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前,而 HAVING子句在彙總後對組記錄進行篩選。
讓我們還是通過具體的執行個體來理解GROUP BY 和 HAVING 子句,還採用第三節介紹的bbc表。
SQL執行個體:
一、顯示每個地區的總人口數和總面積:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把返回記錄分成多個組,這就是GROUP BY的字面含義。分完組後,然後用彙總函式對每組中的不同欄位(一或多條記錄)作運算。
二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(area)>1000000
在這裡,我們不能用where來篩選超過1000000的地區,因為表中不存在這樣一條記錄。
相反,HAVING子句可以讓我們篩選成組後的各組資料。