mysql資料庫最佳化小結,mysql資料庫小結

來源:互聯網
上載者:User

mysql資料庫最佳化小結,mysql資料庫小結

一、常見資料庫的最佳化操作

1、表的設計要符合三範式。

2、添加適當的索引,索引對查詢速度影響很大,必須添加索引。主鍵索引,唯一索引,普通索引,全文索引

3、添加適當預存程序,觸發器,事務等。

4、讀寫分離(主從資料庫)

5、對sql語句的一些最佳化,(查詢執行速度比較慢的sql語句)

6、分表分區

分表:把一張大表分成多張表。分區:把一張表裡面的分配到不同的地區儲存,

7、對mysql伺服器硬體的升級操作。


二、適時提高效率

第一範式

原子性:表裡面的欄位不能再分割,只要是關係型資料庫,就天然的自動滿足第一範式。

關係型資料庫:(有行和列的概念)mysql,sql server,oracle,db2,infomix,sybase,postgresql

在設計時,先有庫-》表-》欄位-》具體記錄(內容):在儲存資料時,要設計欄位。

非關係型資料庫(泛指nosql資料庫):memcache/redis/momgodb/等

第二範式

一個表中沒有完全相同的記錄,通過一個主鍵即能解決。

第三範式

表中不能儲存冗餘資料,

 

反三範式設計

 

 

三、定位慢查詢

慢查詢:找出在一個網站中,查詢速度比較慢的語句,可以開啟一個記錄檔,記錄查詢速度比較慢的sql語句。在預設情況下,慢查詢日誌是關閉的,預設記錄時間是超過10秒 的sql語句。

1、以記錄慢查詢的方式來啟動mysql,

先關閉mysql,進入到mysql的安裝目錄。

關閉mysql服務:可以通過電腦-》管理->服務-》mysqld的服務名稱,單擊停止。 

{mysql的安裝目錄}>bin/mysqld.exe  --safe-mode  --slow-query-log

通過慢查詢日誌定位執行效率較低的SQL語句。慢查詢日誌記錄了所有執行時間超過long_query_time所設定的SQL語句。

 

2、查看慢查詢日誌的儲存路徑。

開啟了慢查詢日誌後,會建立一個慢查詢記錄檔。該記錄檔儲存在資料庫的目錄下,資料庫的目錄可以通過設定檔查看。

慢查詢日誌存放在mysql的data目錄下. 在my.ini設定檔有data目錄

#Pathto the database root

datadir="C:/Documentsand Settings/All Users/Application Data/MySQL/MySQL Server 5.5/Data/“


 

3、進程測試:

查看當前資料庫下慢查詢記錄時間:

show variables like ‘long_query_time’;


修改慢查詢時間:

set long_query_time=2;




通過如下的一個函數來進行測試:

benchmark(count,expr)函數可以測試執行count次expr操作需要的時間

一般情況下,出現查詢比較慢的語句,是沒有添加索引導致的。


四、索引

建立的測試表:


create table user(   id int primary key auto_increment,   name varchar(32) not null default '',   age tinyint unsigned not null default 0,   email varchar(32) not null default '',   classid int not null default 1)engine myisam charset utf8;insert into uservalues(null,'xiaogang',12,'gang@sohu.com',4),(null,'xiaohong',13,'hong@sohu.com',2),(null,'xiaolong',31,'long@sohu.com',2),(null,'xiaofeng',22,'feng@sohu.com',3),(null,'xiaogui',42,'gui@sohu.com',3);


建立一個班級表:

create table class(   id int not null default 0,   classname varchar(32) not null default '')engine myisam charset utf8;insert into classvalues(1,'java'),(2,'.net'),(3,'php'),(4,'c++'),(5,'ios');


1、主鍵索引

可以在建立表的添加createtable emp(id int primary key)

可以在建立完表之後,添加:altertable tablename add primary key(列1,列2)

主鍵索引的特點:

(1)一個表中最多隻有一個主鍵索引

(2)一個主鍵索引可以指向多個列

(3)主鍵索引的列,不能有重複的值,也不能有null

(4)主鍵索引的效率高。

 

2、唯一索引

可以在建立表的時候添加:createtable emp(name varchar(32) unique)

在建完表之後,添加:

alter table tablename add unique [索引名](列名)




唯一索引的特點:

(1)一個表中可以有多個唯一索引

(2)一個唯一索引可以指向多個列 ,

比如alter tabletablename add unique [索引名](列1,列2)

(3)如果在唯一索引上,沒有指定not  null,則該列可以為空白,同時可以有多個null,

(4)唯一索引的效率較高。

 

3、普通索引

使用普通索引主要是提高查詢效率

 

添加alter table tablename add index [索引名](列1,列3)

 


4、全文索引

mysql內建的全文索引mysql5.5不支援中文,支援英文,同時要求表的儲存引擎是myisam。如果希望支援中文,有兩個方案,

(1)使用aphinx中文版coreseek (來替代全文索引)

(2)外掛程式mysqlcft。


5、查看索引

(1)show  index from 表名

(2)show  indexes from 表名

(3)show  keys from 表名

(4)desc 表名


6、刪除索引

(1)主鍵索引的刪除:

alter table tablename drop primary key;要注意:在刪除主鍵索引時,要首先去掉auto_increment屬性。


(2)唯一索引的刪除

alter table tablename drop index 唯一索引的名字

(3)普通索引的刪除:

alter table tablename drop index 普通索引的名字

 

7、添加索引主要的問題:

(1)較頻繁的作為查詢條件欄位應該建立索引

       select* from emp where empno = 1

       唯一性太差的欄位不適合單獨建立索引,即使頻繁作為查詢條件

       select* from emp where sex = '男‘

       更新非常頻繁的欄位不適合建立索引

       select* from emp where logincount = 1

(2)不會出現在WHERE子句中欄位不該建立索

索引是由代價的,雖然是查詢速度提高了,但是,會影響增該刪的效率。而且索引檔案會佔用空間。

 

 

五、explain的使用

 

該工具能夠分析sql執行效率,但是並不執行sql語句。主要是查看sql語句是否用到索引。

文法:explain  sql語句\G   或 desc sql語句\G

使用索引時:


沒有使用索引時:


 

explain工具的參數說明:

會產生如下資訊:

select_type:表示查詢的類型。

table:輸出結果集的表

type:表示表的連線類型

possible_keys:表示查詢時,可能使用的索引

key:表示實際使用的索引

key_len:索引欄位的長度

rows:掃描出的行數(估算的行數)

Extra:執行情況的描述和說明

 

六、索引

1、對於建立的多列(複合)索引,只要查詢條件使用了最左邊的列,索引一般就會被使用。

mysql> alter table user add index (name,email);Query OK, 5 rows affected (0.08 sec)Records: 5 Duplicates: 0  Warnings: 0

該查詢條件沒有使用到最左邊的列,所以沒有使用到索引。




該條件中使用了複合索引的最左邊的列,因此該查詢會使用到索引。



2、對於使用like的查詢,查詢如果是”%XXX”,不會使用到索引,‘XXX%’會使用到索引。

 

 

 

注意:在有些情況下,還是會用到like查詢,比如通過歌詞搜尋歌名,通過劇情搜尋電影名稱。藉助於工具,sphinx裡面的coreseek軟體。

 

3、如果條件中有or,則要求or的索引欄位都必須有索引,否則不能用到索引。



該email添加索引後,在測試,會用到索引



4、如果列類型是字串,一定要在條件中將資料使用引號引用起來,否則不使用索引。

 


5、最佳化group by語句

預設情況下, mysql對所有的group by col1,col2進行排序。這與在查詢中指定order by col1,col2類型,如果查詢中包括group by 但使用者想要避免排序結果的消耗,則可以使用order by null禁止排序。

 

 






6、當取出的資料量超過表中資料的20%,最佳化器就不會使用索引,而是全表掃描。掃描的行數太多了,最佳化器認為全表掃描比索引來的塊。

 



7、查看索引的使用方式



注意:

handler_read_key:這個值越高越好,越高表示使用索引查詢到的次數。

handler_read_rnd_next:這個值越高,說明查詢低效。


8、對應大批量插入資料


對於MyISAM:

先禁用索引:

alter table table_name disable keys;

loading data//insert語句; 執行插入語句

執行完成插入語句後,開啟索引,統一添加索引。

alter table table_name enable keys;

 

對於Innodb:

1,將要匯入的資料按照主鍵排序

2,setunique_checks=0,關閉唯一性校正。

3,setautocommit=0,關閉自動認可。



七、並發處理的鎖機制

比如執行如下操作:

(1)從資料庫中取出id值,

(2)進行加1操作。

(3)修改完成後,再儲存到資料庫中。

比如原來 id的值為100,==》101

以上步驟執行100次,最後變成200

 

有兩個使用者同時執行的話。

a使用者:

100

101

 

b使用者:

100

101

 

通過鎖機制來進行解決

鎖機制:在執行時,只有一個使用者獲得鎖,其他使用者處於阻塞狀態,需要等待解鎖。

mysql 的鎖有以下幾種形式:

表級鎖:開銷小,加鎖快,發生鎖衝突的機率最高,並發度最低。myisam引擎屬於這種類型。

行級鎖:開銷大,加鎖慢,發生鎖衝突的機率最低,並發度也最高。innodb屬於這種類型。


1、表鎖的示範;

對myisam表的讀操作(加讀鎖),不會阻塞其他進程對同一表的讀請求,但會阻塞對同一表的寫請求。只有當讀鎖釋放後,才會執行其他進程的操作。



表添加讀鎖後,其他進程對該表只能查詢操作,修改時會被阻塞。

當前進程,能夠執行查詢操作,不能執行修改操作。不能對沒有鎖定的表進行操作。

鎖表的文法:

lock table 表名 read|write

也可以鎖定多個表,文法是:locktable 表1 read|wirte,表2 read|wirte

對myisam表的寫操作(加寫鎖),會阻塞其他進程對鎖定表的任何操作,不能讀寫,

表加寫鎖後,則只有當前進程對鎖定的表,可以執行任何操作。其他進程的操作會被阻塞。

 


2、行鎖的示範

innodb儲存引擎是通過給索引上的索引項目加鎖來實現的,這就意味著:只有通過索引條件檢索資料,innodb才會使用行級鎖,否則,innodb使用表鎖。

行鎖的文法:

begin

sql語句

commit

開啟行鎖後,當前進程在針對某條記錄執行操作時,其他進程不能操作和當前進程相同id的記錄。

php裡面有檔案鎖,在實際的項目中多數使用檔案鎖,因為表鎖,會阻塞,當對一些表添加寫鎖後,其他進程就不能操作了。這樣會阻塞整個網站,會拖慢網站的速度。

 

類似的問題:

一件商品,庫存量還有一件,這時有兩個使用者同時請求下訂單,如何防止都下訂單成功,卻沒有貨發。



八、分表

分表:把一個大表分成幾個小表:

垂直分割:

在dedecms裡面,垂直分割:

在一個資料庫中想要儲存各種資料,比如說文章資料,電影,音樂,商品資料,

內容主表+附加表:

內容主表:儲存各種資料的一些公用資訊,比如資料的名稱,添加時間等,

可以使用多個附加表,附加表格儲存體一些資料的獨特的資訊。

主要原因:是內容主表裡面的資料訪問比較頻繁。

 



水平分割:

通過id模數


 

九、分區

就是把一個表格儲存體到磁碟不同地區,仍然是一張表。

1、基本的概念:

mysql5.1後有4種分區類型:

(1)Range(範圍)–這種模式允許將資料劃分不同範圍。例如可以將一個表通過年份劃分成若干個分區。

(2)List(預定義列表)–這種模式允許系統通過預定義的列表的值來對資料進行分割

(3)Hash(雜湊)–這中模式允許通過對錶的一個或多個列的Hash Key進行計算,最後通過這個Hash碼不同數值對應的資料區域進行分區。例如可以建立一個對錶主鍵進行分區的表。

(4)Key(鍵值)-上面Hash模式的一種延伸,這裡的Hash Key是MySQL系統產生的。


2 range分區:

假如你建立了一個如下的表,該表儲存有20家超市的職員記錄,這20家超市的編號從1到20.如果你想將其分成4個小分區,可以採用range分區,建立的資料表如下。

建立range分區文法:

create table emp(   id int not null,    namevarchar(32) not null default '' comment ‘職員的名稱’,   store_id int not null comment ‘超市的編號範圍是1-20’)engine myisam charset utf8partition by range(store_id)(   partition p0 values less than(6), //是store_id的值小於6的儲存地區。   partition p1 values less than(11), //是store_id的值大於等於6小於11的儲存地區。   partition p2 values less than(16),   partition p3 values less than(21))insert into emp values(1,’哈哈’,1)--à資料是儲存到p0區insert into emp values(23,’呵呵呵’,15)--à資料是儲存到p2區 insert into emp values(100,’嘻嘻嘻’,11)=à資料是儲存到p2區。


測試使用取出資料時是否用到分區:


在取出資料時,條件中必須partitionby range(store_id),range裡面的欄位。


3、list分區與range分區有類似的地方

例子:假如你建立一個如下的一個表,該表儲存有20家超市的職員記錄,這20家超市的編號從1到20.而這20家超市分布在4個有經銷權的地區,如下表所示:

create table emp(   id int not null,   name varchar(32) not null default '',   store_id int not null)partition by list(store_id)(   partition p0 values in(5,6,7,8),   partition p1 values in(11,3,12,11),   partition p2 values in(16),   partition p3 values in(21))


注意:在使用分區時,where後面的欄位必須是分區欄位,才能使用到分區。

 


4、分區表的限制

(1)只能對資料表的整型列進行分區,或者資料列可以通過分區函數轉化成整型列

(2)最大分區數目不能超過1024

(3)如果含有唯一索引或者主鍵,則分區列必須包含在所有的唯一索引或者主鍵在內

(4)按日期進行分區很非常適合,因為很多日期函數可以用。但是對於字串來說合適的分區函數不太多 。



十、其他

1、選擇合適的儲存引擎(myisam innodb)

•       MyISAM:預設的MySQL儲存引擎。如果應用是以讀操作和插入操作為主,只有很少的更新和刪除操作,並且對事務的完整性要求不是很高。其優勢是訪問的速度快。(尤其適合論壇的文章表)

•       InnoDB:提供了具有提交、復原和崩潰恢複能力的事務安全。但是對比MyISAM,寫的處理效率差一些並且會佔用更多的磁碟空間(如果對安全要求高,則使用innodb)。[賬戶,積分]

•       Memory/heap [一些訪問頻繁,變化頻繁,又沒有必要入庫的資料:比如使用者線上狀態]

•       說明: memory表的資料都在記憶體中,因此操作速度快,但是缺少是當mysql重啟後,資料丟失,但表的結構在.

•       註:從mysql5.5.x開始,預設的儲存引擎變更為innodb,innodb是為處理巨大資料量時擁有最大效能而設計的。它的 cpu效率可能是任何其他基於磁碟的關聯式資料庫引擎所不能匹敵的。


2、資料類型的選擇

(1)在精度要求高的應用中,建議使用定點數來儲存數值,以保證結果的準確性。decimal不要用float

(2)要用於儲存手機號,哪個類型比較合適。假如我們要用char(11),如果字元集是utf8 則佔用多少個位元組。11*3==33,如果是gbk字元集則佔用11*2=22個位元組,

如果用bigint型儲存,則佔用8個位元組,

(3)如果要儲存ip地址。假如用char(15)è佔用很多位元組,能否用整型來儲存呢?

可以通過一個函數,把ip地址轉換成整數。可以使用int來儲存

inet_aton():把ip地址轉換成整數。

inet_ntoa():把整數轉換成ip地址。



取出時:

(4)根據需求選擇最小整數類型。比如使用者線上狀態:離線,線上,離開,忙碌,隱式等,可以採用0,1,2,3,5來表示,沒有必要用char()或varchar()型來儲存字串。


3、myisam表的定時維護

對於myisam 儲存引擎而言,需要定時執行optimize table 表名,通過optimize table語句可以消除刪除和更新造成的磁碟片段,從而減少空間的浪費。

文法格式:optimizetable  表名

清理完成片段之後會減少空間的浪費!

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.