"TCMalloc(Thread-Caching Malloc)是google-perftools工具中的一個,與標準的glibc庫的malloc相 比,TCMalloc在記憶體的分配上效率和速度要高得多,可以提高Mysql服 務器在高並發情況下的效能,降低系統負載。"
今天動手測試了一下TCMalloc對mysql的影響,以下是我測試的流水過程:硬體:CPU:Intel(R) Xeon(R) CPU 5110@1.60GHz(四核心)MEMORY:4G
軟體:OS:CentOS release 5.3 (Final)MySQL edition:5.5.12-log
測試載入器:
sysbench
tpcc(暫缺)
mysql相關參數:
sync_binlog=1transaction-isolation=READ-COMMITTEDinnodb_buffer_pool_size = 2500Minnodb_thread_concurrency = 9innodb_flush_log_at_trx_commit = 1innodb_io_capacity = 400
為了避免塊裝置的IO瓶頸,資料基本上全部在記憶體中讀取 。
裝載1kw條記錄:
# sysbench --test=oltp --db-driver=mysql --mysql-user=root --mysql-host=127.0.0.1 --mysql-db=sbtest --mysql-socket=/tmp/mysql.sock --mysql-table-engine=innodb --oltp-table-size=10000000 prepare
安裝TCMalloc:
# tar -zxvf google-perftools-1.7.tar.gz
# cd google-perftools-1.7
# mkdir /tmp/tc
# ./configure --prefix=/tmp/tc --disable-cpu-profiler --disable-heap-profiler --disable-heap-checker --disable-debugalloc --enable-minimal
# make && make install --編譯報錯,說沒有g++
# yum install gcc-c++ libstdc++-devel
# cp /tmp/tc/lib/libtcmalloc_minimal.so.0.1.0 /usr/local/lib
# ln -s /usr/local/lib/libtcmalloc_minimal.so.0.1.0 /usr/local/lib/libtcmalloc.so
# ln -s /usr/local/lib/libtcmalloc_minimal.so.0.1.0 /usr/local/lib/libtcmalloc.so.0
# ln -s /usr/local/lib/libtcmalloc_minimal.so.0.1.0 /usr/local/lib/libtcmalloc.so.0.1.0
"Mysql加入動態庫修改mysql服 務的啟動指令碼mysqld_safe,在“ # executing mysqld_safe”行後添加行:export LD_PRELOAD="/usr/local/lib/libtcmalloc.so"目的是在啟動mysql前, 載入tcmalloc動態庫。重啟Mysql服 務:/usr/local/mysql/bin/mysqladmin shutdown/usr/local/mysql/bin/mysqld_safe –user=mysql & 驗證TCMalloc使用lsof查看mysql進 程是否已經載入了tcmalloc庫:"# lsof -n | grep tcmalloc
mysqld 10472 mysql mem REG 253,0 873557 15970541 /usr/local/lib/libtcmalloc_minimal.so.0.1.0
sysbench運行語句:
# time sysbench --test=oltp --db-driver=mysql --mysql-user=root --mysql-host=127.0.0.1 --mysql-socket=/tmp/mysql.sock --mysql-table-engine=innodb --mysql-db=sbtest --num-threads=[1...64] --max-requests=10000 --oltp-read-only=on --oltp-table-size=10000000 run
測試結果如下:
橫軸為並發線程數
縱軸為每秒完成的事務量(唯讀)
從文檔中得知,TCmalloc的從兩個地方改善效能:
一是執行一次malloc/free的速度;
二是減少了多線程程式中的鎖爭用情況。對於小對象,幾乎已經達到了零爭用。對於大對象,TCMalloc嘗試使用粒度較好和有效自旋鎖。
參考:
http://code.google.com/p/google-perftools/
http://my.oschina.net/captaintheron/blog/2797
http://shiningray.cn/tcmalloc-thread-caching-malloc.html