有台伺服器,訪問量挺大,每天近250w動態pv,資料庫查詢平均每秒近600次
另一台伺服器,跑的程式跟這台一樣,不過只有每天約40w動態pv
前段時間連續卡死過幾次,當時的狀態是
伺服器沒崩潰,資料庫可正常登陸。只是所有的查詢都卡在“sending data”狀態,長時間無法執行完,這些簡單的sql語句,有時候集中在A表上,有時候集中在B表上,同時還有一些卡死在locked狀態或update狀態
看mysql的說明,sending data狀態表示兩種情況,一種是mysql已經查詢了資料,正在發給用戶端;另一種情況是,mysql已經知道某些資料需要去什麼地方讀取,正在從資料檔案中讀取
mysql官方說,這不是mysql的bug,但是官方也沒說怎麼處理......那麼,看情況,就應該是配置方面的問題了。
首先從sql最佳化的角度來查了查,那些卡死的sql語句,都是簡單查詢,消耗非常低,索引做的非常好,所以覺得應該不是sql語句的問題。而且慢查詢日誌裡也沒有出現慢查詢。
把表都做了最佳化,就是optimize table ,過幾天發現,還是會出現卡死的情況.....
後來考慮增加並發效能,增加了key_buffer thread_cache 等一系列的記憶體配置,發現沒什麼作用。情況依舊
再後來,把query_cache減小到預設值 16M,把一些不怎麼變動的資料,做了靜態化。驚奇的發現,12天過去了,沒再出過問題......
後來想想,修改query_cache可能對這個問題有些協助,畢竟資料更新比較頻繁,query_cache的更新也很頻繁。不過看mysql的狀態,query_cache的命中率還是相當高的,差不多75%。
覺得問題可能出在程式上,只是沒查出來。後來靜態化的那些內容,是一些產品的解說文字,一般一個產品的說明也就三五十個漢字。
這裡出問題的嫌疑比較大,一個頁面有七八個產品,加起來可能三五百個漢字,雖然不多,不過查詢很頻繁,從這個表上查詢的資料量應該是很可觀的,mysql會頻繁的從這個表拿資料。不過,不過有時候卡死的語句並不是在查詢這個表......
手頭沒有好使的工具,鬱悶。反正問題貌似好了,先放下備案吧,等以後水平高些,再來查。
MySQL很容易進程滿而死的一個重要原因
建站不容易已經遠遠超過了我的設想和預期,除了經濟上還有技術上的,有些問題不是一般技術人員能解決。不過在這段時間裡讓我也學會了如何思考問題和解決問題,特別是連續解決了幾個問題,可以說真不是開發人員或者別的技術人員能解決的,對此自信心也越來越足了!
談到這,必須說下我們的站布衣生活網www.yes81.net,基本配置,LINUX 9.0系統,JBOSS42 WEB服務,MYSQL,從五一到現在,運行有段時間了,目前的訪問量是4000IP左右。
記得以前發生過一個問題也是檢查了好久都沒解決的,故障一發生CPU就跑到100%左右,系統沒響應,MYSQL、JBOSS進程死。當初是通過對一些大資料表建立索引解決的!這次問題現象和這個有點象,死的時候幾乎服務沒有響應,通過查看後台MYSQL進程,居然已經超過我設定的1000個限制,第1天我把配置改成3000,想想是否跟這個有關,最近的訪問量增大了。說實話,我還是不相信並發1000個串連,但事實擺在面前,現在就是1000個進程堵在這!第2天發現3000也不行了,在進程列表中看到基本上很容易就進程滿,而且每個進程都在sending data 狀態,尋找了2天還是無法解決問題,不論是重新設定啟動參數還是檢查外來攻擊都無法解決,按照一些人的說法,把臨時緩衝表增大到512M也是沒有任何協助。象這種的每增加個串連都幾乎會卡死,而且是sending data 狀態!是資料無法發出還是查詢不能完成呢?
帶著這個問題,跟開發的溝通,是否存在資料死結或者沒有提交的問題,造成的查詢鎖死!而且有時候是正常,但大部分是不正常的死結!查了半天,報告說,程式沒發現問題,因為根據命令已經能定位到程式的準確代碼上了!那麼是什麼問題呢?
想起以前MS SQLSERVER2000下曾經發生過的資料庫損壞的問題,也嘗試了修複。根據堵塞命令集中在幾個重要的表上,其一是餐館資訊表(4萬條記錄),用修複命令都無法修複!發現設定的類型是inoubox ,把類型改成MYISAM 後再修複,修複也沒報告什麼錯誤,但重新啟動系統後一切問題就解決了!