為什麼PostgreSQL資料庫管理工作中,定期vacuum是一個重要的工作.
原因在於以下3點:
釋放,再利用 更新/刪除的行所佔據的磁碟空間.
更新PostgreSQL查詢計劃中使用的統計資料.
防止因事務ID的重設而使非常老的資料丟失.
第一點的原因是PostgreSQL資料的插入,更新,刪除操作並不是真正放到資料庫空間.如果不定期釋放空間的話,由於資料太多,查詢速度會巨降.
第二點的原因是PostgreSQL在做查詢處理的時候,為了是查詢速度提高,會根據統計資料來確定執行計畫.如果不及時更新的話,查詢的效果可能不如預期.
第三點的原因是PostgreSQL中每一個事務都會產生一個事務ID,但這個數字是有上限的. 當事務ID達到最大值後,會重新從最小值開始迴圈.這樣如果不及時把以前的資料釋放掉的話,原來的老資料會因為事務ID的丟失而丟失掉.
話說回來vacuum操作可以手動和自動.如果有專門的資料庫維護人員的話,可以適時進行.但很多系統為了節省維護成本,這樣就需要依賴自動vacuum了.
雖說定期vacuum是PostgreSQL的一個弱點,不過在8.3版本以後,把這個任務交給自動vacuum就可以了.
要使自動vacuum有效,必須設定track_counts參數為true.具體的設定可以參照官方的文檔.
定期vacuum還是自己寫一個shell來自動執行比較好.
黃海在WINDOWS下執行的語句:
vacuumdb -U postgres -d lxyy_db --analyze
crontab中設定執行這個shell的使用者為資料庫超級使用者,然在在這個超級使用者的home下面建一個.pgpass認證檔案,就可以定期執行batch了.
1, vacuumdb綜述 vacuumdb是清除PostgreSQL資料庫的工具。其實vaccumdb是SQL命令VACUUM的外部封裝。
2. vacuumdb的幾個有用參數
-a/--all vacuum所有的資料庫
-d dbname 只vacuum dbname這個資料庫
-f/--full 執行full的vacuum
-t table 只vacuum table這個資料表
-z/--analyze Calculate statistics for use by the optimizer
3. 實際的維護
vacuumdb -d yourdbname -f -z -v 效果還是很明顯的,其中有一張表從原來的3G多一下子變到了600M。 最主要很久沒去垃圾清理了,所以我們有必要每天去清理一遍:在crontab裡面添加:
02 2 * * * postgres vacuumdb -d digibot -f -z -v >> /tmp/vacuumdb.log
每天淩晨2點02分去清理一遍。哈哈