我們在編寫程式時,總是想要使自己的程式佔用資源最小,運行速度更快,代碼量更少。往往我們在追求這些的同時卻失去了很多東西。下面我想講講我對PHP最佳化的理解。最佳化的目的是花最少的代價換來最快的運行速度與最容易維護的代碼。
進行大範圍的最佳化,而不是死啃某些程式碼
我這裡所說的最佳化,基本上都是從伺服器,Apache,資料庫這些方面來進行的最佳化,而並不是對你的PHP代碼加以改進從而提高程式的運行速度,因為比起你將程式中的正則最佳化為字串處理函數從而提升程式速度來說,在大範圍內進行的最佳化所需要的代價要比這個小的多,而獲得報酬卻要豐厚的多。
在非代碼處進行最佳化有以下好處:
1、通常情況下能夠大大提高效率
2、不會危及到代碼的完整性
3、能夠快速部署
緩衝技術
下面來說說常用的緩衝技術,通過這些緩衝技術能夠大大的提高效率
在說到緩衝技術的時候不得不提到memcached ,memcached是高效、快速的分布式記憶體對象緩衝系統,主要用於加速 WEB Live App程式。
Memcached的原理
memcached 是以精靈方式運行於一個或多個伺服器中,等待接收用戶端的串連操作,用戶端可以由各種語言編寫(例如PHP)。PHP 等用戶端在與 memcached 服務建立串連之後,接下來的事情就是存取對象了,每個被存取的對象都有一個唯一的標識符 key,存取操作均通過這個 key 進行,儲存到 memcached 中的對象實際上是放置記憶體中的,並不是儲存在 cache 檔案中的,這也是為什麼 memcached 能夠如此高效快速的原因。
說完memcached,下面來說說常用的緩衝方法
1、編譯與OPCODE緩衝
因為PHP是解釋型的語言,所以每個PHP檔案在啟動並執行時候都需要編譯後再執行,同一個檔案,不同的使用者訪問,或者同一個使用者不同時間訪問同一個檔案,每次都需要重新編譯然後運行,這樣就耗費了大量時間。
通過編譯緩衝每個檔案在修改之後只編譯一次這樣就減少了檔案IO操作,使用者訪問後機器指令直接從記憶體中取出並執行而不是硬碟中讀出。
最常見的PHP編譯緩衝工具有:APC,Accelerator,xcache
2、全域頁面緩衝– Squid Cache
Squid Cache(簡稱為Squid)是一個流行的自由軟體(GNU通用公用許可證)的Proxy 伺服器和Web快取服務器,Squid作為網頁伺服器的前置cache伺服器通過緩衝相關請求來提高Web伺服器的速度。
3、局部緩衝之SQL緩衝
在大多數應用程式中主要的瓶頸往往可以追溯到資料庫的操作中,一般都是因為複雜的資料庫查詢而耗費了大量時間,而SQL緩衝可以大大降低複雜查詢造成的負荷。
SQL緩衝的例子(使用了memcached擴充)
程式碼片段:
$key = md5(“some sort of sql query”); if (!($result = memcache_get($key))) { $result = $pdo->query($qry)->fetchAll(); // 緩衝查詢結果一小時 memcache_set($key, $result, NULL, 3600); }
4、局部緩衝之代碼塊緩衝
為了最佳化PHP程式,有時候我們不得不最佳化一個個程式碼片段來減少那麼一點點的執行的時間,但是比起最佳化複雜的不同的PHP程式碼片段還不如通過緩衝來直接忽略這些程式碼片段的最佳化,這樣做的好處是:
1、能夠很快的看到效果
2、不會破壞以前的代碼
3、速度要比最佳化代碼要快得多
代碼塊緩衝的列子(同樣使用了memcached擴充)
function complex_function_abc($a, $b, $c) { $key = __FUNCTION__ . serialize (func_get_args()); if (!($result = memcache_get($key))) { $result = //函數代碼 // 儲存執行結果1小時 memcache_set($key, $result, NULL, 3600); } return $result; }
當然除了上述方法外還可以用到檔案快取(將資料庫中的資料取出儲存在檔案中),還可以產生靜態HTML檔案等,但是這些方法的緩衝還是將檔案儲存在硬碟上而不是記憶體中。
輸出控制
除了上述緩衝技術外還可以通過輸出控制來讓程式執行的時間更少
下面通過PHP與APACHE來說說輸出控制
1、PHP輸出控制
這裡最主要用到ob_start()以及PHP中的OB系列函數,這些函數可以做什麼呢?
第一就是靜態模版技術。所謂靜態模版技術就是通過某種方式,使得使用者在client端得到的是由PHP產生的html頁面。如果這個html頁面不會再被更新,那麼當另外的使用者再次瀏覽此頁面時,程式將不會再調用PHP以及相關的資料庫,對於某些資訊量比較大的網站,例如sina,163,sohu。類似這種的技術帶來的好處是非常巨大的。
程式碼範例:
程式碼範例:
代碼如下:
<?php
ob_start(); //開啟緩衝區
?>
php頁面的全部輸出
代碼如下:
<?php
$content = ob_get_contents(); //取得php頁面輸出的全部內容
$fp = fopen(“output.html”, “w”); //建立一個檔案,並開啟,準備寫入
fwrite($fp, $content); //把php頁面的內容全部寫入output.html,然後……
fclose($fp);
?>
當然這個ob系列函數還有其他很多用處我就不在這裡一一說明了。
2、apache輸出控制
將SendBufferSize設定為頁面大小,這樣就能將頁面一次性放在發送緩衝區從而增加處理速度。
SendBufferSize 指令
說明:TCP發送緩衝區大小(位元組)
文法:SendBufferSize bytes
預設值:SendBufferSize 0
範圍:server config
狀態:MPM
模組:beos, mpm_netware, mpm_winnt, mpmt_os2, prefork, worker
這個指令設定伺服器的TCP發送緩衝區的大小(位元組)。提高這個值會導致兩個後果:高速度和高潛伏時間(100ms左右)。如果設定為”0″,將使用作業系統預設值。
通過原始碼方式編譯你的Apache/PHP/Database 可讓你的程式增加10–15%的速度
下面再說說在代碼最佳化的時候應該注意的
1、短代碼不等於快的代碼
很多人在寫程式時希望將代碼寫的越簡潔越好,但是越短的代碼有時候反而需要更長的執行時間,所以哪怕是用更多的代碼也不使用速度慢的代碼
2、在寫程式的時候更應該注重程式的擴充性,而不是追求速度
3、在最佳化你的代碼之前,先看看跟資料庫有關的部分,因為大多數應用程式的瓶頸在資料庫而不是代碼
4、微最佳化得不償失
什麼叫做微最佳化?就像前面所說的將Regex部分的代碼改用字串函數代替。這樣做有以下缺點:
(1)花費時間較長
(2)不會解決你的效能問題
(3)很有可能會破壞以前的代碼從而產生未知的錯誤
(4)付出大於回報
這裡還不得不提到一個誤區,有些人為了讓程式更加最佳化,在分析商務邏輯的時候便將最佳化考慮在內了,從而為了得到更優的代碼而改動商務邏輯。這是十分愚蠢的想法,因為程式的目的便是為了處理現實中遇到的問題,是為這些問題服務的,怎麼能本末倒置呢。