PHPCMS開發文檔裡看到PHP編碼規範

來源:互聯網
上載者:User

註:這是從PHPCMS開發文檔裡看到編碼規範,雖名為PHPCMS的開發規範,但我覺得所有的PHP編程都該如此。寫了那麼多PHP,很多編碼對照這規範都感覺欠缺很多,今後一定要對照糾正。

Phpcms 編碼規範
1. 引言…. 2
2. 適用範圍…. 2
3. 標準化的重要性和好處…. 3
4. PHP編碼規範與原則…. 3
4.1. 代碼標記… 3
4.2. 注釋… 3
4.3. 書寫規則… 4
4.3.1. 縮排… 4
4.3.2. 大括弧{}、if和switch. 4
4.3.3. 運算子、小括弧、空格、關鍵詞和函數… 5
4.3.4. 函數定義… 6
4.3.5. 引號… 6
4.3.6. 多語言問題… 7
4.4. 命名原則… 8
4.4.1. 變數、對象、函數名… 8
4.4.2. 常量… 8
4.5. 變數的初始化與邏輯檢查… 8
4.6. 安全性… 9
4.7. 相容性… 9
4.8. 代碼重用… 10
4.9. 其他細節問題… 10
4.9.1. 包含調用… 10
4.9.2. 錯誤報表層級… 11
5. 資料庫設計…. 11
5.1. 欄位… 11
5.1.1. 表和欄位命名… 11
5.1.2. 欄位結構… 11
5.2. SQL語句… 12
5.3. 效能與效率… 13
5.3.1. 定長與變長表… 13
5.3.2. 運算與檢索… 13
5.3.3. 結構最佳化與索引最佳化… 14
5.3.4. 查詢最佳化… 14
5.3.5. 相容性問題… 16
6. 模板設計…. 16
6.1. 代碼標記… 16
6.2. 書寫規則… 16
6.2.1. HTML. 16
6.2.2. 變數… 16
6.2.3. 語言元素… 17
6.2.4. 縮排… 17
7. 檔案與目錄…. 17
7.1. 檔案命名… 17
7.2. 目錄命名… 18
7.3. 空目錄索引… 18

1. 引言
本規範由編程原則組成,融合并提煉了開發人員長時間積累下來的成熟經驗,意在協助形成良好一致的編程風格。以達到事半功倍的效果,如果有需要本文檔會不定期更新。
著作權: 陝西玖肆陸陸網路科技有限公司,保留所有權利
最後更新日期:年11月20日 2006

2. 適用範圍
如無特殊說明,以下規則要求完全適用於phpcms項目,同時也可大部分適用於公司其他PHP項目。

3. 標準化的重要性和好處
當一個軟體項目嘗試著遵守公用一致的標準時,可以使參與項目的開發人員更容易瞭解項目中的代碼、弄清程式的狀況。使新的參與者可以很快的適應環境,防止部分參與者出於節省時間的需要,自創一套風格並養成終生的習慣,導致其它人在閱讀時浪費過多的時間和精力。而且在一致的環境下,也可以減少編碼出錯的機會。缺陷是由於每個人的標準不同,所以需要一段時間來適應和改變自己的編碼風格,暫時性的降底了工作效率。從使項目長遠健康的發展以及後期更高的團隊工作效率來考慮暫時的工作效率降低是值得的,也是必須要經過的一個過程。標準不是項目成功的關鍵,但可以協助我們在團隊協作中有更高的效率並且更加順利的完成既定的任務。
1. 程式員可以瞭解任何代碼,弄清程式的狀況
2. 新人可以很快的適應環境
3. 防止新接觸PHP的人出於節省時間的需要,自創一套風格並養成終生的習慣
4. 防止新接觸PHP的人一次次的犯同樣的錯誤
5. 在一致的環境下,人們可以減少犯錯的機會
6. 程式員們有了一致的敵人

4. PHP編碼規範與原則

4.1.代碼標記
PHP程式可以使用或來界定 PHP 代碼,在HTML頁面中嵌入純變數時,可以使用這樣的形式。
近年來PHP開發組一直倡導代碼正常化和標準化,未來版本PHP可能會開始不建議使用甚至取消和這種速記形式,因此為了加強程式相容性,在發布之前我們將統一把

4.2.注釋
注釋是對於那些容易忘記作用的代碼添加簡短的介紹性內容。請使用 C 樣式的注釋“/* */”和標準 C++ 注釋“//”。

程式開發中難免留下一些臨時代碼和調試代碼,此類代碼必須添加註釋,以免日後遺忘。所有臨時性、調試性、實驗性的代碼,必須添加統一的注釋標記“//debug”並後跟完整的注釋資訊,這樣可以方便在程式發布和最終調試前批量檢查程式中是否還存在有疑問的代碼。例如:
$num = 1;
$flag = TRUE; //debug 這裡不能確定是否需要對$flag進行賦值
if(empty($flag)) {
//Statements
}

4.3.書寫規則

4.3.1. 縮排
每個縮排的單位約定是一個TAB(8個空白字元寬度),需每個參與項目的開發人員在編輯器(UltraEdit、EditPlus、Zend Studio等)中進行強制設定,以防在編寫代碼時遺忘而造成格式上的不規範。
本縮排規範適用於PHP、JavaScript中的函數、類、邏輯結構、迴圈等。

4.3.2. 大括弧{}、if和switch
首括弧與關鍵詞同行,尾括弧與關鍵字同列;
if結構中,if和elseif與前後兩個圓括弧同行,左右各一個空格,所有大括弧都單獨另起一行。另外,即便if後只有一行語句,仍然需要加入大括弧,以保證結構清晰;
switch結構中,通常當一個case塊處理後,將跳過之後的case塊處理,因此大多數情況下需要添加break。break的位置視程式邏輯,與case同在一行,或新起一行均可,但同一switch體中,break的位置格式應當保持一致。
以下是符合上述規範的例子:
If ($condition)
{
switch ($var)
{
case 1: echo ‘var is 1’; break;
case 2: echo ‘var is 2’; break;
default: echo ‘var is neither 1 or 2’; break;
}
}
else
{
switch ($str)
{
case ‘abc’:
$result = ‘abc’;
break;
default:
$result = ‘unknown’;
break;
}
}

4.3.3. 運算子、小括弧、空格、關鍵詞和函數
每個運算子與兩邊參與運算的值或運算式中間要有一個空格,唯一的特例是字元串連運算子號兩邊不加空格;
左括弧“(” 應和函數關鍵詞緊貼在一起,除此以外應當使用空格將“(”同前面內容分開;
右括弧“)”除後面是“)”或者“.”以外,其他一律用空格隔開它們;
除字串中特意需要,一般情況下,在程式以及HTML中不出現兩個連續的空格;
任何情況下,PHP程式中不能出現空白的帶有TAB或空格的行,即:這類空白行應當不包含任何TAB或空格。同時,任何程式行尾也不能出現多餘的TAB或空格。多數編輯器具有自動去除行尾空格的功能,如果習慣養成不好,可臨時使用它,避免多餘空格產生;
每段較大的程式體,上、下應當加入空白行,兩個程式塊之間只使用1個空行,禁止使用多行。
程式塊劃分盡量合理,過大或者過小的分割都會影響他人對代碼的閱讀和理解。一般可以以較大函數定義、邏輯結構、功能結構來進行劃分。少於15行的程式塊,可不加上下空白行;
說明或顯示部分中,內容如含有中文、數字、英文單詞混雜,應當在數字或者英文單詞的前後加入空格。

根據上述原則,以下舉例說明正確的書寫格式:
$result = (($a + 1) * 3 / 2 + $num)).’Test’;
$condition ? func1($var) : func2($var);
$condition ? $long_statement
: $another_long_statement;
if ($flag)
{

//Statements
//More than 15 lines
}
Showmessage(‘請使用 restore.php 工具恢複資料。’);

4.3.4. 函數定義
l 參數的名字和變數的命名規範一致;
l 函數定義中的左小括弧,與函數名緊挨,中間無需空格;
l 開始的左大括弧另起一行;
l 具有預設值的參數應該位於參數列表的後面;
l 函數調用與定義的時候參數與參數之間加入一個空格;
l 必須仔細檢查並切實杜絕函數起始縮排位置與結束縮排位置不同的現象。

例如,符合標準的定義:
function authcode($string, $operation, $key = '')
{
if($flag)
{
//Statement
}
//函數體
}

不符合標準的定義:
function authcode($string,$operation,$key = '') {
//函數體
}

4.3.5. 引號
PHP中單引號和雙引號具有不同的含義,最大的幾項區別如下:
單引號中,任何變數($var)、特殊逸出字元(如“/t /r /n”等)不會被解析,因此PHP的解析速度更快,逸出字元僅僅支援“/’”和“//”這樣對單引號和反斜線本身的轉義;
雙引號中,變數($var)值會代入字串中,特殊逸出字元也會被解析成特定的單個字元,還有一些專門針對上述兩項特性的特殊功能性轉義,例如“/$”和“{$array[‘key’]}。這樣雖然程式編寫更加方便,但同時PHP的解析也很慢;
數組中,如果下標不是整型,而是字串類型,請務必用單引號將下標括起,正確的寫法為$array[‘key’],而不是$array[key],因為不正確的寫法會使PHP解析器認為key是一個常量,進而先判斷常量是否存在,不存在時才以“key”作為下標帶入運算式中,同時出發錯誤事件,產生一條Notice級錯誤。
因此,在絕大多數可以使用單引號的場合,禁止使用雙引號。依據上述分析,可以或必須使用單引號的情況包括但不限於下述:
l 字串為固定值,不包含“/t”等特殊逸出字元;
l 數組的固定下標,例如$array[‘key’];
l 運算式中不需要帶入變數,例如$string = ‘test’;,而非$string = “test$var”;
例外的,在Regex(用於preg_系列函數和ereg系列函數)中,phpcms全部使用雙引號,這是為了人工分析和編寫的方便,並保持Regex的統一,減少不必要的分析混淆。
資料庫SQL語句中,所有資料都不得加單引號,但是在進行sql查詢之前都必須經過intval函數處理;所有字串都必須加單引號,以避免可能的注入漏洞和SQL錯誤。正確的寫法為:
$catid = intval($catid);
SELECT * FROM phpcms_member WHERE username=’$_username’ AND catid=$catid;

所有資料在插入資料庫之前,均需要進行addslashes()處理,以免特殊字元未經轉義在插入資料庫的時候出現錯誤。phpcms中如果已經引入了檔案 common.inc.php,則所有通過 GET, POST, FILE,取得的變數預設情況下已經使用了addslashes()進行了轉義,不必重複進行。如果資料處理必要(例如用於直接顯示),可以使用 stripslashes() 恢複,但資料在插入資料庫之前必須再次進行轉義。
快取檔案中,一般對快取資料的值採用 addcslashes($string, '/'//')進行轉義。

4.3.6.

4.4.命名原則
命名是程式規劃的核心。古人相信只要知道一個人真正的名字就會獲得淩駕於那個人之上的不可思議的力量。只要你給事物想到正確的名字,就會給你以及後來的人帶來比代碼更強的力量。
名字就是事物在它所處的生態環境中一個長久而深遠的結果。總的來說,只有瞭解系統的程式員才能為系統取出最合適的名字。如果所有的命名都與其自然相適合,則關係清晰,含義可以推導得出,一般人的推想也能在意料之中。
就一般約定而言,類、函數和變數的名字應該總是能夠描述讓代碼閱讀者能夠容易的知道這些代碼的作用。形式越簡單、越有規則,就越容易讓人感知和理解。應該避免使用模稜兩可,晦澀不標準的命名。

4.4.1. 變數、對象、函數名
變數、對象、函數名一律為小寫格式,除非必要,單詞之間一般不使用底線“_”進行分割;
以標準電腦英文為藍本,杜絕一切拼音、或拼音英文混雜的命名方式;
變數命名只能使用項目中有據可查的英文縮寫方式,例如可以使用$data而不可使用$data1、$data2這樣容易產生混淆的形式,應當使用$articledata、$userdata這樣一目瞭然容易理解的形式;
可以合理的對過長的命名進行縮寫,例如$bio($biography),$tpp($threadsPerPage),前提是英文中有這樣既有的縮寫形式,或字母符合英文縮寫規範;
必須清楚所使用英文單詞的詞性,在許可權相關的範圍內,大多使用$enable***、$is*** 、的形式,前者後面接動詞,後者後面接形容詞。

4.4.2. 常量
常量應該總是全部使用大寫字母命名,少數特別必要的情況下,可使用劃線來分隔單詞;
PHP 的內建值 TRUE、FALSE 和NULL必須全部採用大寫字母書寫。

4.5.變數的初始化與邏輯檢查
任何變數在進行累加、直接顯示或儲存前必需進行初使化,例如:
$number = 0; //數值型初始化
$string = ‘’; //字串初始化
$array = array(); //數組初始化

判斷一個無法確定(不知道是否已被賦值)的變數時,可用empty()或isset(),而不要直接使用if($switch)的形式,除非你確切的知道此變數一定已經被初始化並賦值。
empty()和isset()的區別為:
l bool empty(mixed var)
n 如果 var 是非空或非零的值,則 empty() 返回 FALSE。換句話說,""、0、"0"、NULL、FALSE、array()、var $var; 以及沒有任何屬性的對象都將被認為是空的,如果 var 為空白,則返回 TRUE。
l bool isset(mixed var[, mixed var[, ...]])
n 如果 var 存在則返回 TRUE,否則返回 FALSE。
n 如果已經使用 unset() 釋放了一個變數之後,它將不再是 isset()。若使用 isset() 測試一個被設定成 NULL 的變數,將返回 FALSE。同時要注意的是一個 NULL 位元組("/0")並不等同於 PHP 的 NULL 常數。
判斷一個變數是否為數組,請使用is_array(),這種判斷尤其適用於對數組進行遍曆的操作,例如foreach(),因為如果不事先判斷,foreach()會對非數群組類型的變數報錯;
判斷一個數組元素是否存在,可使用isset($array[‘key’]),也可使用empty(),兩者異同見上。

4.6.安全性
PHP中的變數不並不像C語言那樣需要事先聲明,解譯器會在第一次使用時自動建立他們,同樣類型也不需要指定,解譯器會根據上下文環境自動確定。從開發人員的角度來看,這無疑是一種極其方便的處理方法。一個變數被建立了,就可以在程式中的任何地方使用。這導致的結果就是開發人員工經常不注意初始設定變數。因此,為了提高程式的安全性,我們不能相信任何沒有明確定義的變數。所有的變數在定義使用前要初使化以防止惡意構造提交的變數覆蓋程式中使用的變數。
細節可以閱讀(http://www.securereality.com.au/studyinscarlet.txt)這篇文檔,該文檔裡羅列了PHP常見的安全問題,閱讀該文檔是非常有必要的!

4.7.相容性
代碼設計應當兼顧PHP 高低版本的特性,當前,應仍然以PHP 4.3.0作為最低通過平台,盡量不使用高版本PHP 新增的函數、常數或者常量。如果使用只在高版本才具備的函數,必須對其進行二次封裝,自動判斷當前PHP版本,並自行編寫低版本下的相容代碼;
對於個別函數,參數要求或者代碼要求應當以較為嚴格的PHP版本為準;
除非必要,不要使用PHP擴充模組中的函數。使用時應當加入必要的判斷,當伺服器環境不支援此函數的時候,進行必要的處理。文檔和程式中的功能說明中,也應加上相容性說明。

4.8.代碼重用
代碼的有效重用可以減少效率的損失與資源的浪費。在開發軟體項目時為了避免重複勞動和浪費時間。開發人員應盡量提高現有代碼的重用率,同時將更多的精力用在新技術的應用和新功能的創新開發上面。
l 在需要多次使用代碼,並且對於您希望實現的任務沒有可用的內建 PHP 函數時,不吝嗇定義函數或類。開發人員鬚根據功能、調用情況,將函數放置於include目錄並以.func.php作為函數檔案尾碼,將類放置於include/class目錄。超過3行,實現相同功能的程式切勿在不同程式中多次出現,這是無法容忍和迴避的問題;
l 在任何時候都不要出現同一個程式中出現兩段或更多的相似代碼或相同代碼,即便在不同程式中,也應儘力避免。開發人員應當總是有能力找到避免代碼大段(超過10行)重複或類似的情況。
需要強調的是,本部分雖然篇幅較短,但卻是十分需要經驗,並將花費開發人員大量時間和精力去進行最佳化的部分,任何產品開發人員必須時刻清楚和理解代碼重用的重要性和必要性,切實在強化產品效率、邏輯性和可讀性上下功夫,這是一名優秀軟體開發人員所必須具備的基本素質。

4.9.其他細節問題

4.9.1. 包含調用
包含調用程式檔案,請全部使用require_once,以避免可能的重複包含問題;
包含調用快取檔案,由於快取檔案無法保證100%正確開啟,請使用include_once或include。在必要時,可以使用@include_once或@include的方式,以忽略錯誤提示;
包含和調用代碼中,須以PHPCMS_ROOT.’/’開頭,應避免直接寫程式檔案名稱(例如:require_once ‘x.php’;)的做法;
所有被包含和調用的程式檔案,包括但不限於程式、緩衝或模板,通常其不能被直接URL請求。phpcms通過在./include/common.inc.php中定義一個標記性常量IN_PHPCMS,來判斷程式是否被合法調用。因此,在除了./include/common.inc.php以外的任何一個被包含和調用的程式檔案中,需要包含以下內容,以使得訪問者無法直接通過URL請求該檔案:
defined('IN_PHPCMS') or exit('Access Denied');

4.9.2. 錯誤報表層級
在軟體開發和調試階段,請使用error_reporting(E_ALL);作為預設的錯誤報表層級,此層級最為嚴格,能夠報告程式中所有的錯誤、警告和提示資訊,以協助開發人員檢查和核對代碼,避免大多數安全性問題和邏輯錯誤、拼字錯誤。error_reporting()可以在./include/common.inc.php的頭幾行進行設定。
在軟體發布時,請使用error_reporting(E_ERROR | E_WARNING | E_PARSE);作為預設的錯誤報表層級,以利於使用者使用並將無謂錯誤提示資訊降至最低。
5. 資料庫設計
5.1.欄位
5.1.1. 表和欄位命名
表和欄位的命名以前面《4.4命名原則》的約定為基本準則。
所有資料表名稱,只要其名稱是可數名詞,則必須以複數方式命名,例如:phpcms_member(使用者表);儲存多項內容的欄位,或代表數量的欄位,也應當以複數方式命名,例如:hits(查看次數)、items(內容數量)。
當幾個表間的欄位有關連時,要注意表與表之間關聯欄位命名的統一,如phpcms_article_1表中的articleid與phpcms_article_data_1表中的articleid。
代表id自增量的欄位,通常用以下幾種形式:
l 一般情況下,使用全稱的形式,例如userid、articleid;
l 沒有功能性作用,只為管理和維護方便而設的id,可以使用全稱的形式,也可只將其命名為id。
篇幅所限,無法一一贅述,但所有與表、欄位相關的命名,請務必大量參考phpcms現有欄位的命名方式,以保證命名的系統性和統一性。
5.1.2. 欄位結構
允許NULL值的欄位,資料庫在進行比較操作時,會先判斷其是否為NULL,非NULL時才進行值的必對。因此基於效率的考慮,所有欄位均不可為空,即全部NOT NULL;
預計不會儲存非負數的欄位,例如各項id、發帖數等,必須設定為UNSIGNED類型。UNSIGNED類型比非UNSIGNED類型所能儲存的正整數範圍大一倍,因此能獲得更大的數值儲存空間;
儲存開關、選項資料的欄位,通常使用tinyint(1)非UNSIGNED類型,少數情況也可能使用enum()結果集的方式。tinyint作為開關欄位時,通常1為開啟;0為關閉;-1為特殊資料,例如N/A(不可用);高於1的為特殊結果或開關位元組合(詳見phpcms中相關代碼);
MEMORY/HEAP類型的表中,要尤其注意規劃節約使用儲存空間,這將節約更多記憶體。例如cdb_sessions表中,就將IP地址的儲存拆分為4個tinyint(3) UNSIGNED類型的欄位,而沒有採用char(15)的方式;
任何類型的資料表,欄位空間應當本著足夠用,不浪費的原則,數實值型別的欄位取值範圍見下表:
欄位類型 儲存空間(b) UNSIGNED 取值範圍
tinyint 1 否 -128~127
是 0~255
smallint 2 否 -32768~32767
是 0~65535
mediumint 3 否 -8388608~8388607
是 0~16777215
int 4 否 -2147483648~2147483647
是 0~4294967295
bigint 8 否 -9223372036854775808
~9223372036854775807
是 0
~18446744073709551615

5.2.SQL語句
所有SQL語句中,除了表名、欄位名稱以外,全部語句和函數均需大寫,應當杜絕小寫方式或大小寫混雜的寫法。例如select * from phpcms_member;是不符合規範的寫法。
很長的SQL語句應當有適當的斷行,依據JOIN、FROM、ORDER BY等關鍵字進行界定。
通常情況下,在對多表進行操作時,要根據不同表名稱,對每個表指定一個1~2個字母的縮寫,以利於語句簡潔和可讀性。
如下的語句範例,是符合規範的:
$result = $db->query(”SELECT m.*, i.*
FROM “.TABLE_MEMBER.” m, “.TABLE_MEMBERINFO.” i
WHERE m.userid=i.userid AND m.userid=’$_userid’);

5.3.效能與效率
5.3.1. 定長與變長表
包含任何varchar、text等變長欄位的資料表,即為變長表,反之則為定長表。
l 對於變長表,由於記錄大小不同,在其上進行許多刪除和更改將會使表中的片段更多。需要定期運行OPTIMIZE TABLE以保持效能。而定長表就沒有這個問題;
l 如果表中有可變長的欄位,將它們轉換為定長欄位能夠改進效能,因為定長記錄易於處理。但在試圖這樣做之前,應該考慮下列問題:
l 使用定長列涉及某種折衷。它們更快,但佔用的空間更多。char(n) 類型列的每個值總要佔用n 個位元組(即使空串也是如此),因為在表中儲存時,值的長度不夠將在右邊補空格;
l 而varchar(n)類型的列所佔空間較少,因為只給它們分配儲存每個值所需要的空間,每個值再加一個位元組用於記錄其長度。因此,如果在char和varchar類型之間進行選擇,需要對時間與空間作出折衷;
l 變長表到定長表的轉換,不能只轉換一個可變長欄位,必須對它們全部進行轉換。而且必須使用一個ALTER TABLE語句同時全部轉換,否則轉換將不起作用;
l 有時不能使用定長類型,即使想這樣做也不行。例如對於比255字元更長的串,沒有定長類型;
l 在設計表結構時如果能夠使用定長資料類型盡量用定長的,因為定長表的查詢、檢索、更新速度都很快。必要時可以把部分關鍵的、承擔頻繁訪問的表拆分,例如定長資料一個表,非定長資料一個表。例如phpcms的phpcms_member表等。因此規劃資料結構時需要進行全域考慮;
進行表結構設計時,應當做到恰到好處,反覆推敲,從而實現最優的資料存放區體系。
5.3.2. 運算與檢索
數值運算一般比字串運算更快。例如比較運算,可在單一運算中對數進行比較。而串運算涉及幾個逐位元組的比較,如果串更長的話,這種比較還要多。
如果串列的值數目有限,應該利用普通整型或emum類型來獲得數值運算的優越性。
更小的欄位類型永遠比更大的欄位類型處理要快得多。對於字串,其處理時間與串長度直接相關。一般情況下,較小的表處理更快。對於定長表,應該選擇最小的類型,只要能儲存所需範圍的值即可。例如,如果mediumint夠用,就不要選擇bigint。對於可變長類型,也仍然能夠節省空間的。一個TEXT 類型的值用2 位元組記錄值的長度,而一個LONGTEXT 則用4位元組記錄其值的長度。如果儲存的值長度永遠不會超過64KB,使用TEXT 將使每個值節省2位元組。
5.3.3. 結構最佳化與索引最佳化
索引能加快查詢速度,而索引最佳化和查詢最佳化是相輔相成的,既可以依據查詢對索引進行最佳化,也可以依據現有索引對查詢進行最佳化,這取決於修改查詢或索引,哪個對現有產品架構和效率的影響最小。
索引最佳化與查詢最佳化是多年經驗積累的結晶,在此無法詳述,但仍然給出幾條最基本的準則。
首先,根據產品的實際運行和被訪問情況,找出哪些SQL語句是最常被執行的。最常被執行和最常出現在程式中是完全不同的概念。最常被執行的SQL語句,又可被劃分為對大表(資料條目多的)和對小表(資料條目少的)的操作。無論大表或小表,有可分為讀(SELECT)多、寫(UPDATE/INSERT)多或讀寫都多的操作。
對常被執行的SQL語句而言,對大表操作需要尤其注意:
l 寫操作多的,通常可使用寫入緩衝的方法,先將需要寫或需要更新的資料緩衝至檔案或其他表,定期對大表進行批量寫操作。同時,應盡量使得常被讀寫的大表為定長類型,即便原本的結構中大表並非定長。大表定長化,可以通過改變資料存放區結構和資料讀取方式,將一個大表拆成一個讀寫多的定長表,和一個讀多寫少的變長表來實現;
l 讀操作多的,需要依據SQL查詢頻率設定專門針對高頻SQL語句的索引和聯合索引。
而小表就相對簡單,加入符合查詢要求的特定索引,通常效果比較明顯。同時,定長化小表也有益於效率和負載能力的提高。欄位比較少的小定長表,甚至可以不需要索引。
其次,看SQL語句的條件和排序欄位是否動態性很高(即根據不同功能開關或屬性,SQL查詢條件和排序欄位的變化很大的情況),動態性過高的SQL語句是無法通過索引進行最佳化的。惟一的辦法只有將資料緩衝起來,定期更新,適用於結果對實效性要求不高的場合。
MySQL索引,常用的有PRIMARY KEY、INDEX、UNIQUE幾種,詳情請查閱MySQL文檔。通常,在單表資料值不重複的情況下,PRIMARY KEY和UNIQUE索引比INDEX更快,請酌情使用。
事實上,索引是將條件查詢、排序的讀操作資源消耗,分布到了寫操作中,索引越多,耗費磁碟空間越大,寫操作越慢。因此,索引決不能盲目添加。對欄位索引與否,最根本的出發點,依次仍然是SQL語句執行的機率、表的大小和寫操作的頻繁程度。
5.3.4. 查詢最佳化
MySQL中並沒有提供針對查詢條件的最佳化功能,因此需要開發人員在程式中對查詢條件的先後順序人工進行最佳化。例如如下的SQL語句:
SELECT * FROM table WHERE a>’0’ AND b<’1’ ORDER BY c LIMIT 10;

事實上無論a>’0’還是b<’1’哪個條件在前,得到的結果都是一樣的,但查詢速度就大不相同,尤其在對大表進行操作時。
開發人員需要牢記這個原則:最先出現的條件,一定是過濾和排除掉更多結果的條件;第二出現的次之;以此類推。因而,表中不同欄位的值的分布,對查詢速度有著很大影響。而ORDER BY中的條件,只與索引有關,與條件順序無關。
除了條件順序最佳化以外,針對固定或相對固定的SQL查詢語句,還可以通過對索引結構進行最佳化,進而實現相當高的查詢速度。原則是:在大多數情況下,根據WHERE條件的先後順序和ORDER BY的排序欄位的先後順序而建立的聯合索引,就是與這條SQL語句匹配的最優索引結構。儘管,事實的產品中不能只考慮一條SQL語句,也不能不考慮空間佔用而建立太多的索引。
同樣以上面的SQL語句為例,最優的當table表的記錄達到百萬甚至千萬級後,可以明顯的看到索引最佳化帶來的速度提升。
依據上麵條件最佳化和索引最佳化的兩個原則,當table表的值為如下方案時,可以得出最優的條件順序方案:
欄位a 欄位b 欄位c
1 7 11
2 8 10
3 9 13
-1 0 12
最優條件:b<’1’ AND a>’0’
最優索引:INDEX abc (b, a, c)
原因:b<’1’作為第一條件可以先過濾掉75%的結果。如果以a>’0’作為第一條件,則只能先過濾掉25%的結果
注意1:欄位c由於未出現於條件中,故條件順序最佳化與其無關
注意2:最優索引由最優條件順序得來,而非由例子中的SQL語句得來
注意3:索引並非修改資料存放區的物理順序,而是通過對應特定位移量的物理資料而實現的虛擬指標

EXPLAIN語句是檢測索引和查詢能否良好匹配的簡便方法。在phpMyAdmin或其他MySQL用戶端中運行EXPLAIN+查詢語句,例如EXPLAIN select * FROM table WHERE a>’0’ AND b<’1’ ORDER BY c;這種形式,即使得開發人員無需類比上百萬條資料,也可以驗證索引是否合理,相關細節請參考MySQL說明。
值得提出的是,Using filesort是最不應當出現的情況,如果EXPLAIN得出此結果,說明資料庫為這個查詢專門建立了一個用以緩衝結果的暫存資料表檔案,並在查詢結束後刪除。眾所周知,硬碟I/O速度始終是電腦儲存的瓶頸,因此,查詢中應當盡全力避免高執行頻率的SQL語句使用filesort。儘管,開發人員永遠都不可能保證產品中的全部SQL語句都不會使用filesort。
限於篇幅,本文檔遠遠沒有涵蓋資料庫最佳化的方方面面,例如:聯合索引與普通索引的可重用性、JOIN串連的索引設計、MEMORY/HEAP表等。資料庫最佳化實際上就是在很多因素和利弊間不斷權衡、修改,惟有在成功與失敗經驗中反覆推敲才能得出的經驗,這種經驗往往就是最難能可貴和價值連城的。
5.3.5. 相容性問題
由於MySQL 3.23至5.0的變化很大,因此程式中盡量不使用特殊的SQL語句,以免帶來相容性問題,並給資料庫移植造成困難。
通常在MySQL 4.1以上版本,phpcms應使用相當的字元集來儲存,例如GBK/BIG5/UTF-8。傳統的latin1編碼雖然有一定的相容性,但仍然不是推薦的選擇。使用相應非預設字元集時,程式每次運行時需要使用SET NAMES ‘character_set’;來規定串連、傳輸和結果的字元集。
Mysql 5.0以上新增了數種SQL_MODE,預設的SQL_MODE依伺服器安裝設定不同而不同,因此程式每次運行時需要使用SET SQL_MODE=’’;來規定當前的SQL模式。
6. 模板設計
6.1.代碼標記
HTML代碼標記一律採用小寫字母形式,杜絕任何使用大寫字母的方式

模板中所有的邏輯體,如{if}、{loop}等,必須前後使用HTML注釋(<!-- -->),即類似<!--{if expr}-->的形式。事實上,phpcms模板編譯器是支援不加HTML注釋的邏輯體寫法的,但加入注釋可以使得模板可讀性更好,同時方便使用者使用DreamWeaver或FrontPage等對模板進行修改。
6.2.書寫規則
6.2.1. HTML
所有HTML標記參數賦值需使用雙引號包含,例如,應當使用

<input type=”text” name=”test” value=”ok”>
而絕對不能使用

<input type=text name=test value=ok>

在任何情況下,產品中的模板檔案必須採用手寫HTML代碼的方式,而絕對不能使用DreamWeaver、FrontPage等自動網頁製作工具進行撰寫或修改。
6.2.2. 變數
模板中使用的變數,依據作用和出現位置不同,分為幾種方式:
l 邏輯體中,即被包圍起來的部分,例如這種形式,其中的變數書寫規範與PHP程式中完全一致;
開發人員需要使用{}將變數括起來,以免出現模板編譯錯誤,可能的情況如下:
l 變數前後含有中括弧的或其他敏感字元的(包括但不限於“$”、“’”等),正確的寫法為descriptionnew[{$buddy[buddyid]}];
l 數組的下標為變數的,正確的寫法為{$extcredits[$creditstrans][title]};
l 其他變數十分複雜的情況。
6.2.3. 語言元素
6.2.4. 縮排
在phpcms的*.html模板檔案中,由於具備邏輯結構,故不考慮任何HTML本身的縮排,所有縮排均意為著邏輯上的縮排結構。縮排採用TAB方式,不使用空格作為縮排符號,僅需適當斷行即可。例如:

<!--{loop $articles $article}-->
    <table cellspacing=”0” cellspadding=”0” border=”0”>
    <tr><td>{$article[‘title’]}</tr></td>
    </table>
<!--{/loop}-->
7. 檔案與目錄
7.1.檔案命名
所有包含PHP代碼的程式檔案或半程式檔案,應以小寫.php作為副檔名,而不要使用.phtml、.php3、.inc、.class等作為副檔名。
普通程式
能夠被URL直接調用的程式,例如list.php、index.php,直接使用程式名+.php的方式命名
函數庫和類庫程式
分別以小寫.func.php和.class.php作為副檔名。函數庫和類庫程式只能被其他程式引用,而不能獨立運行。其中不能包含任何流程性的、不屬於任何函數或類的程式碼。
流程性程式
以小寫.inc.php作為副檔名。只能被其他程式引用,而不能獨立運行。其中不能包含任何函數或類代碼的程式碼。
模板源檔案
以小寫.html作為副檔名。模板源檔案按照phpcms模板編碼規則進行編寫,不是可以執行的程式,而只能被phpcms模板編譯器所解析,放置於./templates/default或./templates下的其他模板目錄下。
模板目標檔案
模板檔案被編譯後自動產生的目標程式,以小寫. php作為副檔名,存放於./data/templates目錄下。
語言套件檔案
以小寫.lang.php作為副檔名,只能存放模板或程式使用的語言套件資訊。
快取檔案
此類檔案為系統自動產生,以cache_xxx.php、usergroup_xxx.php、style_xxx.php等類似形式命名,存放於./data/cache目錄下。
7.2.目錄命名
phpcms目錄命名以前面《4.4命名原則》的約定為基本準則。在可能的情況下,多以複數形式出現,如./templates、./images等。
由於目錄數量較少,因此目錄命名大多是一些習慣和約定俗成,開發人員如需建立目錄,應與項目群組成員進行磋商,達成一致後方可實施。
7.3.空目錄索引
請在所有不包含普通程式(即能夠被URL直接調用的程式)的目錄中放置一個1位元組的index.htm檔案,內容為一個空格。幾乎除phpcms根目錄以外,所有目錄都屬於這一類型,因此開發人員需要在這些目錄全部放入空index.htm檔案,以避免當http伺服器的Directory Listing開啟時,伺服器檔案被索引和列表。
附件目錄等敏感目錄,要在程式中實現相應功能,當建立下級目錄時,必須自動寫入一個空的index.htm檔案,以避免建立目錄被索引的問題。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.