一、全文檢索搜尋
Lecene架構 <基於LUCENE的搜尋引擎研究與實現>
二、緩衝
實現頁面級的URL緩衝 <基於網路爬蟲的有效URL緩衝>
三、產生靜態檔案
比如說,一個首頁可能會員由多個部分組成,每個模組產生一個靜態檔案,然後才用伺服器端包含SSI技術進行組裝,其預設的尾碼是.shtml
四、靜態檔案分布儲存於獨立的伺服器
CSS,JS,圖片,檔案等,用一個Apache伺服器來處理請求
五、分布式開發
各伺服器間的資料同步,像新浪一樣發地區的伺服器資料的同步;便於使用伺服器的整合,伺服器可分為:WEB伺服器、Session伺服器、資料庫伺服器、靜態檔案伺服器等等,一個WEB服務就可能由幾十台機器整合後共同提供服務,負載平衡器的使用
六、資料庫的拆分
資料庫表的拆分和資料庫表欄位的拆分
七、搜尋引擎最佳化
SEO
八、訪問監控
JMS
九、單元測試,高並發訪問測試
十、開發文檔的製作
E-R圖,類別關係圖,需求說明書,詳細設計說明書,資料字典等E-R圖
E-RE-R圖也即實體-聯絡圖(Entity Relationship Diagram),提供了表示實體型、屬性和聯絡的方法,用來描述現實世界的概念性模型。 E-R方法:是“實體-聯絡方法”(Entity-Relationship Approach)的簡稱。它是描述現實世界概念結構模型的有效方法。 構成E-R圖的基本要素是實體型、屬性和聯絡,其表示方法為: · 實體型(Entity):具有相同屬性的實體具有相同的特徵和性質,用實體名及其屬性名稱集合來抽象和刻畫同類實體;在E-R圖中用矩形表示,矩形框內寫明實體名;比如學生張三丰、學生李尋歡都是實體。如果是弱實體的話,在矩形外面再套實線矩形。 · 屬性(Attribute):實體所具有的某一特性,一個實體可由若干個屬性來刻畫。在E-R圖中用橢圓形表示,並用無向邊將其與相應的實體串連起來;比如學生的姓名、學號、性別、都是屬性。如果是多值屬性的話,再橢圓形外面再套實線橢圓。如果是派生屬性則用虛線橢圓表示。 · 聯絡(Relationship):聯絡也稱關係,資訊世界中反映實體內部或實體之間的聯絡。實體內部的聯絡通常是指組成實體的各屬性之間的聯絡;實體之間的聯絡通常是指不同實體集之間的聯絡。在E-R圖中用菱形表示,菱形框內寫明聯絡名,並用無向邊分別與有關實體串連起來,同時在無向邊旁標上聯絡的類型(1 : 1,1 : n或m : n)。 比如老師給學生授課存在授課關係,學生選課存在選課關係。如果是弱實體的聯絡則在菱形外面再套菱形。作E-R圖的步驟:
⑴確定所有的實體集合 ⑵選擇實體集應包含的屬性 ⑶確定實體集之間的聯絡 ⑷確定實體集的關鍵字,用底線在屬性上表明關鍵字的屬性群組合 ⑸確定聯絡的類型,在用線將表示聯絡的菱形框聯絡到實體集時,線上旁註明是1或n(多)來表示聯絡的類型
十一、動態部署
Ant等工具的使用
十二、表單提交驗證
用戶端驗證和伺服器端驗證,有一點要注意和說明的是:通過伺服器端驗證失敗後,要返回到客戶表單提交前的頁,並把客戶提交前輸入所有的資訊顯示出來,提示客戶出錯的地方以便其進行修改。最好是可以定義一些全域的驗證規則,如果E-mail的驗證
十三、AJAX非同步呼叫技術的使用
遮罩層的使用,應用於部分資料的驗證如果登入名稱,載入等待資訊的提示
十四、各項資料的備份
有獨立的備份伺服器,做到資料的同步備份