標籤:大型 服務端 台電腦 內容 under 應該 提升 尾碼 使用
一.http www連接埠:
http協議www服務的預設連接埠是:80
加密的www服務,http預設連接埠:443(網銀,支付的時候)
二.使用者訪問網站基本流程:
第一步:用戶端使用者從瀏覽器輸入www.baidu.com網站網址後斷行符號,系統會查詢本地host檔案及DNS 緩衝資訊,尋找是否存在網址對應的IP解析記錄。如果有就直接擷取到IP地址,然後訪問網站,一般第一次請求時,DNS緩衝是沒有解析記錄的。
第二步:如果用戶端沒有DNS緩衝或者hosts沒有對應的www.baidu.com網站網址的網域名稱解析記錄,那麼,系統會把瀏覽器的解析請求,交給用戶端本地設定的DNS伺服器位址解析(此DNS為LDNS,即local dns),如果LNDS伺服器的本機快取有對應的解析記錄,就會直接返回IP地址;如果沒有,LDNS會負責繼續請求其他的DNS伺服器。
第三步:LDNS會從DNS系統的“.”根開始請求www.baidu.com網域名稱解析,經過一系列的尋找各個層次DNS伺服器,最終會尋找到wwwl.baidu.com網域名稱對應的授權DNS伺服器,而這個授權DNS伺服器,正是企業購買網域名稱時用於管理網域名稱解析的伺服器。這個伺服器有www.baidu.com對應的IP解析記錄,如果此時都沒有,就表示企業的營運人員沒有給www.baidu.com網域名稱做解析。
第四步:www.baidu.com網域名稱對應的授權DNS伺服器會把www.baidu.com對應的最終IP解析記錄發給LDNS
第五步:LDNS把收到來自授權DNS伺服器關於www.baidu.com對應的IP解析記錄發給用戶端瀏覽器,並且在LDNS本地把網域名稱和IP對應解析緩衝起來,以便下一次更快返回相同的解析請求的記錄
第六步:用戶端瀏覽器擷取到了www.baidu.com的對應IP地址,接下來瀏覽器會請求獲得IP地址對應的web伺服器,web伺服器接收到客戶的請求並響應處理,將客戶請求的內容返回給用戶端瀏覽器
三.動態網頁、靜態網頁、偽靜態網頁
1)靜態網頁
在網頁的設計中,純粹HTML格式的網頁通常被稱為“靜態網頁”。早期的網站一般都是由靜態網頁製作的。靜態網頁相對於動態網頁而言的,是指沒有背景資料庫,不含資料和可互動的網。
特點:你編的是什麼,它就顯示什麼,一旦編寫完成,就不會有任何改變。靜態網頁的維護和更新相對比較麻煩,每個不同的網頁都需要單獨更新,一般使用於更新較少的宣傳型網站。是早期2001年以前多數中小網站展示的形式。
A.靜態網頁每個頁面都有一個固定的URL,且網頁URL一般是以.htm/.html/.shtml等常見形式為尾碼,而且地址中不含有問號
B.網頁內容一經發布到網站伺服器上,無論是否有使用者訪問,每個靜態網頁內容都能儲存在網站伺服器檔案系統之上,也就是說,靜態網頁是實實在在儲存在伺服器上的檔案,每個網頁都是獨立的檔案。
C.靜態網頁想對穩定,因此,容易被搜尋引擎收錄(優點,seo)
D.靜態網頁沒有資料庫的支援,在網站製作和維護方面工作量大,因此,當網站資訊量很大時完全依靠靜態網頁製作的方式比較困難(缺點)
E.靜態網站的互動性較差,在功能方面有巨大的限制(缺點)
F.網頁程式在使用者瀏覽器端解析,如IE瀏覽器,這樣程式解析效率更高,由於服務端不進行解析,因此可以接受更多的並發訪問。當用戶端向伺服器請求資料時,伺服器直接把資料返回(不做任何解析),當用戶端拿到資料後,在瀏覽器端解析展示出來(優點)
重點:
1.用戶端瀏覽器端解析程式,效率很高
2.副檔名格式html/shtml/jpg/wmv格式
3.後端沒有資料庫,沒有和使用者互動
2)動態網頁
與靜態網頁相對的,也就是說,網頁URL的尾碼不是.html/.htm/shtml/.xml等靜態網頁的常見的尾碼副檔名形式。而是以.asp/.aspx/.php/.jsp/do/cgi/perl等形式為尾碼,並且一般在動態網頁網址中經常會有標誌性符號--”?&等
特點:
A.動態網頁一般以資料庫技術為基礎,可以大大降低網站維護的工作量
B.採用動態網頁技術的網站可以實現更多的功能,如使用者註冊、使用者登入、線上調查、投票、使用者管理、訂單管理、發微博等等
C.動態網頁大都並不是獨立存在於伺服器上的網頁檔案、只有當使用者請求時伺服器才返回一個完整的頁面
D.動態網頁中的“?”對搜尋引擎的收錄存在一定的問題,搜尋引擎一般不可能從一個網站的資料庫中訪問全部網頁,或者出於技術方面的考慮,搜尋蜘蛛一般不會去抓網址中的“?”後面的內容,因此採用動態網頁的網站在進行搜尋引擎推廣時需要做一定的技術處理(偽靜態)才能適應搜尋引擎的抓去的要求
E.程式在服務端解析,服務端:php引擎,java容器
F.由於程式在服務端解析,因此,會消耗大量的CPU和記憶體資源等等,因此,效率不如靜態網頁
總結:
1.程式在服務端解析,因此,會消耗大量資源。因此,效率不如靜態網頁
2.URL尾碼一般為asp/aspx/php/jsp/do/cgi/perl
3.架構最佳化:效率差,開發低,經可能轉換為靜態網頁提供服務
3)偽靜態網頁(最重要)
把動態偽裝為靜態。由於搜尋引擎無法正確讀取帶參數的動態網頁內容,造成網頁中很多具有豐富資訊的頁面無法給搜尋引擎收錄,使用偽靜態主要目的便於搜尋引擎收錄和提升使用者體驗。動態偽裝成靜態並不是提高網站的效能,相反會降低網站的效能。現在很多大型的網站都會採用動態網頁產生靜態網頁的技術,消除動態網頁中的參數,使搜尋引擎收錄更多的內容,達到最佳化網站的效果,產生靜態網頁確實很好的解決搜尋引擎收錄的問題,並且可以提升網站的訪問效能。
總結:
1.動態網頁偽裝為靜態網頁
2.目的:便於搜尋引擎收錄,提升使用者訪問以及使用者體驗
3.由於僅僅是偽裝,實際上還是動態,效能沒有提升,反而下降
4.儘可能轉化為真正的靜態介面,除非並發量不是很大,用rewrite實現偽裝態
四.web架構最佳化方案
由於靜態程式在用戶端解析,大大降低了伺服器的壓力,因此解析效率更高。在實際高並髮網站架構中,我們可以考慮把使用者請求的資料解析後存為靜態檔案放在硬碟中或存放在記憶體中,來降低動態伺服器的壓力,從而提升使用者體驗。有關高並髮網站架構從動態轉靜態內容可以參考百度
高並髮網站架構從動態轉靜態例子:
1.門戶新聞業務(一旦發布完成,幾乎不需要改動)
對於新聞的業務靜態轉化相對簡單,由編輯人員發布新聞,就可以產生靜態檔案,然後把靜態內容同步到全國所有伺服器借點上,再對使用者提供訪問
2.視頻業務(一旦上傳發布完成,幾乎不用改動)
優酷視頻網站,使用者上傳視頻,需要經過審核-轉碼的過程,大概需要1-2個小時,審核-轉碼-推送。
五.IP、PV、UV
1)IP-internet Protocol:
IP(獨立IP),即Internet protocol,指獨立IP數。不同IP地址的電腦訪問網路的總次數,是網站流量分析的一個重要指標。00:00-24:00內相同IP地址被計算一次。獨立IP數不標準,只是大概的資料。
2)PV-Page View:
PV訪問量:即page view,中文翻譯即頁面瀏覽,即頁面瀏覽量或點擊量,使用者每次重新整理即被計算一次。PV的具體量度方法就是從瀏覽器發出一個對網路web伺服器的請求(Request),網路伺服器接到這個請求後,會將該請求對應的一個網頁(page)發送給瀏覽器,從而產生一個PV。那麼在這裡只要是開啟這個請求發送給了瀏覽器,無論是這個頁面是否完全開啟(下載完成),那麼都是應該記為1個PV,但是防止使用者刷PV,很多網站把PV的統計程式放在頁面的最下面。PV反映的是瀏覽某網站的頁面數,所以每重新整理一次也算一次。就是說PV與來訪者的數量成正比,但PV並不是頁面的來訪者數量,而是網站被訪問頁面數量。
3)UV-Unique Visitor:
UV(獨立訪客):訪問網站的一台電腦用戶端為一個訪客。00:00-24:00內相同的用戶端只被計算一次。UV度量:1.網站伺服器分辨 2.用cookie分辨
http和www服務基礎知識