標籤:
前言:明知山有釜,偏向釜山行-----電影《釜山行》
-------------------------------------------------------------------------------------------------------->
今天給大家簡單的說一下,http協議以及幾種常見的狀態代碼:
一、http協議
概述:
超文字傳輸通訊協定 (HTTP)(HTTP,HyperText Transfer Protocol)是互連網上應用最為廣泛的一種網路通訊協定。所有的WWW檔案都必須遵守這個標準。
HTTP是一個用戶端和伺服器端請求和應答的標準(TCP)。用戶端是終端使用者,伺服器端是網站。通過使用Web瀏覽器、網路爬蟲或者其它的工具,用戶端發起一個到伺服器上指定連接埠(預設連接埠為80)的HTTP請求。(我們稱這個用戶端)叫使用者代理程式(user agent)。應答的伺服器上儲存著(一些)資源,比如HTML檔案和映像。(我們稱)這個應答伺服器為原始伺服器(origin server)。
HTTP協議採用了請求/響應模型。用戶端向伺服器發送一個請求,要求標頭包含請求的方法、URL、協議版本、以及包含請求修飾符、客戶資訊和內容的類似於MIME的訊息結構。伺服器以一個狀態行作為響應,響應的內容包括訊息協議的版本,成功或者錯誤編碼加上包含伺服器資訊、實體元資訊以及可能的實體內容。
特點:
支援客戶/伺服器模式。
簡單快速:客戶向伺服器請求服務時,只需傳送要求方法和路徑。要求方法常用的有GET、HEAD、POST。每種方法規定了客戶與伺服器聯絡的類型不同。由於HTTP協議簡單,使得HTTP伺服器的程式規模小,因而通訊速度很快。
靈活:HTTP允許傳輸任意類型的資料對象。正在傳輸的類型由Content-Type加以標記。
無串連:不需連線的含義是限制每次串連只處理一個請求。伺服器處理完客戶的請求,並收到客戶的應答後,即中斷連線。採用這種方式可以節省傳輸時間。
無狀態:HTTP協議是無狀態協議。無狀態是指協議對於交易處理沒有記憶能力。缺少狀態意味著如果後續處理需要前面的資訊,則它必須重傳,這樣可能導致每次串連傳送的資料量增大。另一方面,在伺服器不需要先前資訊時它的應答就較快。
總結:以上就是http協議最基本的概述和特點,內容較多,且都比較難理解,以後的隨筆會隨之更新和http協議相關的技術內容。
二、狀態代碼
眾所周知,做web開發,常見的幾種狀態代碼是必須要瞭解的,而且幾個狀態代碼在面試中也有可能要考。
在這其中,200,304,403,404,500,是必須要知道的,且在爬蟲工程師這個職位,這些所有狀態代碼都是必須要知道的。
總結:如有不妥,歡迎指正。
HTTP協議和幾種常見的狀態代碼