標籤:模式 translate 取出 常見 mic smtp 處理 瀏覽器 odi
http://blog.jobbole.com/84429/
TCP HTTP UDP:
都是通訊協定,也就是通訊時所遵守的規則,只有雙方按照這個規則“說話”,對方才能理解或為之服務。
TCP HTTP UDP三者的關係:
TCP/IP是個協議組,可分為四個層次:網路介面層、網路層、傳輸層和應用程式層。
在網路層有IP協議、ICMP協議、ARP協議、RARP協議和BOOTP協議。
在傳輸層中有TCP協議與UDP協議。
在應用程式層有FTP、HTTP、TELNET、SMTP、DNS等協議。
因此,HTTP本身就是一個協議,是從Web伺服器傳輸超文本到本地瀏覽器的傳送協議。
socket:
這是為了實現以上的通訊過程而建立成來的通訊管道,其真實的代表是用戶端和伺服器端的一個通訊進程,雙方進程通過socket進行通訊,而通訊的規則採用指定的協議。socket只是一種串連模式,不是協議,tcp、udp,簡單的說(雖然不準確)是兩個最基本的協議,很多其它協議都是基於這兩個協議如,http就是基於tcp的,.用socket可以建立tcp串連,也可以建立udp串連,這意味著,用socket可以建立任何協議的串連,因為其它協議都是基於此的。
下面我們主要來看一下和我們互連網生活密切相關的協議:HTTP
什麼是Http協議
HTTP全稱是HyperText Transfer Protocal,即:超文字傳輸通訊協定 (HTTP),從1990年開始就在WWW上廣泛應用,是現今在WWW上應用最多的協議, Http是應用程式層協議,當你上網瀏覽網頁的時候,瀏覽器和Web伺服器之間就會通過HTTP在Internet上進行資料的發送和接收。Http是一個基於請求/響應模式的、無狀態的協議。即我們通常所說的Request/Response。
URL:
URL(Uniform Resource Locator) 地址用於描述一個網路上的資源, 基本格式如下
schema://host[:port#]/path/…/[?query-string][#anchor]
scheme 指定低層使用的協議(例如:http, https, ftp)
host HTTP伺服器的IP地址或者網域名稱
port# HTTP伺服器的預設連接埠是80,這種情況下連接埠號碼可以省略。如果使用了別的連接埠,必須指明,例如 http://www.cnblogs.com:8080/
path 訪問資源的路徑
query-string 發送給http伺服器的資料
anchor- 錨
URL 的一個例子
http://www.mywebsite.com/sj/test/test.aspx?name=sviergn&x=true#stuff
Schema: http
host: www.mywebsite.com
path: /sj/test/test.aspx
Query String: name=sviergn&x=true
Anchor: stuff
HTTP的Request/Response:
先看Request 訊息的結構, Request 訊息分為3部分
第一部分叫Request line,
第二部分叫Request header,
第三部分是body. header和body之間有個空行,
結構如
第一行中的Method表示要求方法,比如”POST”,”GET”, Path-to-resoure表示請求的資源, Http/version-number 表示HTTP協議的版本號碼
當使用的是”GET” 方法的時候, body是為空白的
比如我們開啟部落格園首頁的request 如下
GET http://www.cnblogs.com/ HTTP/1.1
Host: www.cnblogs.com
抽象的東西,難以理解,老感覺是虛的, 所謂眼見為實, 實際見到的東西,我們才能理解和記憶。 我們今天用Fiddler,實際的看看Request和Response.
下面我們開啟Fiddler 捕捉一個部落格園登入的Request 然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Request的訊息,
如
Accept
作用: 瀏覽器端可以接受的媒體類型,
例如: Accept: text/html 代表瀏覽器可以接受伺服器回傳的類型為 text/html 也就是我們常說的html文檔,
如果伺服器無法返回text/html類型的資料,伺服器應該返回一個406錯誤(non acceptable)
萬用字元 * 代表任意類型
例如 Accept: */* 代表瀏覽器可以處理所有類型,(一般瀏覽器發給伺服器都是發這個)
Referer:
作用: 提供了Request的上下文資訊的伺服器,告訴伺服器我是從哪個連結過來的,比如從我首頁上連結到一個朋友那裡,他的伺服器就能夠從HTTP Referer中統計出每天有多少使用者點擊我首頁上的連結訪問他的網站。
例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT
Accept-Language
作用: 瀏覽器申明自己接收的語言。
語言跟字元集的區別:中文是語言,中文有多種字元集,比如big5,gb2312,gbk等等;
例如: Accept-Language: en-us
Content-Type
作用:
例如:Content-Type: application/x-www-form-urlencoded
Accept-Encoding:
作用: 瀏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支援壓縮,支援什麼壓縮方法(gzip,deflate),(注意:這不是隻字符編碼);
例如: Accept-Encoding: gzip, deflate
User-Agent
作用:告訴HTTP伺服器, 用戶端使用的作業系統和瀏覽器的名稱和版本.
我們上網登陸論壇的時候,往往會看到一些歡迎資訊,其中列出了你的作業系統的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,伺服器應用程式就是從User-Agent這個請求前序域中擷取到這些資訊User-Agent請求前序域允許用戶端將它的作業系統、瀏覽器和其它屬性告訴伺服器。
例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)
Connection
例如: Connection: keep-alive 當一個網頁開啟完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連不會關閉,如果用戶端再次訪問這個伺服器上的網頁,會繼續使用這一條已經建立的串連
例如: Connection: close 代表一個Request完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連會關閉, 當用戶端再次發送Request,需要重建立立TCP串連。
Content-Length
作用:發送給HTTP伺服器資料的長度。
例如: Content-Length: 38
Host(發送請求時,該前序域是必需的)
作用: 請求前序域主要用於指定被請求資源的Internet主機和連接埠號碼,它通常從HTTP URL中提取出來的
例如: 我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html
瀏覽器發送的請求訊息中,就會包含Host請求前序域,如下:
Host:http://www.guet.edu.cn
此處使用預設連接埠號碼80,若指定了連接埠號碼,則變成:Host:指定連接埠號碼
Pragma
作用: 防止頁面被緩衝, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一樣
Pargma只有一個用法, 例如: Pragma: no-cache
Cookie:
作用: 最重要的header, 將cookie的值發送給HTTP 伺服器
Accept-Charset
作用:瀏覽器申明自己接收的字元集,這就是本文前面介紹的各種字元集和字元編碼,如gb2312,utf-8(通常我們說Charset包括了相應的字元編碼方案);
我們再看Response訊息的結構, 和Request訊息的結構基本一樣。 同樣也分為三部分
第一部分叫Response line,
第二部分叫Response header,
第三部分是body. header和body之間也有個空行,
結構如
HTTP/version-number表示HTTP協議的版本號碼, status-code 和message 請看下節[狀態碼]的詳細解釋.
我們用Fiddler 捕捉一個部落格園首頁的Response然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Response的訊息, 如
Cache-Control
作用: 這個是非常重要的規則。 這個用來指定Response-Request遵循的緩衝機制。各個指令含義如下
Cache-Control:Public 可以被任何緩衝所緩衝()
Cache-Control:Private 內容只緩衝到私人緩衝中
Cache-Control:no-cache 所有內容都不會被緩衝
還有其他的一些用法, 我沒搞懂其中的意思, 請大家參考其他的資料
Content-Type
作用:WEB伺服器告訴瀏覽器自己響應的對象的類型和字元集,
例如:
Content-Type: text/html; charset=utf-8
Content-Type:text/html;charset=GB2312
Content-Type: image/jpeg
Expires
作用: 瀏覽器會在指定到期時間內使用本機快取
例如: Expires: Tue, 08 Feb 2022 11:35:14 GMT
Last-Modified:
作用: 用於指示資源的最後修改日期和時間。(執行個體請看上節的If-Modified-Since的執行個體)
例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT
Server:
作用:指明HTTP伺服器的軟體資訊
例如:Server: Microsoft-IIS/7.5
X-AspNet-Version:
作用:如果網站是用ASP.NET開發的,這個header用來表示ASP.NET的版本
例如: X-AspNet-Version: 4.0.30319
X-Powered-By:
作用:表示網站是用什麼技術開發的
例如: X-Powered-By: ASP.NET
Connection
例如: Connection: keep-alive 當一個網頁開啟完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連不會關閉,如果用戶端再次訪問這個伺服器上的網頁,會繼續使用這一條已經建立的串連
例如: Connection: close 代表一個Request完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連會關閉, 當用戶端再次發送Request,需要重建立立TCP串連。
Content-Length
指明實體本文的長度,以位元組方式儲存的十進位數字來表示。在資料下行的過程中,Content-Length的方式要預先在伺服器中緩衝所有資料,然後所有資料再一股腦兒地發給用戶端。
例如: Content-Length: 19847
Date
作用: 產生訊息的具體時間和日期
例如: Date: Sat, 11 Feb 2012 11:35:14 GMT
HTTP協議之Get和Post
Http協議定義了很多與伺服器互動的方法,最基本的有4種,分別是GET,POST,PUT,DELETE. 一個URL地址用於描述一個網路上的資源,而HTTP中的GET, POST, PUT, DELETE就對應著對這個資源的查,改,增,刪4個操作。 我們最常見的就是GET和POST了。GET一般用於擷取/查詢資源資訊,而POST一般用於更新資源資訊.
我們看看GET和POST的區別
1. GET提交的資料會放在URL之後,以?分割URL和傳輸資料,參數之間以&相連,如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的資料放在HTTP包的Body中.
2. GET提交的資料大小有限制(因為瀏覽器對URL的長度有限制),而POST方法提交的資料沒有限制.
3. GET方式需要使用Request.QueryString來取得變數的值,而POST方式通過Request.Form來擷取變數的值,也就是說Get是通過地址欄來傳值,而Post是通過提交表單來傳值。
4. GET方式提交資料,會帶來安全問題,比如一個登入頁面,通過GET方式提交資料時,使用者名稱和密碼將出現在URL上,如果頁面可以被緩衝或者其他人可以訪問這台機器,就可以從記錄獲得該使用者的帳號和密碼.
通訊協定:HTTP、TCP、UDP