From: http://blog.chinaunix.net/u3/96368/showart_2205234.html
TCP提供的是一種連線導向的,可靠的位元組流服務,TCP提供可靠性的一種重要的方式就是MSS。通過MSS,應用資料被分割成TCP認為最適合發送的數
據塊,由TCP傳遞給IP的資訊單位稱為報文段或段(segment)。代表一個TCP socket的結構體struct
tcp_sock中有多個成員用於確定應用資料被分割成最大為多大的資料區塊較為合適(最大報文段長度MSS)。
我們不難聯想到,跟最大報文段長度最為相關的一個參數是網路裝置介面的MTU,乙太網路的MTU是1500,基本IP首部長度為20,TCP首部是20,所
以MSS的值可達1460(MSS不包括協議首部,只包含應用資料)。
前面的TCP三向交握協議中我們看到,通訊的雙方都通過TCP選項通告了自己期望接收的MSS值,該值直接來源於struct
tcp_sock的成員advmss,而這個值直接取自於網路裝置介面的MTU減去IP首部和TCP首部的長度。在本地乙太網路中可達1460(如果首部都
不含選項的話)。而成員rx_opt是一個結構體struct
tcp_options_received,它記錄的是來自對端的TCP選項通告,其成員mss_clamp表示mss的上限值,其來源就是對端的MSS
通告,而mss_user是使用者佈建的mss,其優先順序最高,如果有user_mss,則使用user_mss,忽略其它。
從上面我們可以看到,MSS是可以通過SYN段進行協商的(MSS選項只能出現在SYN報文段中),但它並不是任何條件下都可以協商的,如果一方不接受來
自另一方的MSS值,並且沒有user_mss,則MSS就定為預設值536位元組(加上首部,允許576位元組的IP資料報)。實際上,struct
tcp_sock->rx_opt->mss_clamp的初始值就定為536,等收到來自對端的MSS通告後,才進行修改。而結構體
struct tcp_sock的成員mss_cache用於緩衝上次的有效mss,其初始值也被定為536。
函數mytcp_sync_mss為一個tcp socket中的mss相關的成員進行資料同步,其基本的一個演算法是:
1、當前的MSS正常情況下應該為mtu-IP首部-TCP首部(不包括選項)。
2、struct
tcp_sock->rx_opt->mss_clamp中含有對端通告的能夠接受的MSS值,如果該值小於第一步計算所得到的MSS,則以
該值為準。
3、IP首部如果帶有IP選項,則MSS中要減去選項長度。
4、如果MSS已經小於48了,則令其等於48。
5、減去TCP首部中選項的長度。
6、如果MSS當前已經大於滑動視窗大小的1/2,則取滑動視窗大小的1/2作為MSS值(但不能小於48)。
7、成員mss_cache用於緩衝下剛剛計算所得的MSS。
所以,說本地乙太網路中MSS為1460的說法並不正確,它還會動態變化,如果IP首部和TCP首部中出現選項,則MSS要相應的減小,一般TCP首部中會
有12位元組的時間戳記選項(外加兩位元組的填充選項),這時的MSS就等於1448。
MSS的主要作用是限制另一端主機發送的資料的長度,同時,主機本身也控制自己發送資料報的長度,這將使以較小MTU串連到一個網路上的主機避免分段。
struct
tcp_sock有一個成員xmit_size_goal,用於記錄該socket發送資料報時的segment的大小,一般情況下它的值就等於
MSS(特殊情況有例外,以後再分析)。