Linux策略性路由應用_unix linux

來源:互聯網
上載者:User

    策略性路由

  策略性是指對於IP包的路由是以網路系統管理員根據需要定下的一些策略為主要依據進行路由的。例如我們可以有這樣的策略:“所有來直自網A的包,選擇X路徑;其他選擇Y路徑”,或者是“所有TOS為A的包選擇路徑F;其他選者路徑K”。

  Cisco 的網路作業系統 (Cisco IOS) 從11.0開始就採用新的策略性路由機制。而Linux是在核心2.1開始採用策略性路由機制的。策略性路由機制與傳統的路由演算法相比主要是引入了多路由表以及規則的概念。

  多路由表(multiple Routing Tables)

  傳統的路由演算法是僅使用一張路由表的。但是在有些情形底下,我們是需要使用多路由表的。例如一個子網通過一個路由器與外界相連,路由器與外界有兩條線路相連,其中一條的速度比較快,一條的速度比較慢。對於子網內的大多數使用者來說對速度並沒有特殊的要求,所以可以讓他們用比較慢的路由;但是子網內有一些特殊的使用者卻是對速度的要求比較苛刻,所以他們需要使用速度比較快的路由。如果使用一張路由表上述要求是無法實現的,而如果根據源地址或其它參數,對不同的使用者使用不同的路由表,這樣就可以大大提高路由器的效能。

  規則(rule)

  規則是策略性的關鍵性的新的概念。我們可以用自然語言這樣描述規則,例如我門可以指定這樣的規則:

  規則一:“所有來自192.16.152.24的IP包,使用路由表10, 本規則的優先順序別是1500”

  規則二:“所有的包,使用路由表253,本規則的優先順序別是32767”

  我們可以看到,規則包含3個要素:

  什麼樣的包,將應用本規則(所謂的SELECTOR,可能是filter更能反映其作用);

  符合本規則的包將對其採取什麼動作(ACTION),例如用那個表;

  本規則的優先順序別。優先順序別越高的規則越先匹配(數值越小優先順序別越高)。

  策略性路由的配置方法

  傳統的linux下配置路由的工具是route,而實現策略性路由配置的工具是iproute2工具包。這個軟體包是由Alexey Kuznetsov開發的。
這裡簡單介紹策略性路由的配置方法,以便能更好理解第二部分的內容。詳細的使用方法請參考Alexey Kuznetsov寫的 ip-cfref文檔。策略性路由的配置主要包括介面地址的配置、路由的配置、規則的配置。

  介面地址的配置IP Addr

  對於介面的配置可以用下面的命令進行:

Usage: ip addr [ add | del ] IFADDR dev STRING

  例如:

router># ip addr add 192.168.0.1/24 broadcast 192.168.0.255 label eth0 dev eth0

  上面表示,給介面eth0賦予地址192.168.0.1 掩碼是255.255.255.0(24代表掩碼中1的個數),廣播位址是192.168.0.255

  路由的配置IP Route

  Linux最多可以支援255張路由表,其中有3張表是內建的:

  表255 本地路由表(Local table) 本地介面地址,廣播位址,已及NAT地址都放在這個表。該路由表由系統自動維護,管理員不能直接修改。

  表254 主路由表(Main table) 如果沒有指明路由所屬的表,所有的路由都預設都放在這個表裡,一般來說,舊的路由工具(如route)所添加的路由都會加到這個表。一般是普通的路由。

  表253 預設路由表 (Default table) 一般來說預設的路由都放在這張表,但是如果特別指明放的也可以是所有的網關路由。

  表 0 保留

  路由配置命令的格式如下:
Usage: ip route list SELECTOR
ip route { change | del | add | append | replace | monitor } ROUTE


  如果想查看路由表的內容,可以通過命令:

  ip route list table table_number

  對於路由的操作包括change、del、add 、append 、replace 、 monitor這些。例如添加路由可以用:


router># ip route add 0/0 via 192.168.0.4 table main
router># ip route add 192.168.3.0/24 via 192.168.0.3 table 1


  第一條命令是向主路由表(main table)即表254添加一條路由,路由的內容是設定192.168.0.4成為網關。

  第二條命令代表向路由表1添加一條路由,子網192.168.3.0(子網路遮罩是255.255.255.0)的網關是192.168.0.3。

  在多路由表的路由體系裡,所有的路由的操作,例如網路由表添加路由,或者在路由表裡尋找特定的路由,需要指明要操作的路由表,所有沒有指明路由表,預設是對主路由表(表254)進行操作。而在單表體系裡,路由的操作是不用指明路由表的。

  規則的配置IP Rule

  在Linux裡,總共可以定義 個優先順序的規則,一個優先順序別只能有一條規則,即理論上總共可以有 條規則。其中有3個規則是預設的。命令用法如下:


Usage: ip rule [ list | add | del ] SELECTOR ACTION
SELECTOR := [ from PREFIX ] [ to PREFIX ] [ tos TOS ]
[ dev STRING ] [ pref NUMBER ]
ACTION := [ table TABLE_ID ] [ nat ADDRESS ]
[ prohibit | reject | unreachable ]
[ flowid CLASSID ]
TABLE_ID := [ local | main | default | new | NUMBER


  首先我們可以看看路由表預設的所有規則:


0: from all lookup local
32766: from all lookup main
32767: from all lookup default


  規則0,它是優先順序別最高的規則,規則規定,所有的包,都必須首先使用local表(254)進行路由。本規則不能被更改和刪除。

  規則32766,規定所有的包,使用表main進行路由。本規則可以被更改和刪除。

  規則32767,規定所有的包,使用表default進行路由。本規則可以被更改和刪除。

  在預設情況下進行路由時,首先會根據規則0在本地路由表裡尋找路由,如果目的地址是本網路,或是廣播位址的話,在這裡就可以找到合適的路由;如果路由失敗,就會匹配下一個不空的規則,在這裡只有32766規則,在這裡將會在主路由表裡尋找路由;如果失敗,就會匹配32767規則,即尋找預設路由表。如果失敗,路由將失敗。重這裡可以看出,策略性路由是往前相容的。

  還可以添加規則:


router># ip rule add [from 0/0] table 1 pref 32800
router >#ip rule add from 192.168.3.112/32 [tos 0x10] table 2 pref 1500 prohibit


  第一條命令將向規則鏈增加一條規則,規則匹配的對象是所有的資料包,動作是選用路由表1的路由,這條規則的優先順序是32800。

  第二條命令將向規則鏈增加一條規則,規則匹配的對象是IP為192.168.3.112,tos等於0x10的包,使用路由表2,這條規則的優先順序是1500,動作是。添加以後,我們可以看看系統規則的變化。


router># ip rule
0: from all lookup local
1500 from 192.168.3.112/32 [tos 0x10] lookup 2
32766: from all lookup main
32767: from all lookup default
32800: from all lookup 1


  上面的規則是以源地址為關鍵字,作為是否匹配的依據的。除了源地址外,還可以用以下的資訊:

  From -- 源地址

  To -- 目的地址(這裡是選擇規則時使用,尋找路由表時也使用)

  Tos -- IP包頭的TOS(type of sevice)域

  Dev -- 物理介面

  Fwmark -- 防火牆參數

  採取的動作除了指定表,還可以指定下面的動作:

   Table 指明所使用的表

   Nat 透明網關

   Action prohibit 丟棄該包,並發送 COMM.ADM.PROHIITED的ICMP資訊

   Reject 單純丟棄該包

   Unreachable丟棄該包, 並發送 NET UNREACHABLE的ICMP資訊

    策略性路由的應用

  基於源地址選路( Source-Sensitive Routing)

  如果一個網路通過兩條線路接入互連網,一條是比較快的ADSL,另外一條是比較慢的普通的數據機。這樣的話,網路系統管理員既可以提供無差別的路由服務,也可以根據源地址的不同,使一些特定的地址使用較快的線路,而普通使用者則使用較慢的線路,即基於源址的選路。

  根據服務等級選路(Quality of Service)

  網路系統管理員可以根據IP前序的服務等級域,對於不同的服務需求可以分別對待對於傳送速率、輸送量以及可靠性的有不同要求的資料報根據網路的狀況進行不同的路由。

  節省費用的應用

  網路系統管理員可以根據通訊的狀況,讓一些比較大的陣發性通訊使用一些頻寬比較高但是比較貴的路徑一段短的時間,然後讓基本的通訊繼續使用原來比較便宜的基本線路。例如,管理員知道,某一台主機與一個特定的地址通訊通常是伴隨著大量的陣發性通訊的,那麼網路系統管理員可以安排一些策略,使得這些主機使用特別的路由,這些路由是按需撥號,頻寬比較高的線路,通訊完成以後就停止使用,而普通的通訊則不受影響。這樣既提高網路的效能,又能節省費用。

  Server Load Balancer(Load Sharing)

  根據網路交通的特徵,網路系統管理員可以在不同的路徑之間分配負荷實現Server Load Balancer。

  Linux下策略性路由的實現--RPDB(Routing Policy DataBase)

  在Linux下,策略性路由是由RPDB實現的。對於RPDB的內部機制的理解,可以加深對於策略性路由使用的理解。這裡分析的是linux 2.4.18的RPDB實現的細節。主要的實現檔案包括:

fib_hash.c
fib_rules.c
fib_sematic
fib_frontend.c
route.c


  RDPB主要由多路由表和規則群組成。路由表以及對其的操作和其對外的介面是整個RPDB的核心部分。路由表主要由table,zone,node這些主要的資料結構構成。對路由表的操作主要包含物理的操作以及語義的操作。路由表除了向IP層提供路由尋找的介面以外還必須與幾個元素提供介面:與使用者的介面(即更改路由)、proc的介面、IP層控制介面、以及和硬體的介面(網路介面的改變會導致路由表內容的改變)。處在RDPB的中心的規則,由規則選取表。IP層並不直接使用路由表,而是通過一個路由適配層,路由適配層提供為IP層提供高效能的路由服務。

 路由表(Fib Table)

  資料結構:

  在整個策略性路由的架構裡,路由表是最重要的的資料結構,我們在上面以及對路由表的概念和結構進行了清楚的說明。Linux裡通過下面這些主要的資料結構進行實現的。

 

主要的資料結構 作用 位置
struct fib_table 路由表 ip_fib.h 116
struct fn_hash 路由表的雜湊資料 fib_hash.c 104
struct fn_zone zone域 fib_hash.c 85
struct fib_node 路由節點 fib_hash.c 68
struct fib_info 路由資訊 ip_fib.h 57
struct fib_result 路由結果 ip_fib.h 86


  資料結構之間的主要關係如下。路由表由路由表號以及路由表的操作函數指標還有表資料群組成。這裡需要注意的是,路由表結構裡並不直接定義zone域,而是通過一個資料指標指向fn_hash。只有當zone裡有資料才會串連到fn_zone_list裡。


  系統的所有的路由表由陣列變數*fib_tables[RT_TABLE_MAX+1]維護,其中系統定義RT_TABLE_MAX為254,也就是說系統最大的路由表為255張,所有的路由表的操作都是對這個數組進行的。。同時系統還定義了三長路由表*local_table; *main_table。

  路由表的操作:

  Linux策略路由代碼的主要部分是對路由表的操作。對於路由表的操作,物理操作是直觀的和易於理解的。對於表的操作不外乎就是添加、刪除、更新等的操作。還有一種操作,是所謂的語義操作,語義操作主要是指諸如計算下一條的地址,把節點轉換為路由項,尋找指定資訊的路由等。

  1、物理操作(operation):

  路由表的物理操作主要包括如下這些函數:


路由標操作 實現函數 位置
建立路由表    
刪除路由表    
搜尋路由 fn_hash_lookup fib_hash.c 269
插入路由到路由表 fn_hash_insert fib_hash.c 341
刪除路由表的路由 fn_hash_delete
fn_hash_dump
 fib_hash.c 433
fib_hash.c 614
更新路由表的路由 fn_hash_flush fib_hash.c 729
顯示路由表的路由資訊 fn_hash_get_info fib_hash.c 750
選擇預設路由  fn_hash_select_default fib_hash.c 842


  2、語義操作(semantics operation):

  語義操作並不涉及路由表整體架構的理解,而且,函數名也是不言自明的,所以請大家參考fib_semantics.c。

  3、介面(front end)

  對於路由表介面的理解,關鍵在於理解那裡有

   IP

   首先是路由表於IP層的介面。路由在目前linux的意義上來說,最主要的還是IP層的路由,所以和IP層的的介面是最主要的介面。和ip層的銜接主要是向IP層提供尋找路由、路由控制、尋找指定ip的介面。


Fil_lookup
ip_rt_ioctl fib_frontend.c 286;" f
ip_dev_find 145


   Inet

  路由表還必須提供配置介面,即使用者直接操作路由的介面,例如增加和刪除一條路由。當然在策略性路由裡,還有規則的添加和刪除。


inet_rtm_delroute 351
inet_rtm_newroute 366
inet_check_attr 335


   proc

   在/proc/net/route裡顯示路由資訊。
   fib_get_procinfo

  4、網路裝置(net dev event)

  路由是和硬體關聯的,當網路裝置啟動或關閉的時候,必須通知路由表的管理程式,更新路由表的資訊。


fib_disable_ip 567
fib_inetaddr_event 575
fib_netdev_event


  5、內部維護( magic)

  上面我們提到,本地路由表(local table)的維護是由系統自動進行的。也就是說當使用者為硬體設定IP地址等的時候,系統自動在本地路由表裡添加本地介面地址以及廣播位址。


fib_magic 417
fib_add_ifaddr 459
fib_del_ifaddr 498


  Rule

  1、資料結構

  規則在fib_rules.c的52行裡定義為 struct fib_rule。而RPDB裡所有的路由是儲存在101行的變數fib_rules裡的,注意這個變數很關鍵,它掌管著所有的規則,規則的添加和刪除都是對這個變數進行的。

  2、系統定義規則:

  fib_rules被定義以後被賦予了三條預設的規則:預設規則,本地規則以及主規則。


u 本地規則local_rule
94 static struct fib_rule local_rule = {
r_next: &main_rule, /*下一條規則是主規則*/
r_clntref: ATOMIC_INIT(2),
r_table: RT_TABLE_LOCAL, /*指向本地路由表*/
r_action: RTN_UNICAST, /*動作是返迴路由*/
};

u 主規則main_rule
86 static struct fib_rule main_rule = {
r_next: &default_rule,/*下一條規則是預設規則*/
r_clntref: ATOMIC_INIT(2),
r_preference: 0x7FFE, /*預設規則的優先順序32766*/
r_table: RT_TABLE_MAIN, /*指向主路由表*/
r_action: RTN_UNICAST, /*動作是返迴路由*/
};
u 預設規則default rule
79 static struct fib_rule default_rule = {
r_clntref: ATOMIC_INIT(2),
r_preference: 0x7FFF,/*預設規則的優先順序32767*/
r_table: RT_TABLE_DEFAULT,/*指預設路由表*/
r_action: RTN_UNICAST,/*動作是返迴路由*/
}; 


  規則鏈的鏈頭指向本地規則。

  RPDB的中心函數fib_lookup

  現在到了討論RPDB的實現的的中心函數fib_lookup了。RPDB通過提供介面函數fib_lookup,作為尋找路由的進入點,在這裡有必要詳細討論這個函數,下面是原始碼:,


310 int fib_lookup(const struct rt_key *key, struct fib_result *res)
311 {
312 int err;
313 struct fib_rule *r, *policy;
314 struct fib_table *tb;
315
316 u32 daddr = key->dst;
317 u32 saddr = key->src;
318
321 read_lock(&fib_rules_lock);
322 for (r = fib_rules; r; r=r->r_next) {/*掃描規則鏈fib_rules裡的每一條規則直到匹配為止*/
323 if (((saddr^r->r_src) & r->r_srcmask) ||
324 ((daddr^r->r_dst) & r->r_dstmask) ||
325 #ifdef CONFIG_IP_ROUTE_TOS
326 (r->r_tos && r->r_tos != key->tos) ||
327 #endif
328 #ifdef CONFIG_IP_ROUTE_FWMARK
329 (r->r_fwmark && r->r_fwmark != key->fwmark) ||
330 #endif
331 (r->r_ifindex && r->r_ifindex != key->iif))
332 continue;/*以上為判斷規則是否匹配,如果不匹配則掃描下一條規則,否則繼續*/

335 switch (r->r_action) {/*好了,開始處理動作了*/
336 case RTN_UNICAST:/*沒有設定動作*/
337 case RTN_NAT: /*動作nat ADDRESS*/
338 policy = r;
339 break;
340 case RTN_UNREACHABLE: /*動作unreachable*/
341 read_unlock(&fib_rules_lock);
342 return -ENETUNREACH;
343 default:
344 case RTN_BLACKHOLE:/* 動作reject */
345 read_unlock(&fib_rules_lock);
346 return -EINVAL;
347 case RTN_PROHIBIT:/* 動作prohibit */
348 read_unlock(&fib_rules_lock);
349 return -EACCES;
350 }
351 /*選擇路由表*/
352 if ((tb = fib_get_table(r->r_table)) == NULL)
353 continue;
/*在路由表裡尋找指定的路由*/
354 err = tb->tb_lookup(tb, key, res);
355 if (err == 0) {/*命中目標*/
356 res->r = policy;
357 if (policy)
358 atomic_inc(&policy->r_clntref);
359 read_unlock(&fib_rules_lock);
360 return 0;
361 }
362 if (err < 0 && err != -EAGAIN) {/*路由失敗*/
363 read_unlock(&fib_rules_lock);
364 return err;
365 }
366 }
368 read_unlock(&fib_rules_lock);
369 return -ENETUNREACH;
370 }


  上面的這段代碼的思路是非常的清晰的。首先程式從優先順序高到低掃描所有的規則,如果規則匹配,處理該規則的動作。如果是普通的路由定址或者是nat地址轉換的換,首先從規則得到路由表,然後對該路由表進行操作。這樣RPDB終於清晰的顯現出來了。

    IP層路由適配(IP route)

  路由表以及規則群組成的系統,可以完成路由的管理以及尋找的工作,但是為了使得IP層的路由工作更加的高效,linux的路由體系裡,route.c裡完成大多數IP層與RPDB的適配工作,以及路由緩衝(route cache)的功能。

  調用介面

  IP層的路由介面分為發送路由介面以及接收路由介面:

  發送路由介面

  IP層在發送資料時如果需要進行路由工作的時候,就會調用ip_route_out函數。這個函數在完成一些索引值的簡單轉換以後,就會調用ip_route_output_key函數,這個函數首先在緩衝裡尋找路由,如果失敗就會調用ip_route_output_slow,ip_route_output_slow裡調用fib_lookup在路由表裡尋找路由,如果命中,首先在緩衝裡添加這個路由,然後返回結果。

 

ip_route_out route.h
ip_route_output_key route.c 1984;
ip_route_output_slow route.c 1690;" 


  接收路由介面

  IP層接到一個資料包以後,如果需要進行路由,就調用函數ip_route_input,ip_route_input現在緩衝裡尋找,如果失敗則ip_route_inpu調用ip_route_input_slow, ip_route_input_slow裡調用fib_lookup在路由表裡尋找路由,如果命中,首先在緩衝裡添加這個路由,然後返回結果。


ip_route_input_slow route.c 1312;" f
ip_route_input route.c 1622;" f


  cache

  路由緩衝儲存的是最近使用的路由。當IP在路由表進行路由以後,如果命中就會在路由緩衝裡增加該路由。同時系統還會定時檢查路由緩衝裡的項目是否失效,如果失效則清除。


 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.