2.1 網路驅動程式的結構
Linux網路驅動程式的體繫結構1所示。
可以劃分為四層:(1)協議介面層
(2)網路裝置介面層
(3)裝置驅動功能層
(4)及網路裝置和網路媒介層。
網路驅動程式重點:完成裝置驅動功能層
在Linux中,所有網路裝置都抽象為一個介面(interface)。這個介面提供了對所有網路裝置的操作集合,由資料結構 struct net_device表示。
資料結構net_device中有很多供系統訪問和協議層調用的裝置方法,包括供裝置初始化和往系統註冊用的init函數、開啟和關閉網路裝置的open和stop函數、處理資料包發送的函數hard_ start_xmit,以及中斷處理函數等。有關net_device資料結構(在核心中也就是net_device)的詳細內容,請參看/linux/include/linux/netdevice.h
2.2
網路驅動實現模式
實現Linux網路裝置驅動功能主要有兩種形式:
(1)通過核心來進行載入,當核心啟動的時候,就開始載入網路裝置驅動程式,核心啟動完成之後,網路驅動功能也隨即實現了;
(2)再就是通過模組載入的形式。
比較兩者,第二種形式更加靈活。在此著重對模組載入形式進行討論。
(1)insmod 來把網路裝置驅動程式插入到核心之中。
(2) insmod將調用init_module()函數
(3) 對dev->init函數指標賦值,
(4)register_netdev()函數註冊該網路裝置。如果成功,網路裝置初始化,
將net_device 資料結構插入到dev_base鏈表的末尾。
(5)模組卸載 rmmod具體實現過程見圖2所示。
2.3 網路驅動程式的基本方法
2.3.1
初始化
net_device->init 所指的函數來完成。
(1)檢查裝置是否存在
(2)資源分派
(3)構造net_device, 用檢測到的資料值對net_device 變數初始化。
(4)向Linux核心註冊該裝置並申請記憶體空間。
2.3.2 開啟(open)
open:網路裝置被啟用時調用(即裝置狀態由down-->up)。所以實際上很多在initialize中的工作可以放到這裡來做。比如資源的申請,硬體的啟用。如果dev->open返回非0(error),則硬體的狀態還是down。
open另一個作用是如果驅動程式做為一個模組被裝入,則要防止模組卸載時裝置處於開啟狀態。在open方法裡要調用MOD_INC_USE_COUNT宏。
2.3.3 關閉(stop)
close釋放資源,裝置狀態由up轉為down時被調用的。做為模組裝入的驅動程式,close裡應該調用MOD_DEC_USE_COUNT,減少裝置被引用的次數,以使驅動程式可以被卸載。close方法必須返回成功(0==success)。
2.3.4 資料包的發送
(1) 網路裝置驅動載入時,網路裝置的初始化函數(net_device->init)
(2)開啟網路裝置 (net_device->open)
(3)通過net_device->hard_header 建立硬體包頭函數指標
(4)最後通過協議介面層函數dev_queue_xmit(詳見/linux/net/core/dev.c)來調用net_device->hard_start_xmit,完成資料包的發送。
(5)如果發送成功,hard_start_xmit方法裡釋放sk_buff,返回0(發送成功)。
如果暫時無法處理,比如硬體忙,則返回1。這時如果dev->tbusy置為非0,則系統認為硬體忙,要等到dev->tbusy置0以後才會再次發送。
tbusy的置0任務一般由中斷完成。硬體在發送結束後產生中斷,這時可以把tbusy置0,然後用mark_bh()調用通知系統可以再次發送。
2.3.5 接收(reception) 驅動程式不存在一個接收方法。有資料收到應該是驅動程式來通知系統的。
(1)裝置收到資料後都會產生一個中斷
(2)中斷處理常式中驅動程式申請一塊sk_buff(skb),從硬體讀出資料放置到申請好的緩衝區裡。
(3)填充sk_buff中的相關資訊。skb->dev = dev,判斷收到幀的協議類型,填入skb->protocol(多協議的支援)。把指標skb->mac.raw指向硬體資料然後丟棄硬體幀頭(skb_pull)。還要設定skb->pkt_type,標明第二層(鏈路層)資料類型。可以是以下類型:
PACKET_BROADCAST : 鏈路層廣播
PACKET_MULTICAST : 鏈路層組播
PACKET_SELF : 發給自己的幀
PACKET_OTHERHOST : 發給別人的幀(監聽模式時會有這種幀)
(4)最後調用netif_rx()把資料傳送給協議層。
2.3.6 硬體幀頭(hard_header)
硬體在上層資料發送之前加上自己的硬體幀頭(例:乙太網路 有14位元組的幀頭)
相關函數 hard_header
2.3.7 位址解析(xarp)
有些網路有硬體地址(比如Ethernet),並且在發送硬體幀時需要知道目的硬體地址。這樣就需要上層協議地址(ip、ipx)和硬體地址的對應。這個對應是通過位址解析完成的。需要做arp的的裝置在發送之前會調用驅動程式的rebuild_header方法。調用的主要參數包括指向硬體幀頭的指標,協議層地址。如果驅動程式能夠解析硬體地址,就返回1,如果不能,返回0。
對rebuild_header的調用在net/core/dev.c的do_dev_queue_xmit()裡。
2.3.8 參數設定和統計資料
在驅動程式裡還提供一些方法供系統對裝置的參數進行設定和讀取資訊。一般只有超級使用者(root)許可權才能對裝置參數進行設定。設定方法有:
dev->set_mac_address()
當使用者調用ioctl類型為SIOCSIFHWADDR時是要設定這個裝置的mac地址。一般對mac地址的設定沒有太大意義的。
dev->set_config()
當使用者調用ioctl時類型為SIOCSIFMAP時,系統會調用驅動程式的set_config方法。使用者會傳遞一個ifmap結構包含需要的I/O、中斷等參數。
dev->do_ioctl()
dev->do_ioctl()
如果使用者調用ioctl時類型在SIOCDEVPRIVATE和SIOCDEVPRIVATE+15之間,系統會調用驅動程式的這個方法。一般是設定裝置的專用資料。
讀取資訊也是通過ioctl調用進行。除次之外驅動程式還可以提供一個
dev->get_stats方法,返回一個enet_statistics結構,包含發送接收的統計資訊。
ioctl的處理在net/core/dev.c的dev_ioctl()和dev_ifsioc()裡。
2.4 網路驅動程式中用到的資料結構
net_device是網路驅動最核心的部分,最重要的是網路裝置的資料結構。定義在include/linux/netdevice.h裡。它的注釋已經足夠詳盡。
the devie methods
int (*open)(struct net_device *dev);
int (*stop)(struct net_device *dev);
int (*hard_start_xmit) (struct sk_buff *skb, struct net_device *dev);
初始化資料包的傳輸。
2.5 常用的系統支援
2.5.1 記憶體申請和釋放
include/linux/kernel.h裡聲明了kmalloc()和kfree()。用於在核心模式下申請和釋放記憶體。
void *kmalloc(unsigned int len,int priority);
void kfree(void *__ptr);
與使用者模式下的malloc()不同,kmalloc()申請空間有大小限制。長度是2的整次方。可以申請的最大長度也有限制。另外kmalloc()有priority參數,通常使用時可以為GFP_KERNEL,如果在中斷裡調用用GFP_ATOMIC參數,因為使用GFP_KERNEL則調用者可能進入sleep狀態,在處理中斷時是不允許的。
kfree()釋放的記憶體必須是kmalloc()申請的。如果知道記憶體的大小,也可以用kfree_s()釋放。
2.5.2 request_irq()、free_irq()
這是驅動程式申請中斷和釋放中斷的調用。在include/linux/sched.h裡聲明。request_irq()調用的定義:
int request_irq( unsigned int irq,
irqreturn_t (*handler)( ),
unsigned long flags,
const char *dev_name,
void *dev_id);
irq: 要申請的硬體中斷號。在Intel平台,範圍0--15。
handler: 向系統登記的中斷處理函數。
irqflags: 中斷處理的屬性。
(1)SA_INTERRUPT,標明快速中斷,該中斷調用時屏蔽所有中斷。
(2)SA_SHIRQ屬性,設定了以後運行多個裝置共用中斷。
(3)SA_SAMPLE_RANDOM 停機時間戳可以產生系統熵。
dev_id:在中斷共用時會用到。一般設定為這個裝置的device結構本身或者NULL。中斷處理常式可以用dev_id找到相應的控制這個中斷的裝置,或者用rq2dev_map找到中斷對應的裝置。
void free_irq(unsigned int irq,void *dev_id);
2.5.3 時鐘
時鐘的處理類似中斷,也是登記一個時間處理函數,在預定的時間過後,系統會調用這個函數。在include/linux/timer.h裡聲明。
struct timer_list {
struct list_head list;
unsigned long expires;
unsigned long data;
void (*function)(unsigned long);
};
void add_timer(struct timer_list * timer);
int del_timer(struct timer_list * timer);
void init_timer(struct timer_list * timer);
(1)聲明一個timer_list結構,調用init_timer對它進行初始化。
(2)time_list結構裡expires是標明這個時鐘的周期,單位jiffies的單位(1/HZ)。
(3)function就是時間到了以後的回呼函數,它的參數就是timer_list中的data。
(4)data這個參數在初始化時鐘的時候賦值,一般賦給它裝置的device結構指標。
在預置時間到系統調用function,同時系統把這個time_list從定時隊列裡清除。所以如果需要一直使用定時函數,要在function裡再次調用add_timer()把這個函數。
2.5.4 I/O連接埠的存取使用:
inline unsigned int inb(unsigned short port);
inline unsigned int inb_p(unsigned short port);
inline void outb(char value, unsigned short port);
inline void outb_p(char value, unsigned short port);
在include/adm/io.h裡定義。
inb_p()、outb_p()與inb()、outb_p()的不同在於前者在存取I/O時有等待
(pause)一適應慢速的I/O裝置
防止存取I/O時發生衝突 (1)連接埠使用之前,檢查需要的I/O是否正在被使用,如果沒有,則把連接埠標記為正在使用,使用完後再釋放。
int check_region(unsigned int from, unsigned int extent);
void request_region(unsigned int from,
unsigned int extent,
const char *name);
void release_region(unsigned int from, unsigned int extent);
其中的參數from表示用到的I/O連接埠的起始地址,extent標明從from開始的連接埠數目。name為裝置名稱。
2.5.5 中斷開啟關閉
系統提供給驅動程式開放和關閉響應中斷的能力。是在include/asm/system.h中的兩個定義。
#define cli() __asm__ __volatile__ ("cli"::)
#define sti() __asm__ __volatile__ ("sti"::)
2.5.6 列印資訊
類似普通程式裡的printf(),驅動程式要輸出資訊使用printk()。在include/linux/kernel.h裡聲明。
int printk(const char* fmt, ...);
其中fmt是格式化字串。...是參數。都是和printf()格式一樣的。
2.5.7 註冊驅動程式
如果使用模組(module)方式載入驅動程式,需要在模組初始化時把裝置註冊到系統裝置表裡去。不再使用時,把裝置從系統中卸載。定義在drivers/net/net_init.h裡的兩個函數完成這個工作。
int register_netdev(struct net_device *dev);
void unregister_netdev(struct net_device *dev);
dev:待註冊的裝置結構指標。註:net_device最重要的是name指標和init方法。name指標空(NULL)或者內容為''或者name[0]為空白格(space),則系統把裝置做為乙太網路裝置處理。
register_netdev()返回0表示成功,非0不成功。
2.5.8 sk_buff
Linux網路各層之間的資料傳送都是通過sk_buff,是Linux系統網路高效啟動並執行關鍵。sk_buff包括控制方法和資料緩衝區。控制方法按功能分為兩種類型: (1)一種是控制整個buffer鏈的方法 (2)控制資料緩衝區的方法。
sk_buff組織成雙向鏈表的形式,根據網路應用的特點,對鏈表的操作主要是刪除鏈表頭的元素和添加到鏈表尾。
.alloc_skb() 申請一個sk_buff並對它初始化。返回就是申請到的sk_buff。
.dev_alloc_skb()類似alloc_skb,在申請好緩衝區後,保留16位元組的幀頭空間。主要用在Ethernet驅動程式。
.kfree_skb() 釋放一個sk_buff。
.skb_clone() 複製一個sk_buff,但不複製資料部分。
.skb_copy()完全複製一個sk_buff。
.skb_dequeue() 從一個sk_buff鏈表裡取出第一個元素。返回取出的sk_buff,如果鏈表空則返回NULL。這是常用的一個操作。
.skb_queue_head() 在一個sk_buff鏈表頭放入一個元素。
.skb_queue_tail() 在一個sk_buff鏈表尾放入一個元素。這也是常用的一個操作。網路資料的處理主要是對一個先進先出隊列的管理,skb_queue_tail()和skb_dequeue()完成這個工作。
.skb_insert() 在鏈表的某個元素前插入一個元素。
.skb_append() 在鏈表的某個元素後插入一個元素。一些協議(如TCP)對沒按順序到達的資料進行重組時用到skb_insert()和skb_append()。
.skb_reserve() 在一個申請好的sk_buff的緩衝區裡保留一塊空間。這個空間一般是用做下一層協議的頭空間的。
.skb_put() 在一個申請好的sk_buff的緩衝區裡為資料保留一塊空間。在
alloc_skb以後,申請到的sk_buff的緩衝區都是處於空(free)狀態,有一個tail指標指向free空間,實際上開始時tail就指向緩衝區頭。skb_reserve()在free空間裡申請協議頭空間,skb_put()申請資料空間。見下面的圖。
.skb_push() 把sk_buff緩衝區裡資料空間往前移。即把Head room中的空間移一部分到Data area。
.skb_pull() 把sk_buff緩衝區裡Data area中的空間移一部分到Head room中。
上一篇:《【Linux device driver】裝置驅動程式概述(一)》
下一篇:《【Linux device driver】網路裝置驅動注意的問題(三)》