Linux作業系統網路驅動程式編寫3

來源:互聯網
上載者:User

/* For load balancing driver pair support */

unsigned long pkt_queue; /* Packets queued */
struct device *slave; /* Slave device */
struct net_alias_info *alias_info; /* main dev alias info */
struct net_alias *my_alias; /* alias devs */

/* Pointer to the interface buffers. */
struct sk_buff_head buffs[DEV_NUMBUFFS];

/* Pointers to interface service routines. */
int (*open)(struct device *dev);
int (*stop)(struct device *dev);
int (*hard_start_xmit) (struct sk_buff *skb,
struct device *dev);
int (*hard_header) (struct sk_buff *skb,
struct device *dev,
unsigned short type,
void *daddr,
void *saddr,
unsigned len);
int (*rebuild_header)(void *eth, struct device *dev,
unsigned long raddr, struct sk_buff *skb);
#define HAVE_MULTICAST
void (*set_multicast_list)(struct device *dev);
#define HAVE_SET_MAC_ADDR
int (*set_mac_address)(struct device *dev, void *addr);
#define HAVE_PRIVATE_IOCTL
int (*do_ioctl)(struct device *dev, struct ifreq *ifr, int cmd);
#define HAVE_SET_CONFIG
int (*set_config)(struct device *dev, struct ifmap *map);
#define HAVE_HEADER_CACHE
void (*header_cache_bind)(struct hh_cache **hhp, struct device
*dev, unsigned short htype, __u32 daddr);
void (*header_cache_update)(struct hh_cache *hh, struct device
*dev, unsigned char * haddr);
#define HAVE_CHANGE_MTU
int (*change_mtu)(struct device *dev, int new_mtu);

struct iw_statistics* (*get_wireless_stats)(struct device *dev);
};

2.4 常用的系統支援

2.4.1 記憶體申請和釋放
include/linux/kernel.h裡聲明了kmalloc()和kfree()。用於在核心模式下申
請和釋放記憶體。
Void *kmalloc(unsigned int len,int priority);
void kfree(void *__ptr);
與使用者模式下的malloc()不同,kmalloc()申請空間有大小限制。長度是2的整
次方。可以申請的最大長度也有限制。另外kmalloc()有priority參數,通常使用
時可以為GFP_KERNEL,如果在中斷裡調用用GFP_ATOMIC參數,因為使用GFP_KERNEL
則調用者可能進入sleep狀態,在處理中斷時是不允許的。
Kfree()釋放的記憶體必須是kmalloc()申請的。如果知道記憶體的大小,也可以用
kfree_s()釋放。

2.4.2 request_irq()、free_irq()
這是驅動程式申請中斷和釋放中斷的調用。在include/linux/sched.h裡聲明。
Request_irq()調用的定義:
int request_irq(unsigned int irq,
void (*handler)(int irq, void *dev_id, struct pt_regs *regs),
unsigned long irqflags,
const char * devname,
void *dev_id);
irq是要申請的硬體中斷號。在Intel平台,範圍0--15。Handler是向系統登記
的中斷處理函數。這是一個回呼函數,中斷髮生時,系統調用這個函數,傳入的參
數包括硬體中斷號,device id,寄存器值。Dev_id就是下面的request_irq時傳遞
給系統的參數dev_id。Irqflags是中斷處理的一些屬性。比較重要的有SA_INTERRUPT,
標明中斷處理常式是快速處理常式(設定SA_INTERRUPT)還是慢速處理常式(不設定
SA_INTERRUPT)。快速處理常式被調用時屏蔽所有中斷。慢速處理常式不屏蔽。還有
一個SA_SHIRQ屬性,設定了以後運行多個裝置共用中斷。Dev_id在中斷共用時會用
到。一般設定為這個裝置的device結構本身或者NULL。中斷處理常式可以用dev_id
找到相應的控制這個中斷的裝置,或者用irq2dev_map找到中斷對應的裝置。
Void free_irq(unsigned int irq,void *dev_id);

2.4.3 時鐘
時鐘的處理類似中斷,也是登記一個時間處理函數,在預定的時間過後,系統
會調用這個函數。在include/linux/timer.h裡聲明。
Struct timer_list {
struct timer_list *next;
struct timer_list *prev;
unsigned long expires;
unsigned long data;
void (*function)(unsigned long);
};
void add_timer(struct timer_list * timer);
int del_timer(struct timer_list * timer);
void init_timer(struct timer_list * timer);
使用時鐘,先聲明一個timer_list結構,調用init_timer對它進行初始化。
Time_list結構裡expires是標明這個時鐘的周期,單位採用jiffies的單位。
Jiffies是Linux一個全域變數,代表時間。它的單位隨硬體平台的不同而不同。
系統裡定義了一個常數HZ,代表每秒種最小時間間隔的數目。這樣jiffies的單位
就是1/HZ。Intel平台jiffies的單位是1/100秒,這就是系統所能分辨的最小時間
間隔了。所以expires/HZ就是以秒為單位的這個時鐘的周期。
Function就是時間到了以後的回呼函數,它的參數就是timer_list中的data。
Data這個參數在初始化時鐘的時候賦值,一般賦給它裝置的device結構指標。
在預置時間到系統調用function,同時系統把這個time_list從定時隊列裡清
除。所以如果需要一直使用定時函數,要在function裡再次調用add_timer()把這

------------------ Linux作業系統網路驅動程式編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------

個timer_list加進定時隊列。

2.4.4 I/O
I/O連接埠的存取使用:
inline unsigned int inb(unsigned short port);
inline unsigned int inb_p(unsigned short port);
inline void outb(char value, unsigned short port);
inline void outb_p(char value, unsigned short port);
在include/adm/io.h裡定義。
Inb_p()、outb_p()與inb()、outb_p()的不同在於前者在存取I/O時有等待
(pause)一適應慢速的I/O裝置。
為了防止存取I/O時發生衝突,Linux提供對連接埠使用方式的控制。在使用連接埠
之前,可以檢查需要的I/O是否正在被使用,如果沒有,則把連接埠標記為正在使用,
使用完後再釋放。系統提供以下幾個函數做這些工作。
Int check_region(unsigned int from, unsigned int extent);
void request_region(unsigned int from, unsigned int extent,const char *name);
void release_region(unsigned int from, unsigned int extent);
其中的參數from表示用到的I/O連接埠的起始地址,extent標明從from開始的端
口數目。Name為裝置名稱。

2.4.5 中斷開啟關閉
系統提供給驅動程式開放和關閉響應中斷的能力。是在include/asm/system.h
中的兩個定義。
#define cli() __asm__ __volatile__ (\"cli\"::)
#define sti() __asm__ __volatile__ (\"sti\"::)

2.4.6 列印資訊
類似普通程式裡的printf(),驅動程式要輸出資訊使用printk()。在include
/linux/kernel.h裡聲明。
Int printk(const char* fmt, ...);
其中fmt是格式化字串。...是參數。都是和printf()格式一樣的。

2.4.7 註冊驅動程式
如果使用模組(module)方式載入驅動程式,需要在模組初始化時把裝置註冊
到系統裝置表裡去。不再使用時,把裝置從系統中卸載。定義在drivers/net/net_init.h
裡的兩個函數完成這個工作。
Int register_netdev(struct device *dev);
void unregister_netdev(struct device *dev);
dev就是要註冊進系統的裝置結構指標。在register_netdev()時,dev結構一
般填寫前面11項,即到init,後面的暫時可以不用初始化。最重要的是name指標和
init方法。Name指標空(NULL)或者內容為\"\\0\"或者name[0]為空白格(space),則系統
把你的裝置做為乙太網路裝置處理。乙太網路裝置有統一的命名格式,ethX。對乙太網路
這麼特別對待大概和Linux的曆史有關。
Init方法一定要提供,register_netdev()會調用這個方法讓你對硬體檢測和
設定。
Register_netdev()返回0表示成功,非0不成功。

2.4.8 sk_buff
Linux網路各層之間的資料傳送都是通過sk_buff。Sk_buff提供一套管理緩衝
區的方法,是Linux系統網路高效啟動並執行關鍵。每個sk_buff包括一些控制方法和一
塊資料緩衝區。控制方法按功能分為兩種類型。一種是控制整個buffer鏈的方法,
另一種是控制資料緩衝區的方法。Sk_buff組織成雙向鏈表的形式,根據網路應用
的特點,對鏈表的操作主要是刪除鏈表頭的元素和添加到鏈表尾。Sk_buff的控制
方法都很短小以盡量減少系統負荷。(translated from article written by Alan
Cox)
常用的方法包括:
.alloc_skb() 申請一個sk_buff並對它初始化。返回就是申請到的sk_buff。
.dev_alloc_skb()類似alloc_skb,在申請好緩衝區後,保留16位元組的幀頭空
間。主要用在Ethernet驅動程式。
.kfree_skb() 釋放一個sk_buff。
.skb_clone() 複製一個sk_buff,但不複製資料部分。
.skb_copy()完全複製一個sk_buff。
.skb_dequeue() 從一個sk_buff鏈表裡取出第一個元素。返回取出的sk_buff,
如果鏈表空則返回NULL。這是常用的一個操作。
.skb_queue_head() 在一個sk_buff鏈表頭放入一個元素。
.skb_queue_tail() 在一個sk_buff鏈表尾放入一個元素。這也是常用的一個
操作。網路資料的處理主要是對一個先進先出隊列的管理,skb_queue_tail()
和skb_dequeue()完成這個工作。
.skb_insert() 在鏈表的某個元素前插入一個元素。
.skb_append() 在鏈表的某個元素後插入一個元素。一些協議(如TCP)對沒按
順序到達的資料進行重組時用到skb_insert()和skb_append()。

.skb_reserve() 在一個申請好的sk_buff的緩衝區裡保留一塊空間。這個空間
一般是用做下一層協議的頭空間的。
.skb_put() 在一個申請好的sk_buff的緩衝區裡為資料保留一塊空間。在
alloc_skb以後,申請到的sk_buff的緩衝區都是處於空(free)狀態,有一個
tail指標指向free空間,實際上開始時tail就指向緩衝區頭。Skb_reserve()
在free空間裡申請協議頭空間,skb_put()申請資料空間。見下面的圖。
.skb_push() 把sk_buff緩衝區裡資料空間往前移。即把Head room中的空間移
一部分到Data area。
.skb_pull() 把sk_buff緩衝區裡Data area中的空間移一部分到Head room中。

--------------------------------------------------
| Tail room(free) |
--------------------------------------------------
After alloc_skb()

--------------------------------------------------
| Head room | Tail room(free) |
--------------------------------------------------
After skb_reserve()

--------------------------------------------------
| Head room | Data area | Tail room(free) |
--------------------------------------------------
After skb_put()

--------------------------------------------------
|Head| skb_ | Data | Tail room(free) |
|room| push | | |
| | Data area | |
--------------------------------------------------
After skb_push()

--------------------------------------------------
| Head | skb_ | Data area | Tail room(free) |
| | pull | | |
| Head room | | |
--------------------------------------------------
After skb_pull()

------------------ Linux作業系統網路驅動程式編寫 -------------------
------------ Contact the author by mailto:bordi@bordi.dhs.org ------

三.編寫Linux網路驅動程式中需要注意的問題

3.1 中斷共用
Linux系統運行幾個裝置共用同一個中斷。需要共用的話,在申請的時候指明
共用方式。系統提供的request_irq()調用的定義:
int request_irq(unsigned int irq,
void (*handler)(int irq, void *dev_id, struct pt_regs *regs),
unsigned long irqflags,
const char * devname,
void *dev_id);
如果共用中斷,irqflags設定SA_SHIRQ屬性,這樣就允許別的裝置申請同一個
中斷。需要注意所有用到這個中斷的裝置在調用request_irq()都必須設定這個屬
性。系統在回調每個中斷處理常式時,可以用dev_id這個參數找到相應的裝置。一
般dev_id就設為device結構本身。系統處理共用中斷是用各自的dev_id參數依次調
用每一個中斷處理常式。

3.2 硬體發送忙時的處理
主CPU的處理能力一般比網路發送要快,所以經常會遇到系統有資料要發,但
上一包資料網路裝置還沒發送完。因為在Linux裡網路裝置驅動程式一般不做資料
緩衝,不能發送的資料都是通知系統發送不成功,所以必須要有一個機制在硬體不
忙時及時通知系統接著發送下面的資料。
一般對發送忙的處理在前面裝置的發送方法(hard_start_xmit)裡已經描述過,
即如果發送忙,置tbusy為1。處理完髮送資料後,在發送結束中斷裡清tbusy,同
時用mark_bh()調用通知系統繼續發送。
但在具體實現我的驅動程式時發現,這樣的處理系統好象並不能及時地知道硬
件已經空閑了,即在mark_bh()以後,系統要等一段時間才會接著發送。造成發送
效率很低。2M線路只有10%不到的使用率。核心版本為2.0.35。
我最後的實現是不把tbusy置1,讓系統始終認為硬體空閑,但是報告發送不成
功。系統會一直嘗試重發。這樣處理就運行正常了。但是遍循核心源碼中的網路驅
動程式,似乎沒有這樣處理的。不知道癥結在哪裡。

3.3 流量控制(flow control)
網路資料的發送和接收都需要流量控制。這些控制是在系統裡實現的,不需要
驅動程式做工作。每個裝置資料結構裡都有一個參數dev->tx_queue_len,這個參數
標明發送時最多緩衝的資料包。在Linux系統裡乙太網路裝置(10/100Mbps)
tx_queue_len一般設定為100,串列線路(非同步串口)為10。實際上如果看源碼可以
知道,設定了dev->tx_queue_len並不是為緩衝這些資料申請了空間。這個參數只是
在收到協議層的資料包時判斷髮送隊列裡的資料是不是到了tx_queue_len的限度,
以決定這一包資料加不加進發送隊列。發送時另一個方面的流控是更高層協議的發
送視窗(TCP協議裡就有發送視窗)。達到了視窗大小,高層協議就不會再發送資料。
接收流控也分兩個層次。Netif_rx()緩衝的資料包有限制。另外高層協議也會
有一個最大的等待處理的資料量。

發送和接收流控處理在net/core/dev.c的do_dev_queue_xmit()和netif_rx()
中。

3.4 調試
很多Linux的驅動程式都是編譯進核心的,形成一個大的核心檔案。但對調試
來說,這是相當麻煩的。調試驅動程式可以用module方式載入。支援模組方式的
驅動程式必須提供兩個函數:int init_module(void)和void cleanup_module(void)。
Init_module()在載入此模組時調用,在這個函數裡可以register_netdev()註冊
裝置。Init_module()返回0表示成功,返回負表示失敗。Cleanup_module()在驅動
程式被卸載時調用,清除佔用的資源,調用unregister_netdev()。
模組可以動態地載入、卸載。在2.0.xx版本裡,還有kerneld自動載入模組,
但是2.2.xx中已經取消了kerneld。手工載入使用insmod命令,卸載用rmmod命令,
看核心中的模組用lsmod命令。
編譯驅動程式用gcc,主要命令列參數-DKERNEL -DMODULE。並且作為模組載入
的驅動程式,只編譯成obj形式(加-c參數)。編譯好的目標檔案放在/lib/modules
/2.x.xx/misc下,在開機檔案裡用insmod載入。

四.進一步的閱讀
Linux程式設計資料可以從網上獲得。這就是開放原始碼的好處。並且沒有什
麼“未公開的秘密”。我編寫驅動程式時參閱的主要資料包括:
Linux核心原始碼
<> by Michael K. Johnson
<> by Ori Pomerantz
<> by olly in BBS水木清華站 可以選擇一個模板作為開始,核心原始碼裡有一個網路驅動程式的模板,
drivers/net/skeleton.c。裡麵包含了驅動程式的基本內容。但這個模板是以以太
網裝置為對象的,乙太網路的處理在Linux系統裡有特殊“待遇”,所以如果不是以
太網裝置,有些細節上要注意,主要在初始化程式裡。
最後,多參照別人寫的程式,聽聽其他開發人員的經驗之談大概是最有效協助
了。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.