Linux中斷(interrupt)子系統之五:軟體中斷(softIRQ)

來源:互聯網
上載者:User

軟體中斷(softIRQ)是核心提供的一種順延強制機制,它完全由軟體觸發,雖然說是延遲機制,實際上,在大多數情況下,它與普通進程相比,能得到更快的回應時間。非強制中斷也是其他一些核心機制的基礎,比如tasklet,高解析度timer等。

/*****************************************************************************************************/
聲明:本博內容均由http://blog.csdn.net/droidphone原創,轉載請註明出處,謝謝!
/*****************************************************************************************************/

1.  軟體中斷的資料結構1.1  struct softirq_action        核心用softirq_action結構管理軟體中斷的註冊和啟用等操作,它的定義如下:
struct softirq_action{void(*action)(struct softirq_action *);};

非常簡單,只有一個用於回調的函數指標。軟體中斷的資源是有限的,核心目前只實現了10種類型的軟體中斷,它們是:

enum{HI_SOFTIRQ=0,TIMER_SOFTIRQ,NET_TX_SOFTIRQ,NET_RX_SOFTIRQ,BLOCK_SOFTIRQ,BLOCK_IOPOLL_SOFTIRQ,TASKLET_SOFTIRQ,SCHED_SOFTIRQ,HRTIMER_SOFTIRQ,RCU_SOFTIRQ,    /* Preferable RCU should always be the last softirq */NR_SOFTIRQS};

核心的開發人員們不建議我們擅自增加軟體中斷的數量,如果需要新的軟體中斷,儘可能把它們實現為基於軟體中斷的tasklet形式。與上面的枚舉值相對應,核心定義了一個softirq_action的結構數組,每種非強制中斷對應數組中的一項:

static struct softirq_action softirq_vec[NR_SOFTIRQS] __cacheline_aligned_in_smp;
1.2  irq_cpustat_t        多個非強制中斷可以同時在多個cpu運行,就算是同一種非強制中斷,也有可能同時在多個cpu上運行。核心為每個cpu都管理著一個待決非強制中斷變數(pending),它就是irq_cpustat_t:
typedef struct {unsigned int __softirq_pending;} ____cacheline_aligned irq_cpustat_t;
irq_cpustat_t irq_stat[NR_CPUS] ____cacheline_aligned;

__softirq_pending欄位中的每一個bit,對應著某一個非強制中斷,某個bit被置位,說明有相應的非強制中斷等待處理。

1.3  非強制中斷的守護進程ksoftirqd        在cpu的熱插拔階段,核心為每個cpu建立了一個用於執行軟體中斷的守護進程ksoftirqd,同時定義了一個per_cpu變數用於儲存每個守護進程的task_struct結構指標:
DEFINE_PER_CPU(struct task_struct *, ksoftirqd);

大多數情況下,非強制中斷都會在irq_exit階段被執行,在irq_exit階段沒有處理完的非強制中斷才有可能會在守護進程中執行。

2.  觸發非強制中斷        要觸發一個非強制中斷,只要調用api:raise_softirq即可,它的實現很簡單,先是關閉本地cpu中斷,然後調用:raise_softirq_irqoff
void raise_softirq(unsigned int nr){unsigned long flags;local_irq_save(flags);raise_softirq_irqoff(nr);local_irq_restore(flags);}

再看看raise_softirq_irqoff:

inline void raise_softirq_irqoff(unsigned int nr){__raise_softirq_irqoff(nr);        ......if (!in_interrupt())wakeup_softirqd();}

先是通過__raise_softirq_irqoff設定cpu的非強制中斷pending標誌位(irq_stat[NR_CPUS] ),然後通過in_interrupt判斷現在是否在中斷上下文中,或者非強制中斷是否被禁止,如果都不成立,則喚醒非強制中斷的守護進程,在守護進程中執行非強制中斷的回呼函數。否則什麼也不做,非強制中斷將會在中斷的退出階段被執行。3.  非強制中斷的執行        基於上面所說,非強制中斷的執行既可以守護進程中執行,也可以在中斷的退出階段執行。實際上,非強制中斷更多的是在中斷的退出階段執行(irq_exit),以便達到更快的響應,加入守護進程機制,只是擔心一旦有大量的非強制中斷等待執行,會使得核心過長地留在中斷上下文中。3.1  在irq_exit中執行        看看irq_exit的部分:

void irq_exit(void){        ......sub_preempt_count(IRQ_EXIT_OFFSET);if (!in_interrupt() && local_softirq_pending())invoke_softirq();        ......}

如果中斷髮生嵌套,in_interrupt()保證了只有在最外層的中斷的irq_exit階段,invoke_interrupt才會被調用,當然,local_softirq_pending也會實現判斷當前cpu有無待決的非強制中斷。代碼最終會進入__do_softirq中,核心會保證調用__do_softirq時,本地cpu的中斷處於關閉狀態,進入__do_softirq:

asmlinkage void __do_softirq(void){        ......pending = local_softirq_pending();__local_bh_disable((unsigned long)__builtin_return_address(0),SOFTIRQ_OFFSET);restart:/* Reset the pending bitmask before enabling irqs */set_softirq_pending(0);local_irq_enable();h = softirq_vec;do {if (pending & 1) {                ......trace_softirq_entry(vec_nr);h->action(h);trace_softirq_exit(vec_nr);                        ......}h++;pending >>= 1;} while (pending);local_irq_disable();pending = local_softirq_pending();if (pending && --max_restart)goto restart;if (pending)wakeup_softirqd();lockdep_softirq_exit();__local_bh_enable(SOFTIRQ_OFFSET);}
  • 首先取出pending的狀態;
  • 禁止非強制中斷,主要是為了防止和非強制中斷守護進程發生競爭;
  • 清除所有的非強制中斷待決標誌;
  • 開啟本地cpu中斷;
  • 迴圈執行待決非強制中斷的回呼函數;
  • 如果迴圈完畢,發現新的非強制中斷被觸發,則重新啟動迴圈,直到以下條件滿足,才退出:
    • 沒有新的非強制中斷等待執行;
    • 迴圈已經達到最大的迴圈次數MAX_SOFTIRQ_RESTART,目前的設定值時10次;
  • 如果經過MAX_SOFTIRQ_RESTART次迴圈後還未處理完,則啟用守護進程,處理剩下的非強制中斷;
  • 推出前恢複非強制中斷;
3.2  在ksoftirqd進程中執行        從前面幾節的討論我們可以看出,非強制中斷也可能由ksoftirqd守護進程執行,這要發生在以下兩種情況下:
  • 在irq_exit中執行非強制中斷,但是在經過MAX_SOFTIRQ_RESTART次迴圈後,非強制中斷還未處理完,這種情況雖然極少發生,但畢竟有可能;
  • 核心的其它代碼主動調用raise_softirq,而這時正好不是在中斷上下文中,守護進程將被喚醒;

守護進程最終也會調用__do_softirq執行非強制中斷的回調,具體的代碼位於run_ksoftirqd函數中,核心會關閉搶佔的情況下執行__do_softirq,具體的過程這裡不做討論。

4.  tasklet       因為核心已經定義好了10種非強制中斷類型,並且不建議我們自行添加額外的非強制中斷,所以對非強制中斷的實現方式,我們主要是做一個簡單的瞭解,對於驅動程式的開發人員來說,無需實現自己的非強制中斷。但是,對於某些情況下,我們不希望一些操作直接在中斷的handler中執行,但是又希望在稍後的時間裡得到快速地處理,這就需要使用tasklet機制。 tasklet是建立在非強制中斷上的一種順延強制機制,它的實現基於TASKLET_SOFTIRQ和HI_SOFTIRQ這兩個非強制中斷類型。4.1  tasklet_struct        在非強制中斷的初始化函數softirq_init的最後,核心註冊了TASKLET_SOFTIRQ和HI_SOFTIRQ這兩個非強制中斷:
void __init softirq_init(void){        ......open_softirq(TASKLET_SOFTIRQ, tasklet_action);open_softirq(HI_SOFTIRQ, tasklet_hi_action);}

        核心用一個tasklet_struct來表示一個tasklet,它的定義如下:

struct tasklet_struct{struct tasklet_struct *next;unsigned long state;atomic_t count;void (*func)(unsigned long);unsigned long data;};

next用於把同一個cpu的tasklet連結成一個鏈表,state用於表示該tasklet的目前狀態,目前只是用了最低的兩個bit,分別用於表示已經準備被調度執行和已經在另一個cpu上執行:

enum{TASKLET_STATE_SCHED,/* Tasklet is scheduled for execution */TASKLET_STATE_RUN/* Tasklet is running (SMP only) */};

原子變數count用於tasklet對tasklet_disable和tasklet_enable的計數,count為0時表示允許tasklet執行,否則不允許執行,每次tasklet_disable時,該值加1,tasklet_enable時該值減1。func是tasklet被執行時的回呼函數指標,data則用作回呼函數func的參數。

4.2  初始化一個tasklet有兩種辦法初始化一個tasklet,第一種是靜態初始化,使用以下兩個宏,這兩個宏定義一個tasklet_struct結構,並用相應的參數對結構中的欄位進行初始化:
  • DECLARE_TASKLET(name, func, data);定義名字為name的tasklet,預設為enable狀態,也就是count欄位等於0。
  • DECLARE_TASKLET_DISABLED(name, func, data);定義名字為name的tasklet,預設為enable狀態,也就是count欄位等於1。

第二個是動態初始化方法:先定義一個tasklet_struct,然後用tasklet_init函數進行初始化,該方法預設tasklet處於enable狀態:

struct tasklet_struct tasklet_xxx;......tasklet_init(&tasklet_xxx, func, data);
4.3  tasklet的使用方法使能和禁止tasklet,使用以下函數:
  • tasklet_disable()  通過給count欄位加1來禁止一個tasklet,如果tasklet正在運行中,則等待運行完畢才返回(通過TASKLET_STATE_RUN標誌)。
  • tasklet_disable_nosync()  tasklet_disable的非同步版本,它不會等待tasklet運行完畢。
  • tasklet_enable()  使能tasklet,只是簡單地給count欄位減1。

調度tasklet的執行,使用以下函數:

  • tasklet_schedule(struct tasklet_struct *t)  如果TASKLET_STATE_SCHED標誌為0,則置位TASKLET_STATE_SCHED,然後把tasklet掛到該cpu等待執行的tasklet鏈表上,接著發出TASKLET_SOFTIRQ軟體插斷要求。
  • tasklet_hi_schedule(struct tasklet_struct *t)  效果同上,區別是它發出的是HI_SOFTIRQ軟體插斷要求。

銷毀tasklet,使用以下函數:

  • tasklet_kill(struct tasklet_struct *t)  如果tasklet處於TASKLET_STATE_SCHED狀態,或者tasklet正在執行,則會等待tasklet執行完畢,然後清除TASKLET_STATE_SCHED狀態。
4.4  tasklet的內部執行機制核心為每個cpu用定義了一個tasklet_head結構,用於管理每個cpu上的tasklet的調度和執行:
struct tasklet_head{struct tasklet_struct *head;struct tasklet_struct **tail;};static DEFINE_PER_CPU(struct tasklet_head, tasklet_vec);static DEFINE_PER_CPU(struct tasklet_head, tasklet_hi_vec);

回到4.1節,我們知道,tasklet是利用TASKLET_SOFTIRQ和HI_SOFTIRQ這兩個非強制中斷來實現的,兩個非強制中斷只是有優先順序的差別,所以我們只討論TASKLET_SOFTIRQ的實現,TASKLET_SOFTIRQ的中斷回呼函數是tasklet_action,我們看看它的代碼:

static void tasklet_action(struct softirq_action *a){struct tasklet_struct *list;local_irq_disable();list = __this_cpu_read(tasklet_vec.head);__this_cpu_write(tasklet_vec.head, NULL);__this_cpu_write(tasklet_vec.tail, &__get_cpu_var(tasklet_vec).head);local_irq_enable();while (list) {struct tasklet_struct *t = list;list = list->next;if (tasklet_trylock(t)) {if (!atomic_read(&t->count)) {if (!test_and_clear_bit(TASKLET_STATE_SCHED, &t->state))BUG();t->func(t->data);tasklet_unlock(t);continue;}tasklet_unlock(t);}local_irq_disable();t->next = NULL;*__this_cpu_read(tasklet_vec.tail) = t;__this_cpu_write(tasklet_vec.tail, &(t->next));__raise_softirq_irqoff(TASKLET_SOFTIRQ);local_irq_enable();}}

解析如下:

  • 關閉本地中斷的前提下,移出當前cpu的待處理tasklet鏈表到一個臨時鏈表後,清除當前cpu的tasklet鏈表,之所以這樣處理,是為了處理當前tasklet鏈表的時候,允許新的tasklet被調度進待處理鏈表中。
  • 遍曆臨時鏈表,用tasklet_trylock判斷當前tasklet是否已經在其他cpu上運行,而且tasklet沒有被禁止:
    • 如果沒有運行,也沒有禁止,則清除TASKLET_STATE_SCHED狀態位,執行tasklet的回呼函數。
    • 如果已經在運行,或者被禁止,則把該tasklet重新添加會當前cpu的待處理tasklet鏈表上,然後觸發TASKLET_SOFTIRQ非強制中斷,等待下一次非強制中斷時再次執行。

分析到這了我有個疑問,看了上面的代碼,如果一個tasklet被tasklet_schedule後,在沒有被執行前被tasklet_disable了,豈不是會無窮無盡地引發TASKLET_SOFTIRQ非強制中斷?

通過以上的分析,我們需要注意的是,tasklet有以下幾個特徵:
  • 同一個tasklet只能同時在一個cpu上執行,但不同的tasklet可以同時在不同的cpu上執行;
  • 一旦tasklet_schedule被調用,核心會保證tasklet一定會在某個cpu上執行一次;
  • 如果tasklet_schedule被調用時,tasklet不是出於正在執行狀態,則它只會執行一次;
  • 如果tasklet_schedule被調用時,tasklet已經正在執行,則它會在稍後被調度再次被執行;
  • 兩個tasklet之間如果有資源衝突,應該要用自旋鎖進行同步保護;

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.