Linux 2.6 對新型 CPU 快速系統調用的支援

來源:互聯網
上載者:User
 

Linux 2.6 對新型 CPU 快速系統調用的支援

轉載自:IBMdeveloperWorks 中國

劉子銳
Linux 愛好者
2004 年 5 月

文章分析了在 Linux 2.6 中引入的對 Intel CPU 快速系統調用指令 SYSENTER/SYSEXIT 支援的實現。Linux 驅動及核心開發人員通過瞭解快速系統調用指令的機制,可以在自己的代碼中通過利用這一機制,提高系統效能,並避開由快速系統調用方式帶來的一些局限(如系統調用中嵌套系統調用)。

前言

在 Linux 2.4 核心中,使用者態 Ring3 代碼請求核心態 Ring0 程式碼完成某些功能是通過系統調用完成的,而系統調用的是通過非強制中斷指令(int 0x80)實現的。在 x86 保護模式中,處理 INT 中斷指令時,CPU 首先從中斷描述表 IDT 取出對應的門描述符,判斷門描述符的種類,然後檢查門描述符的層級 DPL 和 INT 指令調用者的層級 CPL,當 CPL<=DPL 也就是說 INT 調用者層級高於描述符指定層級時,才能成功調用,最後再根據描述符的內容,進行壓棧、跳轉、權限等級提升。核心代碼執行完畢之後,調用 IRET 指令返回,IRET 指令恢複使用者棧,並跳轉會低層級的代碼。

其實,在發生系統調用,由 Ring3 進入 Ring0 的這個過程浪費了不少的 CPU 週期,例如,系統調用必然需要由 Ring3 進入 Ring0(由核心調用 INT 指令的方式除外,這多半屬於 Hacker 的核心模組所為),許可權提升之前和之後的層級是固定的,CPL 肯定是 3,而 INT 80 的 DPL 肯定也是 3,這樣 CPU 檢查門描述符的 DPL 和調用者的 CPL 就是完全沒必要。正是由於如此,Intel x86 CPU 從 PII 300(Family 6,Model 3,Stepping 3)之後,開始支援新的系統調用指令 sysenter/sysexit。sysenter 指令用於由 Ring3 進入 Ring0,SYSEXIT 指令用於由 Ring0 返回 Ring3。由於沒有特權層級檢查的處理,也沒有壓棧的操作,所以執行速度比 INT n/IRET 快了不少。

不同系統調用方式的效能比較:

下面是一些來自互連網的有關 sysenter/sysexit 指令和 INT n/IRET 指令在 Intel Pentium CPU 上的效能對比:

表1:系統調用效能測試測試硬體:Intel Pentium III CPU, 450 MHzProcessor Family: 6 Model: 7 Stepping: 2

  使用者模式花費的時間 核心模式花費的時間
基於 sysenter/sysexit 指令的系統調用 9.833 microseconds 6.833 microseconds
基於中斷 INT n 指令的系統調用 17.500 microseconds 7.000 microseconds

資料來源:[1]

資料來源:[2]

表2:各種 CPU 上 INT 0x80 和 SYSENTER 執行速度的比較

CPU Int0x80 sysenter
Athlon XP 1600+ 277 169
800MHz mode 1 athlon 279 170
2.8GHz p4 northwood ht 1152 442

上述資料為對 100000 次 getppid() 系統調用所花費的 CPU 刻度取的平均值
資料來源[3]

自這種技術推出之後,人們一直在考慮在 Linux 中加入對這種指令的支援,在 Kernel.org 的郵件清單中,主題為 "Intel P6 vs P7 system call performance" 的大量郵件討論了採用這種指令的必要性,郵件中列舉的理由主要是 Intel 在 Pentium 4 的設計上存在問題,造成 Pentium 4 使用中斷方式執行的系統調用比 Pentium 3 以及 AMD Athlon 所耗費的 CPU 刻度多上 5~10 倍。因此,在 Pentium 4 平台上,通過 sysenter/sysexit 指令來執行系統調用已經是刻不容緩的需求。

sysenter/sysexit 系統調用的機制:

在 Intel 的軟體開發人員手冊第二、三卷(Vol.2B,Vol.3)中,4.8.7 節是關於 sysenter/sysexit 指令的詳細描述。手冊中說明,sysenter 指令可用於特權級 3 的使用者代碼調用特權級 0 的系統核心代碼,而 SYSEXIT 指令則用於特權級 0 的系統代碼返回使用者空間中。sysenter 指令可以在 3,2,1 這三個特權層級調用(Linux 中只用到了特權級 3),而 SYSEXIT 指令只能從特權級 0 調用。

執行 sysenter 指令的系統必須滿足兩個條件:1.目標 Ring 0 程式碼片段必須是平坦模式(Flat Mode)的 4GB 的可讀可執行檔非一致程式碼片段。2.目標 RING0 堆棧段必須是平坦模式(Flat Mode)的 4GB 的可讀可寫向上擴充的棧段。

在 Intel 的手冊中,還提到了 sysenter/sysexit 和 int n/iret 指令的一個區別,那就是 sysenter/sysexit 指令並不成對,sysenter 指令並不會把 SYSEXIT 所需的返回地址壓棧,sysexit 返回的地址並不一定是 sysenter 指令的下一個指令地址。調用 sysenter/sysexit 指令地址的跳轉是通過設定一組特殊寄存器實現的。這些寄存器包括:

SYSENTER_CS_MSR - 用於指定要執行的 Ring 0 代碼的程式碼片段選擇符,由它還能得出目標 Ring 0 所用堆棧段的段選擇符;

SYSENTER_EIP_MSR - 用於指定要執行的 Ring 0 代碼的起始地址;

SYSENTER_ESP_MSR-用於指定要執行的Ring 0代碼所使用的棧指標

這些寄存器可以通過 wrmsr 指令來設定,執行 wrmsr 指令時,通過寄存器 edx、eax 指定設定的值,edx 指定值的高 32 位,eax 指定值的低 32 位,在設定上述寄存器時,edx 都是 0,通過寄存器 ecx 指定填充的 MSR 寄存器,sysenter_CS_MSR、sysenter_ESP_MSR、sysenter_EIP_MSR 寄存器分別對應 0x174、0x175、0x176,需要注意的是,wrmsr 指令只能在 Ring 0 執行。

這裡還要介紹一個特性,就是 Ring0、Ring3 的程式碼片段描述符和堆棧段描述符在通用描述元表 GDT 中是順序排列的,這樣只需知道 SYSENTER_CS_MSR 中指定的 Ring0 的程式碼片段描述符,就可以推算出 Ring0 的堆棧段描述符以及 Ring3 的程式碼片段描述符和堆棧段描述符。

在 Ring3 的代碼調用了 sysenter 指令之後,CPU 會做出如下的操作:

1. 將 SYSENTER_CS_MSR 的值裝載到 cs 寄存器

2. 將 SYSENTER_EIP_MSR 的值裝載到 eip 寄存器

3. 將 SYSENTER_CS_MSR 的值加 8(Ring0 的堆棧段描述符)裝載到 ss 寄存器。

4. 將 SYSENTER_ESP_MSR 的值裝載到 esp 寄存器

5. 將特權級切換到 Ring0

6. 如果 EFLAGS 寄存器的 VM 標誌被置位,則清除該標誌

7. 開始執行指定的 Ring0 代碼

在 Ring0 代碼執行完畢,調用 SYSEXIT 指令退回 Ring3 時,CPU 會做出如下操作:

1. 將 SYSENTER_CS_MSR 的值加 16(Ring3 的程式碼片段描述符)裝載到 cs 寄存器

2. 將寄存器 edx 的值裝載到 eip 寄存器

3. 將 SYSENTER_CS_MSR 的值加 24(Ring3 的堆棧段描述符)裝載到 ss 寄存器

4. 將寄存器 ecx 的值裝載到 esp 寄存器

5. 將特權級切換到 Ring3

6. 繼續執行 Ring3 的代碼

由此可知,在調用 SYSENTER 進入 Ring0 之前,一定需要通過 wrmsr 指令設定好 Ring0 代碼的相關資訊,在調用 SYSEXIT 之前,還要保證寄存器edx、ecx 的正確性。

如何得知 CPU 是否支援 sysenter/sysexit 指令

根據 Intel 的 CPU 手冊,我們可以通過 CPUID 指令來查看 CPU 是否支援 sysenter/sysexit 指令,做法是將 EAX 寄存器賦值 1,調用 CPUID 指令,寄存器 edx 中第 11 位(這一位名稱為 SEP)就表示是否支援。在調用 CPUID 指令之後,還需要查看 CPU 的 Family、Model、Stepping 屬性來確認,因為據稱 Pentium Pro 處理器會報告 SEP 但是卻不支援 sysenter/sysexit 指令。只有 Family 大於等於 6,Model 大於等於 3,Stepping 大於等於 3 的時候,才能確認 CPU 支援 sysenter/sysexit 指令。

Linux 對 sysenter/sysexit 系統調用方式的支援

在 2.4 核心中,直到最近的發布的 2.4.26-rc2 版本,沒有加入對 sysenter/sysexit 指令的支援。而對 sysenter/sysexit 指令的支援最早是2002 年,由 Linus Torvalds 編寫並首次加入 2.5 版核心中的,經過多方測試和多次 patch,最終正式加入到了 2.6 版本的核心中。

http://kerneltrap.org/node/view/531/1996

http://lwn.net/Articles/18414/

具體談到系統調用的完成,不能孤立的看核心的代碼,我們知道,系統調用多被封裝成庫函數提供給應用程式調用,應用程式調用庫函數後,由 glibc 庫負責進入核心調用系統調用函數。在 2.4 核心加上老版的 glibc 的情況下,庫函數所做的就是通過 int 指令來完成系統調用,而核心提供的系統調用介面很簡單,只要在 IDT 中提供 INT 0x80 的入口,庫就可以完成中斷調用。

在 2.6 核心中,核心代碼同時包含了對 int 0x80 中斷方式和 sysenter 指令方式調用的支援,因此核心會給使用者空間提供一段入口代碼,核心啟動時根據 CPU 類型,決定這段代碼採取哪種系統調用方式。對於 glibc 來說,無需考慮系統調用方式,直接調用這段入口代碼,即可完成系統調用。這樣做還可以盡量減少對 glibc 的改動,在 glibc 的源碼中,只需將 "int $0x80" 指令替換成 "call 入口地址" 即可。

下面,以 2.6.0 的核心代碼配合支援 SYSENTER 調用方式的 glibc2.3.3 為例,分析一下系統調用的具體實現。

核心在啟動時做的準備

前面說到的這段入口代碼,根據調用方式分為兩個檔案,支援 sysenter 指令的程式碼封裝含在檔案 arch/i386/kernel/vsyscall-sysenter.S 中,支援int中斷的程式碼封裝含在arch/i386/kernel/vsyscall-int80.S中,入口名都是 __kernel_vsyscall,這兩個檔案編譯出的二進位代碼由arch/i386/kernel/vsyscall.S所包含,並匯出起始地址和結束位址。

2.6 核心在啟動的時候,調用了新增的函數sysenter_setup(參見arch/i386/kernel/sysenter.c),在這個函數中,核心將虛擬記憶體空間的頂端一個固定地址頁面(從0xffffe000開始到0xffffeffff的4k大小)映射到一個閒置實體記憶體頁面。然後通過之前執行CPUID的指令得到的資料,檢測CPU是否支援sysenter/sysexit指令。如果CPU不支援,那麼將採用INT調用方式的入口代碼拷貝到這個頁面中,然後返回。相反,如果CPU支援SYSETER/SYSEXIT指令,則將採用SYSENTER調用方式的入口代碼拷貝到這個頁面中。使用宏 on_each_cpu在每個CPU上執行enable_sep_cpu這個函數。

在enable_sep_cpu函數中,核心將當前CPU的TSS結構中的ss1設定為當前核心使用的程式碼片段,esp1設定為該TSS結構中保留的一個256位元組大小的堆棧。在X86中,TSS結構中ss1和esp1本來是用於儲存Ring 1進程的堆棧段和堆棧指標的。由於核心在啟動時,並不能預知調用sysenter指令進入Ring 0後esp的確切值,而應用程式又無權調用wrmsr指令動態設定,所以此時就借用esp1指向一個固定的緩衝區來填充這個MSR寄存器,由於Ring 1根本沒被啟用,所以並不會對系統造成任何影響。在下面的文章中會介紹進入Ring 0之後,核心如何修複ESP來指向正確的Ring 0堆棧。關於TSS結構更細節的應用可參考代碼include/asm-i386/processor.h)。

然後,核心通過wrmsr(msr,val1,val2)宏調用wrmsr指令對當前CPU設定MSR寄存器,可以看出調用宏的第三個參數即edx都被設定為0。其中SYSENTER_CS_MSR的值被設定為當前核心用的所在程式碼片段;SYSENTER_ESP_MSR被設定為esp1,即指向當前CPU的 TSS結構中的堆棧;SYSENTER_EIP_MSR則被設定為核心中處理sysenter指令的介面函數sysenter_entry(參見 arch/i386/kernel/entry.S)。這樣,sysenter指令的準備工作就完成了。

通過核心在啟動時進行這樣的設定,在每個進程的進程空間中,都能訪問到核心所映射的這個字碼頁面,當然這個頁面對於應用程式來說是唯讀。我們通過新版的ldd工具查看任意一個可執行程式,可以看到下面的結果:

[root@test]# file dynamicdynamic: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 2.2.5, dynamically linked (uses shared libs), not stripped[root@test]# ldd dynamic        linux-gate.so.1 =>  (0xffffe000)        libc.so.6 => /lib/tls/libc.so.6 (0x4002c000)        /lib/ld-linux.so.2 => /lib/ld-linux.so.2 (0x40000000)

這個所謂的"linux-gate.so.1"的內容就是核心映射的代碼,系統中其實並不存在這樣一個連結庫檔案,它的名字是由ldd自己起的,而在老版本的ldd中,雖然能夠檢測到這段代碼,但是由於沒有命名而且在系統中找不到對應連結庫檔案,所以會有一些顯示上的問題。有關這個問題的背景,可以參考下面這個網址: http://sources.redhat.com/ml/libc-alpha/2003-09/msg00263.html。

由使用者態經庫函數進入核心態

為了配合核心使用新的系統調用方式,glibc中要做一定的修改。新的glibc-2.3.2(及其以後版本中)中已經包含了這個改動,在glibc原始碼的sysdeps/unix/sysv/linux/i386/sysdep.h檔案中,處理系統調用的宏INTERNAL_SYSCALL在不同的編譯選項下有不同的結果。在開啟支援sysenter/sysexit指令的選項I386_USE_SYSENTER下,系統調用會有兩種方式,在靜態連結(編譯時間加上-static選項)情況下,採用"call *_dl_sysinfo"指令;在動態連結情況下,採用"call *%gs:0x10"指令。這兩種情況由glibc庫採用哪種方法連結,實際上最終都相當於調用某個固定地址的代碼。下面我們通過一個小小的程式,配合 gdb來驗證。

首先是一個靜態編譯的程式,代碼很簡單:

main(){ getuid();}                

將代碼加上static選項用gcc靜態編譯,然後用gdb裝載並反編譯main函數。

[root@test opt]# gcc test.c -o ./static -static[root@test opt]# gdb ./static(gdb) disassemble main0x08048204 <main+0>:    push   %ebp0x08048205 <main+1>:    mov    %esp,%ebp0x08048207 <main+3>:    sub    $0x8,%esp0x0804820a <main+6>:    and    $0xfffffff0,%esp0x0804820d <main+9>:    mov    $0x0,%eax0x08048212 <main+14>:   sub    %eax,%esp0x08048214 <main+16>:   call   0x804cb20 <__getuid>0x08048219 <main+21>:   leave0x0804821a <main+22>:   ret                

可以看出,main函數中調用了__getuid函數,接著反編譯__getuid函數。

(gdb) disassemble 0x804cb200x0804cb20 <__getuid+0>:        push   %ebp0x0804cb21 <__getuid+1>:        mov    0x80aa028,%eax0x0804cb26 <__getuid+6>:        mov    %esp,%ebp0x0804cb28 <__getuid+8>:        test   %eax,%eax0x0804cb2a <__getuid+10>:       jle    0x804cb40 <__getuid+32>0x0804cb2c <__getuid+12>:       mov    $0x18,%eax0x0804cb31 <__getuid+17>:       call   *0x80aa0540x0804cb37 <__getuid+23>:       pop    %ebp0x0804cb38 <__getuid+24>:       ret                

上面只是__getuid函數的一部分。可以看到__getuid將eax寄存器賦值為getuid系統調用的功能號0x18然後調用了另一個函數,這個函數的入口在哪裡呢?接著查看位於地址0x80aa054的值。

(gdb) X 0x80aa0540x80aa054 <_dl_sysinfo>:        0x0804d7f6                

看起來不像是指向核心映射頁面內的代碼,但是,可以確認,__dl_sysinfo指標的指向的地址就是0x80aa054。下面,我們試著啟動這個程式,然後停在程式第一條語句,再查看這個地方的值。

(gdb) b mainBreakpoint 1 at 0x804820a(gdb) rStarting program: /opt/staticBreakpoint 1, 0x0804820a in main ()(gdb) X 0x80aa0540x80aa054 <_dl_sysinfo>:        0xffffe400                

可以看到,_dl_sysinfo指標指向的數值已經發生了變化,指向了0xffffe400,如果我們繼續運行程式,__getuid函數將會調用地址0xffffe400處的代碼。

接下來,我們將上面的代碼編譯成動態連結的方式,即預設,用gdb裝載並反編譯main函數

[root@test opt]# gcc test.c -o ./dynamic[root@test opt]# gdb ./dynamic(gdb) disassemble main0x08048204 <main+0>:    push   %ebp0x08048205 <main+1>:    mov    %esp,%ebp0x08048207 <main+3>:    sub    $0x8,%esp0x0804820a <main+6>:    and    $0xfffffff0,%esp0x0804820d <main+9>:    mov    $0x0,%eax0x08048212 <main+14>:   sub    %eax,%esp0x08048214 <main+16>:   call   0x80482880x08048219 <main+21>:   leave0x0804821a <main+22>:   ret                

由於libc庫是在程式初始化時才被裝載,所以我們先啟動程式,並停在main第一條語句,然後反組譯碼getuid庫函數

(gdb) b mainBreakpoint 1 at 0x804820a(gdb) rStarting program: /opt/dynamicBreakpoint 1, 0x0804820a in main ()(gdb) disassemble getuidDump of assembler code for function getuid:0x40219e50 <__getuid+0>:        push   %ebp0x40219e51 <__getuid+1>:        mov    %esp,%ebp0x40219e53 <__getuid+3>:        push   %ebx0x40219e54 <__getuid+4>:        call   0x40219e59 <__getuid+9>0x40219e59 <__getuid+9>:        pop    %ebx0x40219e5a <__getuid+10>:       add    $0x84b0f,%ebx0x40219e60 <__getuid+16>:       mov    0xffffd87c(%ebx),%eax0x40219e66 <__getuid+22>:       test   %eax,%eax0x40219e68 <__getuid+24>:       jle    0x40219e80 <__getuid+48>0x40219e6a <__getuid+26>:       mov    $0x18,%eax0x40219e6f <__getuid+31>:       call   *%gs:0x100x40219e76 <__getuid+38>:       pop    %ebx0x40219e77 <__getuid+39>:       pop    %ebp0x40219e78 <__getuid+40>:       ret                

可以看出,庫函數getuid將eax寄存器設定為getuid系統調用的調用號0x18,然後調用%gs:0x10所指向的函數。在gdb中,無法查看非DS段的資料內容,所以無法查看%gs:0x10所儲存的實際數值,不過我們可以通過編程的辦法,內嵌彙編將%gs:0x10的值賦予某個局部變數來得到這個數值,而這個數值也是0xffffe400,具體代碼這裡就不再贅述。

由此可見,無論是靜態還是動態方式,最終我們都來到了0xffffe400這裡的一段代碼,這裡就是核心為我們映射的系統調用入口代碼。在gdb中,我們可以直接反組譯碼來查看這裡的代碼

(gdb) disassemble 0xffffe400 0xffffe414Dump of assembler code from 0xffffe400 to 0xffffe414:0xffffe400:     push   %ecx0xffffe401:     push   %edx0xffffe402:     push   %ebp0xffffe403:     mov    %esp,%ebp0xffffe405:     sysenter0xffffe407:     nop0xffffe408:     nop0xffffe409:     nop0xffffe40a:     nop0xffffe40b:     nop0xffffe40c:     nop0xffffe40d:     nop0xffffe40e:     jmp    0xffffe4030xffffe410:     pop    %ebp0xffffe411:     pop    %edx0xffffe412:     pop    %ecx0xffffe413:     retEnd of assembler dump.                

這段代碼正是arch/i386/kernel/vsyscall- sysenter.S檔案中的代碼。其中,在sysenter之前的是入口代碼,在0xffffe410開始的是核心返回處理代碼(後面提到的 SYSENTER_RETURN即指向這裡)。在入口代碼中,首先是儲存當前的ecx,edx(由於sysexit指令需要使用這兩個寄存器)以及 ebp。然後調用sysenter指令,跳轉到核心Ring 0代碼,也就是sysenter_entry入口處。

核心中的處理和返回

sysenter_entry整個的實現可以參見arch/i386/kernel/entry.S。核心處理SYSENTER的代碼和處理INT的代碼不太一樣。通過sysenter指令進入Ring 0之後,由於當前的ESP並非指向正確的核心棧,而是當前CPU的TSS結構中的一個緩衝區(參見上文),所以首先要解決的是修複ESP,幸運的是,TSS結構中ESP0成員本身就儲存有Ring 0狀態的ESP值,所以在這裡將TSS結構中ESP0的值賦予ESP寄存器。將ESP恢複成指向正確的堆棧之後,由於SYSENTER不是通過調用門進入Ring 0,所以在堆棧中的上下文和使用INT指令的不一樣,INT指令進入Ring 0後棧中會儲存如下的值。

低地址

返回使用者態的EIP
使用者態的CS
使用者態的EFLAGS
使用者態的ESP
使用者態的SS(和DS相同)

高地址

因此,為了簡化和重用代碼,核心會用pushl指令往棧中放入上述各值,值得注意的是,核心在棧中放入的相對應使用者態EIP的值,是一個代碼標籤 SYSENTER_RETURN,在vsyscall-sysenter.S可以看到,它就在sysenter指令的後面(在它們之間,有一段NOP,是核心返回出錯時的處理代碼)。接下來,處理系統調用的代碼就和中斷方式的處理代碼一模一樣了,核心儲存所有的寄存器,然後系統調用表找到對應系統調用的入口,完成調用。最後,核心從棧中取出前面存入的使用者態的EIP和ESP,存入edx和ecx寄存器,調用SYSEXIT指令返回使用者態。返回使用者態之後,從棧中取出ESP,edx,ecx,最終返回glibc庫。

其它作業系統以及其它硬體平台的支援

值得一提的是,從 Windows XP 開始,Windows 的系統調用方式也從非強制中斷 int 0x2e 轉換到採用 sysenter 方式,由於完全不再支援 int 方式,因此 Windows XP 的對 CPU 的最低配置要求是 PentiumII 300MHz。在其它的作業系統例如 *BSD 系列,目前並沒有提供對 sysenter 指令的支援。

在 CPU 方面,AMD 的 CPU 支援一套與之對應的指令 SYSCALL/SYSRET。在純 32 位的 AMD CPU 上,還沒有支援 sysenter 指令,而在 AMD 推出的 AMD64 系列 CPU 上,處於某些模式的情況下,CPU 能夠支援 sysenter/sysexit 指令。在 Linux 核心針對 AMD64 架構的代碼中,採用的還是 SYSCALL/SYSRET 指令。至於這兩種指令最終誰將成為標準,目前還無法得出結論。

未來

我們將 Intel 的 sysenter/sysexit 指令,AMD 的 SYSCALL/SYSRET 指令統稱為"快速系統調用指令"。"快速系統調用指令"比起中斷指令來說,其消耗時間必然會少一些,但是隨著 CPU 設計的發展,將來應該不會再出現類似 Intel Pentium4 這樣懸殊的差距。而"快速系統調用指令"比起中斷方式的系統調用方式,還存在一定局限,例如無法在一個系統調用處理過程中再通過"快速系統調用指令"調用別的系統調用。因此,並不一定每個系統調用都需要通過"快速系統調用指令"來實現。比如,對於複雜的系統調用例如 fork,兩種系統調用方式的時間差和系統調用本身運行消耗的時間來比,可以忽略不計,此處採取"快速系統調用指令"方式沒有什麼必要。而真正應該使用" 快速系統調用指令"方式的,是那些本身已耗用時間很短,對時間精確性要求高的系統調用,例如 getuid、gettimeofday 等等。因此,採取靈活的手段,針對不同的系統調用採取不同的方式,才能得到最佳化的效能和實現最完美的功能。

參考資料

[1] VxWorks Optimized for Intel Architecture, Hdei Nunoe, Wind River, Member of Technical Staff Leo Samson, Wind River, Technical Marketing Engineer David Hillyard, Intel Corporation, Mgr., Platform Architect

[2] Kernel Entry / Kernel Exit , Marcus Voelp & University Karlsruhe

[3] Dave Jones' blog, http://diary.codemonkey.org.uk/index.php?month=12&year=2002

[4] Linux 核心源碼 v2.6.0 http://www.kernel.org/ [Linus Torvalds,2004]

[5] GNU C Library glibc 2.3.3 源碼 http://www.gnu.org/software/libc/libc.html

Linux Kernel Mailing List 中對系統調用方式的討論: [5] Linux Kernel Mailing List, "Intel P6 vs P7 system call performance" http://www.ussg.iu.edu/hypermail/linux/kernel/0212.1/index.html#1286 http://www.ussg.iu.edu/hypermail/linux/kernel/0212.3/index.html#54

Linux 核心首次引入對 sysenter/sysexit 指令的支援: [6] Linux Kernel Mailing List, "Add "sysenter" support on x86, and a "vsyscall" page." http://lwn.net/Articles/18414/

 

關於作者
劉子銳:Linux 愛好者,從事過驅動程式開發和核心安全問題的研究,對 Linux 核心和 JAVA 虛擬機器高度興趣。通過 liuzirui@ustc.edu可以跟他聯絡。





聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.