轉自 陳莉君 一書《深入分析Linux核心源碼》
http://www.kerneltravel.net/kernel-book/第二章%20Linux啟動並執行硬體基礎/2.6.1.htm
2.6.1 AT&T與Intel組合語言的比較
我們知道,Linux是Unix家族的一員,儘管Linux的曆史不長,但與其相關的很多事情都發源於Unix。就Linux所使用的386組合語言而言,它也是起源於Unix。Unix最初是為PDP-11開發的,曾先後被移植到VAX及68000系列的處理器上,這些處理器上的組合語言都採用的是AT&T的指令格式。當Unix被移植到i386時,自然也就採用了AT&T的組合語言格式,而不是Intel的格式。儘管這兩種組合語言在文法上有一定的差異,但所基於的硬體知識是相同的,因此,如果你非常熟悉Intel的文法格式,那麼你也可以很容易地把它“移植“到AT&T來。下面我們通過對照Intel與AT&T的文法格式,以便於你把過去的知識能很快地“移植”過來。
1.首碼
在Intel的文法中,寄存器和和立即數都沒有首碼。但是在AT&T中,寄存器前冠以“%”,而立即數前冠以“$”。在Intel的文法中,十六進位和二進位立即數尾碼分別冠以“h”和“b”,而在AT&T中,十六進位立即數前冠以“0x”,表2.2給出幾個相應的例子。
表2.2 Intel與AT&T首碼的區別
Intel文法 |
AT&T文法 |
mov eax,8 |
movl $8,%eax |
mov ebx,0ffffh |
movl $0xffff,%ebx |
int 80h |
int $0x80 |
2. 運算元的方向
Intel與AT&T運算元的方向正好相反。在Intel文法中,第一個運算元是目的運算元,第二個運算元源運算元。而在AT&T中,第一個數是源運算元,第二個數是目的運算元。由此可以看出,AT&T 的文法符合人們通常的閱讀習慣。
例如:在Intel中, mov eax,[ecx]
在AT&T中,movl (%ecx),%eax
3.記憶體單元運算元
從上面的例子可以看出,記憶體運算元也有所不同。在Intel的文法中,基寄存器用“[]”括起來,而在AT&T中,用“()”括起來。
例如: 在Intel中,mov eax,[ebx+5]
在AT&T,movl 5(%ebx),%eax
4.間接定址方式
與Intel的文法比較,AT&T間接定址方式可能更晦澀難懂一些。Intel的指令格式是segreg:[base+index*scale+disp],而AT&T的格式是%segreg:disp(base,index,scale)。其中index/scale/disp/segreg全部是可選的,完全可以簡化掉。如果沒有指定scale而指定了index,則scale的預設值為1。segreg段寄存器依賴於指令以及應用程式是運行在實模式還是保護模式下,在實模式下,它依賴於指令,而在保護模式下,segreg是多餘的。在AT&T中,當立即數用在scale/disp中時,不應當在其前冠以“$”首碼,表2.3給出其文法及幾個相應的例子。
表2.3 記憶體運算元的文法及舉例
Intel文法 |
AT&T文法 |
指令 foo,segreg:[base+index*scale+disp] |
指令 %segreg:disp(base,index,scale),foo |
mov eax,[ebx+20h] |
Movl 0x20(%ebx),%eax |
add eax,[ebx+ecx*2h |
Addl (%ebx,%ecx,0x2),%eax |
lea eax,[ebx+ecx] |
Leal (%ebx,%ecx),%eax |
sub eax,[ebx+ecx*4h-20h] |
Subl -0x20(%ebx,%ecx,0x4),%eax |
從表中可以看出,AT&T的文法比較晦澀難懂,因為[base+index*scale+disp]一眼就可以看出其含義,而disp(base,index,scale)則不可能做到這點。
這種定址方式常常用在訪問資料結構數組中某個特定元素內的一個欄位,其中,base為數組的起始地址,scale為每個數組元素的大小,index為下標。如果數組元素還是一個結構,則disp為具體欄位在結構中的位移。
5.作業碼的尾碼
在上面的例子中你可能已注意到,在AT&T的作業碼後面有一個尾碼,其含義就是指出作業碼的大小。“l”表示長整數(32位),“w”表示字(16位),“b”表示位元組(8位)。而在Intel的文法中,則要在記憶體單元運算元的前面加上byte ptr、 word ptr,和dword ptr,“dword”對應“long”。表2.4給出幾個相應的例子。
表2.4 作業碼的尾碼舉例
Intel文法 |
AT&T文法 |
Mov al,bl |
movb %bl,%al |
Mov ax,bx |
movw %bx,%ax |
Mov eax,ebx |
movl %ebx,%eax |
Mov eax, dword ptr [ebx] |
movl (%ebx),%eax |