AT&T與Intel彙編語法的比較
GCC採用的是AT&T的彙編格式, 也叫GAS格式(Gnu ASembler GNU彙編器), 而微軟採用Intel的彙編格式.
語法上主要有以下幾個不同.
1、暫存器命名原則
在 AT&T 彙編格式中,暫存器名要加上 '%' 作為字首;而在 Intel 彙編格式中,暫存器名不需要加字首。
AT&T |
Intel |
說明 |
%eax |
eax |
Intel的不帶百分號 |
2、源/目的運算元順序
AT&T 和 Intel 格式中的源運算元和目標運算元的位置正好相反。在 Intel 彙編格式中,目標運算元在源運算元的左邊;而在 AT&T 彙編格式中,目標運算元在源運算元的右邊。
AT&T |
Intel |
說明 |
movl %eax, %ebx |
mov ebx, eax |
Intel的目的運算元在前,源運算元在後 |
3、常數/立即數的格式
在 AT&T 彙編格式中,用 '$' 字首表示一個立即運算元;而在 Intel 彙編格式中,立即數的表示不用帶任何字首。
AT&T |
Intel |
說明 |
movl $_value,%ebx |
mov eax,_value |
Intel的立即數前面不帶$符號 |
movl $0xd00d,%ebx |
mov ebx,0xd00d |
規則同樣適用於16進位制的立即數 |
4、運算元長度標識
在 AT&T
AT&T |
Intel |
說明 |
movw %ax,%bx |
mov bx,ax |
Intel的彙編中, 運算元的長度並不通過指令符號來標識 |
在AT&T的格式中, 每個操作都有一個字元字尾, 表明運算元的大小. 例如:mov指令有三種形式:
movb 傳送位元組
movw 傳送字
movl 傳送雙字
因為在許多機器上, 32位數都稱為長字(long word), 這是沿用以16位字為標準的時代的歷史習慣造成的.
---------摘自《深入理解計算機系統》
5、定址方式
AT&T |
Intel |
imm32(basepointer,indexpointer,indexscale) |
[basepointer + indexpointer*indexscale + imm32) |
兩種定址的實際結果都應該是
imm32 +basepointer + indexpointer*indexscale
舉例:
AT&T 格式 |
Intel 格式 |
movl -4(%ebp), %eax |
mov eax, [ebp - 4] |
movl array(, %eax, 4), %eax |
mov eax, [eax*4 + array] |
movw array(%ebx, %eax, 4), %cx |
mov cx, [ebx + 4*eax + array] |
movb $4, %fs:(%eax) |
mov fs:eax, 4 |
6、跳轉指令
在 AT&T 彙編格式中,絕對轉移和呼叫指令(jump/call)的運算元前要加上'*'作為字首,而在 Intel 格式中則不需要。
遠端轉移指令和遠端子呼叫指令的操作碼,在 AT&T 彙編格式中為 "ljump" 和 "lcall",而在 Intel 彙編格式中則為 "jmp far" 和 "call far",即:
AT&T 格式:ljump $section, $offset
Intel 格式: jmp far section:offset
AT&T 格式:lcall $section, $offset
Intel 格式:call far section:offset
與之相應的遠端返回指令則為:
AT&T 格式:lret $stack_adjust
Intel 格式: ret far stack_adjust
AT&T的彙編格式中, 跳轉指令有點特殊.
直接跳轉, 即跳轉目標是作為指令的一部分編碼的.
例如: jmp Label_1
間接跳轉, 即跳轉目標是從暫存器或儲存器位置中讀出的. 寫法是在" * "後面跟一個運算元指示符.
例如: jmp *%eax 用暫存器%eax中的值作為跳轉目標
jmp *(%eax) 以%eax中的值作為讀入的地址, 從儲存器中讀出跳轉目標
--------摘自《深入理解計算機系統》
下面是一些定址的例子:
AT&T: `-4(%ebp)' 相當於 Intel: `[ebp - 4]'
AT&T: `foo(,%eax,4)' 相當於 Intel: `[foo + eax*4]'
AT&T: `foo(,1)' 相當於 Intel `[foo]'