u-boot.lds連結檔案詳解
GNU編譯器生成的目標檔案預設為elf格式,elf檔案由若干段(section)組成,如不特殊指明,由C源程式生成的目的碼中包含如下段:
- .text(正文段)包含程式的指令程式碼;
- .data(資料段)包含固定的資料,如常量、字串;
- .bss(未初始化資料段)包含未初始化的變數、陣列等。
C++源程式生成的目的碼中還包括
- .fini(解構函式程式碼)
- .init(建構函式程式碼)等.
連結器的任務就是將多個目標檔案的.text、.data和.bss等段連結在一起,而連結指令碼檔案是告訴連結器從什麼地址開始放置這些段.簡而言之,由於一個工程中有多個.c檔案,當它們生成.o檔案後如何安排它們在可執行檔案中的順序,這就是連結指令碼的作用.
這裡以u-boot的lds為例說明uboot的連結過程,首先看一下GNU官方網站上對.lds檔案形式的完整描述:
SECTIONS {
...
secname start BLOCK(align) (NOLOAD) : AT ( ldadr )
{ contents } >region :phdr =fill
...
}
其中,secname和contents是必須的,前者用來命名這個段,後者用來確定程式碼中的什麼部分放在這個段,以下是對這個描述中的一些關鍵字的解釋。
-
secname:段名
-
contents:決定哪些內容放在本段,可以是整個目標檔案(如start.o),也可以是目標檔案中的某段(程式碼段、資料段等)(如start.o (.text .rodata))
-
start:是段的重定位地址,本段連結(執行)的地址,如果程式碼中有位置無關指令,程式執行時這個段必須放在這個地址上。start可以用任意一種描述地址的符號來描述。
-
AT(ldadr):定義本段儲存(載入)的地址,如果不使用這個選項,則載入地址等於執行地址,通過這個選項可以控制各段分別保存於輸出檔案中不同的位置。
例1
/* nand.lds */
SECTIONS {
firtst 0x00000000 : { head.o init.o }
second 0x30000000 : AT(4096) { main.o }
}
其中,
-
head.o放在0x00000000地址開始處,init.o放在head.o後面,他們的執行地址也是0x00000000,即連結和儲存地址 相同(沒有AT指定);
-
main.o放在4096(0x1000,是AT指定的,儲存地址)開始處,但它的執行地址在0x30000000,執行之前需要 從0x1000(載入地址處)複製到0x30000000(執行地址處),此過程也就需要讀取 flash,把程式拷貝到相應位置才能執行。儲存地址和執行地址,又稱為載入時域和執行時域,可以在.lds連結指令碼檔案中分別指定。
例2
ENTRY(begin)
SECTION
{
.=0x00300000;
.text : { *(.text) }
.data: { *(.data) }
.bss: { *(.bss) }
}
其中,
- ENTRY(begin)指明程式的入口點為begin標號;
- .=0x00300000指明目的碼的起始地址為0x00300000,這一段地址可以是SDRAM的起始地址;
- .text : { *(.text) }表示從0x00300000開始放置所有目標檔案的程式碼段,
- .data: { *(.data) }表示資料段從程式碼段的末尾開始,
- 再後是.bss段.
二進位制化
連結生成的elf檔案不能直接下載到邏輯開發板上執行,通過objcopy工具可生成最終的二進位制檔案:
arm-linux-objcopy -O binary bootstrap.elf bootstrap.bin
所生成的目標二進位制檔案bootstrap.bin就可以直接寫入Flash中運行了.
其中:
-O binary指定生成為二進位制格式檔案。
Objcopy還可以生成S格式的檔案,只需將引數換成-O srec。
如果想將生成的目的碼反彙編,還可以用objdump工具:
arm-linux-objdump -dS bootstrap.elf
輸出可執行程式bootstrap.elf的反彙編程式碼
其中,
-d:反彙編所有包含指令的段
-D:反彙編所有段
-S:原始碼和彙編程式碼穿插顯示(使用-g選項編譯)
編寫好的.lds檔案,在用arm-linux-ld連結命令時帶-Tfilename來呼叫執行,如
arm-linux-ld -Tnand.lds x.o y.o -o xy.o
也用-Ttext引數直接指定連結地址,如
arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o。
既然程式有了兩種地址,就涉及到一些跳轉指令的區別。ARM彙編中,常有兩種跳轉方法:
- b跳轉指令
- ldr指令向PC賦值
要特別注意這兩條指令的意思:
b step
b跳轉指令是相對跳轉,依賴當前PC的值,偏移量是通過該指令本身的 bit[23:0]算出來的,這使得使用b指令的程式不依賴於要跳到的程式碼的位置,只看指令本身。
ldr pc, =step
該指令是一個偽指令編譯後會生成以下程式碼:
ldr pc, 0x30008000
<0x30008000>
step
從記憶體中的某個位置(step)讀出資料並賦給PC,同樣依賴當前PC的值,但是偏移量是step的連結地址(執行時的地址),所以可以用它實現從Flash到RAM的程式跳轉。
此外,有必要回味一下adr偽指令,U-boot中那段relocate程式碼就是通過adr實現當前程式是在RAM中還是flash中:
relocate: /* 把U-Boot重新定位到RAM */
adr r0, _start /* r0是程式碼的當前位置 */
/* adr偽指令,彙編器自動通過當前PC的值算出這條指令中“_start"的值,執行到_start時PC的值放到r0中,當此段在flash中執行時r0 = _start = 0;當此段在RAM中執行時_start = _TEXT_BASE(在board/smdk2410/config.mk中指定的值為0x33F80000,即u-boot在把程式碼拷貝到RAM中去 執行的程式碼段的開始) */
ldr r1, _TEXT_BASE /* 測試判斷是從Flash啟動,還是RAM */
/* 此句執行的結果r1始終是0x33FF80000,因為此值是連結指定的 */
cmp r0, r1 /* 比較r0和r1,除錯的時候不要執行重定位 */
結合u-boot.lds談談連結指令碼。
OUTPUT_FORMAT("elf32-littlearm","elf32-littlearm","elf32-littlearm) #指定輸出可執行檔案是elf格式,32位ARM指令,小端
OUTPUT_ARCH(arm) #指定輸出可執行檔案的平臺為ARM
ENTRY(_start) #指定輸出可執行檔案的起始程式碼段為_start.
SECTIONS
{
. = 0x00000000; #定位當前地址為0地址
. = ALIGN(4); #程式碼以4位元組對齊
.text : #指定程式碼段:必須將start.o檔案放在程式碼段的開始位置,其它檔案可任意放
{
cpu/arm920t/start.o (.text) #程式碼段第一部分,指明start.s是入口程式,被放到程式碼段開頭
*(.text) #其它程式碼部分.其中的*表示其它任意檔案,即所有其它檔案的程式碼段
}
. = ALIGN(4);
.rodata : { *(.rodata) } #指定只讀資料段,RO段
. = ALIGN(4);
.data : { *(.data) } #指定讀/寫資料段,RW段
. = ALIGN(4);
.got : { *(.got) } #指定got段, got段式是uboot自定義的一個段, 非標準段
__u_boot_cmd_start = . #把__u_boot_cmd_start賦值為當前位置, 即起始位置
.u_boot_cmd : { *(.u_boot_cmd) }#指定u_boot_cmd段, uboot把所有的uboot命令放在該段.
__u_boot_cmd_end = . #把__u_boot_cmd_end賦值為當前位置,即結束位置
. = ALIGN(4);
__bss_start = . #把__bss_start賦值為當前位置,即bss段的開始位置
.bss : { *(.bss) } #指定bss段
_end = . #把_end賦值為當前位置,即bss段的結束位置
}
通過上面的分析可以看出
- 由於在連結指令碼中規定了檔案start.o(對應於start.S)作為整個uboot的起始點,因此啟動uboot時會執行首先執行start.S
- 一般來說,記憶體空間可分為程式碼段、資料段、全域性變數段、未初始化變數區、棧區、堆區等.其中,棧區由指標SP決定,堆區實質上是由C程式碼實現的,其它段則由編譯器決定.從上面的分析可以看出,從0x00000000地址開始,編譯器首先將程式碼段放在最開始的位置,然後是資料段,然後是bss段(未初始化變數區).
附另一連結檔案
OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS {
. = 0x30000000;
. = ALIGN(4);
.init : AT(0) {start.o nand.o}
. = ALIGN(4);
. = 0x30001000;
.text : AT(4096) { *(.text) }
.rodata ALIGN(4) : AT((LOADADDR(.text)+SIZEOF(.text)+3)&~(0x03)) { *(.rodata*) }
.data ALIGN(4) : AT((LOADADDR(.rodata)+SIZEOF(.rodata)+3)&~(0x03)) { *(.data) }
. = ALIGN(4);
__bss_start = .;
.bss :{ *(.bss) *(COMMON)}
__bss_end = .;
}