arm-linux-ld指令详解.docx
arm-linux-ld指令详解arm-linux-ld指令详解我们对每个c或者汇编文件进行单独编译,但是不去连接,生成许多Q的文件,这些Q文件首先是分散的,我们首先要考虑的如何组合起来;其次,这些.。文件存在相互调用的关系;再者,我们最终生成的bin文件是要在硬件中运行的,每一部分放在什么地址都要有细致的说明。我觉得在写makefile的时候,最为重要的就是Id的理解,下面说说我的阅历:首先,要确定我们的程序用没有用到标准的C库,或者一些系统的库文件,这些一般是在操作系统之上开发要留意的问题,这里并不多说,熟识在1.inUX编程的人,基本上都会用Id吩咐;这里,我们从头起先,干脆进行汇编语言的连接。我们写一个汇编程序,限制GPI0,从而限制外接的1.ED,代码如下;.text.global_starl_starl:1.DRR0,=0x56000010GPBCON寄存器MOVR1.#0x00000400strR1,R01.DRRO=0x56000014MOVR1.#0x00000000STRRl,RO)MA1N_1.OOP:BMAIN_1.OOP代码很简洁,就是一个对i。口进行设置然后写数据。我们看它是如何编译的,留意我们这里运用的不是arm-linux-gcc而是arm-elf-gcc,二者之间没有什么比较大的区分,am-linux-gcc可能包含更多的库文件,在吩咐行的编译上面是没有区分。我们来看是如何编译的:arm-elf-gcc-g-c-oled_On.oled_On.s首先纯编译不连接ann-elf-ld-Ttext0x00000000-gled_On.o-oled_on_elf用Tlext指明我们程序存储的地方,这里生成的是elf文件,还不是我们真正的bin,但是可以借助一些工具可以进行调试。然后:arm-elf-objcopy-Obinary-Sled_on_elfled_on.bin生成bin文件。-T选项是Id吩咐中比较重要的一个选项,可以用它干脆指明代码的代码段、数据段、博士生、段,对于困难的连接,可以特地写一个脚原来告知编译器如何连接。-Ttexladdr-Tdaiaaddr-Tbssaddra11n-elf-ld-Ttext0x00000000-gled_On.o-oled_on_elf,运行地址为OXoOOooo00,由于没有指明数据段和bss,他们会默认的依次放在后面。相同的代码不同的TIeXt,你可以对比一下他们之间会变的差异,Id会自动调整跳转的地址。其次个概念:SeCtion,section可以理解成块,例如像C里面的一个子函数,就是一个section,链接器Id把object文件中的每个SeCtion都作为一个整体,为其安排运行的地址(memorylayout),这个过程就是重定位(relocalion);最终把全部目标文件合并为一个目标文件。链接通过一个linkerscript来限制,这个脚本描述了输入文件的sections到输出文件的映射,以及输出文件的memoryIayouto因此,linker总会运用,个IinkerSCript,假如不特殊指定,则运用默认的SCriPI;可以运用-T'吩咐行选项来指定一个linkerscripto*映像文件的输入段与输出段Iinker把多个输入文件合并为个输出文件。输出文件和输入文件都是目标文件(ObjeClfile),输出文件通常被称为可执行文件(executable)。每个目标文件都有一系列SeCtion,输入文件的section称为inputsection,输出文件的section则称为outputsectiono一个section可以是loadable的,即输出文件运行时须要将这样的section加载到memory(类似于R0&RW段);也可以是allocatable的,这样的SeCtion没有任何内容,某些时候用0对相应的memory区域进行初始化(类似于ZI段);假如一个SeClion既非IoadabIe也非allocatable,则它通常包含的是调试信息。每个loadable或allocatable的outputsection都有两个地址,一是VMA(VirIUalmemoryaddress),是该section的运行时域地址;二是1.MA(loadmemoryaddress),是该section的加载时域地址。可以通过Objdump工具附加5选项来杳看目标文件中的sectionso*简洁的1.inkerscript(1)SECTIONS吩咐:TheSECTIONScommandtellsthelinkerhowtomapinputsectionsintooutputsections,andhowtoplacetheoutputsectionsinmemory.吩咐格式如下:SECTIONS(Sections-ConiniandSections-Coniniand其中SeCtiOnS-COmrnandnJ以是ENTRY吩咐,符号赋值,输出段描述,也可以是OVerIay描述。地址计数器,(locationcounter):该符号只能用于SECTK)NS吩咐内部,初始值为'0',可以对该符号进行赋值,也可以运用该符号进行计算或赋值给其他符号。它会自动依据SECTIONS吩咐内部所描述的输出段的大小来计算当前的地址。(3)输出段描述(OUtPUtsectiondescription):前面提到在SECTIONS吩咐中可以作输出段描述,描述的格式如下:sectionaddress(type):AT(Ima)OUIPUt-SeClion-COmmandoulput-section-command>regionAT>lma_region:phdr:phdr.=fillexp许多附加选项是用不到的。其中的output-seclion-command又可以是符号赋值,输入段描述,要干脆包含的数据值,或者某一特定的输出段关键字。*linkerscript实例OUTPUT.ARCH(arn)ENTRYGstart)SECTIONS.=Oxa3fOOOOO;,boot-sta11=.;.startA1.1GN(4):*(.text.start).setupA1.1GN(4):setup_block=.;*(.setup)setup_block_end=.;.textA1.1GN(4):*(.text).rodataA1.1GN(4):*(.rodata).dataA1.IGN(4):*(.data).gotA1.1GN(4):*(-got)_boot_end=.;.bssA1.IGN(16):bss_start=.;*(.bss)*(COMMON)bssend=.:mentA1.IGN(16):*(ment)stack_point=bt-start+0x00100000:loader_size=bt-end-boot_start;setup_size=setup_block_end-setup_block;在SECTIONS吩咐中的类似于下面的描述结构就是输出段描述:.startA1.1GN(4):*(.text.start).start为outputsectionname,A1.IGN(4)返回一个基于locationCoUnler(.)的4字节对齐的地址值。*(.exl.start)是输入段描述,*为通配符,意思是把全部被链接的ObjeCt文件中的.text.start段都链接进这个名为Man的输出段。源文件中所标识的section及其属性事实上就是对输入段的描述,例如.text.start输入段在源文件Start.S中的代码如下:.section.text.start.global_start_start:bstartarm-elf-Id-TtimerJds-otimerelfheader.o这里就必需存在一个timer.Ids的文件。对于.Ids文件,它定义了整个程序编译之后的连接过程,确定了一个可执行程序的各个段的存储位置。虽然现在我还没怎么用它,但感觉还是挺重要的,有必要了解一下。先看下GNU官方网站上对.Ids文件形式的完整描述:SECTIONSsecnamestartB1.OCK(align)(NO1.OAD):AT(Idadr)contents>region:phdr=fillsecname和contents是必需的,其他的都是可选的。下面挑几个常用的看看:I、secname:段名2.contents:确定哪些内容放在本段,可以是整个目标文件,也可以是目标文件中的某段(代码段、数据段等)3>start:本段连接(运行)的地址,假如没有运用AT(Idadr),本段存储的地址也是startcGNU网站上说start可以用随意一种描述地址的符号来描述。4、AT(Idadr):定义本段存储(加载)的地址。*nand.lds*/SECTIONSfirlst0x00000000:head.oinit.o)second0x30000000:AT(4096)main.o)以上,head.o放在OXooOOoO(X)地址起先处,inii.o放在head.o后面,他们的运行地址也是OXOOO()0000,即连接和存储地址相同(没有AT指定);main。放在4096(0x1000,是AT指定的,存储地址)起先处,但是它的运行地址在0x30000000,运行之前须要从OX100O(加载处)复制到0x30000000(运行处),此过程也就用到了读取NandfIash。这就是存储地址和连接(运行)地址的不同,称为加载时域和运行时域,可以在Jds连接脚本文件中分别指定。编写好的JdS文件,在用arm-linux-ld连接吩咐时带-Tfilename来调用执行,如arm-linux-ld-TnandJdsx.oy.o-OXy.0。也用-TleXt参数F脆指定连接地址,如arm-linux-ld-Ttext0x30000000x.oy.o-OXy.0。既然程序有了两种地址,就涉及到一些跳转指令的区分,这里正好写下来,以后万一遗忘了也可查看,以前不少东西没登记来现在忘得差不多了。ARM汇编中,常有两种跳转方法:b跳转指令、Idr指令向PC赋值。我自己经过归纳如卜丁bstepl:b跳转指令是相对跳转,依靠当前PC的值,偏移量是通过该指令本身的bil23Q算出来的,这使得运用b指令的程序不依靠于要跳到的代码的位置,只看指令本身。Idrpc5=Stepl:该指令是从内存中的某个位置(StePI)读出数据并赋给PC,同样依靠当前PC的值,但是偏移量是那个位置(StePI)的连接地址(运行时的地址),所以可.以用它实现从Flash到RAM的程序跳转。此外,有必要回味一下adr伪指令,U-boot中那段relocate代码就是通过adr实现当前程序是在RAM中还是flash中。仍旧用我当时的注释adrr,_siart*r是代码的当前位置*adr伪指令,汇编器自动通过当前PC的值算出假如执行到一Start时PC的值,放到r中:当此段在flash中执行时r=_start=0;当此段在RAM中执行时_start=_TEXT_BASE(在boardsmdk2410cong.mk中指定的值为Ox33F8OOOO,即u-boot在把代码拷贝到RAM中去执行的代码段的起先)*/ldrr1,_TEXT_BASE*测试推断是从FIaSh启动,还是RAM*/*此句执行的结果rl始终是0x33FF80(X)0,因为此值是又编译器指定的(ads中设置,或-D设置编译器参数)*/cmpr,rl/*比较r和rl,调试的时候不要执行重定位*/卜.面,结合u-boot.lds看看一个正式的连接脚本文件。这个文件的基本功能还能看明白,虽然上面分析了好多,但其中那些GNU风格的符号还是着实让我感到迷惑。OUTPUT_FORMAT("elf32­littlearm","el!32&shyJittleann","elf32&shyJittleann");指定输出可执行文件是elf格式,32位ARM指令,小端OUTPUT_ARCH(arm);指定输出可执行文件的平台为ARMENTRYjSIarI);指定输出可执行文件的起始代码段为_start.SECTIONS.=0x00000000;从0x0位置起先.=A1.IGN(4);代码以4字节对齐.text:;指定代码段(cpuarm920tsiart.o(.text);代码的第一个代码部分*(texl);其它代码部分).=A1.IGN(4).rodata:*(.rodata);指定只读数据段.=A1.IGN(4);.data:*(.data);指定读/写数据段.=A1.IGN(4);,got:*(.got);指定got段,got段式是Uboot自定义的一个段,非标准段_u_boot_cmd_staii=.;把一u_boot_cmd_start赋值为当前位置,即起始位置.u_boot_cmd:*(.u_boot_cmd);指定u_boot_cmd段,uboot把全部的Ubool吩咐放在该段._u_boot_cmd_end=把u_boot_cmC1.end赋值为当前位置,即结束位置.=A1.IGN(4);_bss_start=把_bss_siari赋值为当前位置,即bss段的起先位置.bss:*(.bss);指定bss段_end=.;把_end赋值为当前位置,即bss段的结束位置