编译技术什么是程序的入口语句

编译技术什么是程序的入口语句,第1张

编译技术什么是程序的入口语句?我们刚开始学习C语言的时候,总会以一个hello world程序开始了解,并会被告知main是程序的入口函数。

那么是否有怀疑过,既然main是函数的入口,那么全局函数是如何初始化的?

实际上main并不是一个程序的入口地址。

以linux为例,一个可执行程序是ELF格式(Executable and Linkable Format)。在ELF的文件头里老档记录了当程序入口地址,该入口地址是内核加载该文件后的第一条指令执行的地方。

可以写个hello world,生成可执行文件,然后通过readelf -h a.out查看文件头:

ELF 头: Magic: 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00 类别: ELF64 数据: 2 补码,小端序 (little endian) 版本: 1 (current) OS/ABI: UNIX - System V ABI 版本: 0 类型: DYN (共享目标文件) 系统架构: Advanced Micro Devices X86-64 版本: 0x1 入口点地址: 0x1040 程序头起点: 64 (bytes into file) Start of section headers: 14688 (bytes into file) 标志: 0x0 本头的大小: 64 (字节) 程序头大小: 56 (字节) Number of program headers: 11 节头大小: 64 (字节) 节头数量: 29 字符串表索引键含帆节头: 28

这里入口地址是0x1040。

让我们反编译看看:

0000000000001040 <_start>: 1040: f3 0f 1e fa endbr64 1044: 31 ed xor %ebp,%ebp 1046: 49 89 d1 mov %rdx,%r9 1049: 5e pop %rsi 104a: 48 89 e2 mov %rsp,%rdx 104d: 48 83 e4 f0 and $0xfffffffffffffff0,%rsp 1051: 50 push %rax 1052: 54 push %rsp 1053: 4c 8d 05 76 01 00 00 lea 0x176(%rip),%r8 # 11d0 <__libc_csu_fini>105a: 48 8d 0d ff 00 00 00 lea 0xff(%rip),%rcx # 1160 <__libc_csu_init>1061: 48 8d 3d d1 00 00 00 lea 0xd1(%rip),%rdi # 1139 <main>1068: ff 15 72 2f 00 00 callq *0x2f72(%rip) # 3fe0 <__libc_start_main@GLIBC_2.2.5>106e: f4 hlt 106f: 90 nop

0x1040对应的是_start函数,_start调用了glibc中的__libc_strat_main.__libc_strat_main最终会调用main函数。(_start和__libc_start_main的分析见《程序员的自我修改——链接、装载与库》11.1)

既然知道main不是程序的真正入口,那么是否稿雹有办法在main之前或之后执行代码呢?

gcc提供了一组“进入”、“退出”函数可以首先这个功能:

readelf <option(s)>elf-file(s)

[功能]

用于显示elf格式文件的信息

[描述]

readelf用来显示一个或者多个elf格式的目标文件的信息,可以通过它的选项来控制显示哪些信息。这里的elf-file(s)就表示那些被检查的文件。可以支持32位,64位的elf格式文件,也支持包含elf文件的文档(这里一般指的是使用ar命令将一些elf文件打包之后生成的例如lib*.a之类的“静态库”文件)。

这个程序和objdump提供的功能类似,但是它显示的信息更为具体,并且它不依赖BFD库(BFD库是一个GNU项目,它的目标就是希望通过一种统一的接口来处理不同的目标文件),所以即使BFD库有什么bug存在的话也不会影响到readelf程序。

运行readelf的时候,除了-v和-H之外,其它的选项必须有一个被指定。

ELF文件类型:

种类型的ELF文件:

a)可重定位文件:用户和其他目标文件一起创建可执行文件或者共享目标文件,例如lib*.a文件。

b)可执行文件:用于生成进程映像,载入内存执行,例如编译好的可执行文件a.out。

c)共享目标文件:用于和其他共享目标文件或者可重定位文件一起生成elf目标文件或者和执行文件一起创建进程映像,例如lib*.so文件。

ELF文件作用:

ELF文件参与程序的连接(建立一个程序)和程序的执行(运行一个程序),所以可以从不同的角瞎斗带度来看待elf格式的文件:

a)如果用于编译和链接(可重定位文件),则编译器和链接器将把elf文件看作是节头表描述的节的集合,程序头表可选。

b)如果用于加载执行(可执行文件),则加载器则将把elf文件看作是程序头表描述的段的集合,一个段可能包含多个节,节头表可选。

c)如果是共享文件,则两者都含有。

ELF文件总体组成:

elf文件头描述elf文件的总体信息。包括:

系统相关,类型相关,加载相关,链接相关。

系统相关表示:elf文件标识的魔术数,以及硬件和平台等相关信息,增加了elf文件的移植性,使交叉编译成为可能。

类型相关就是前面说的那个类型。

加载相关:包销此括程序头表相关信息。

链接相关:节头表相关信息。

项(分别以长格式和短格式给出了):

-a

--all 显示全部信息,等价于 -h -l -S -s -r -d -V -A -I.

-h

--file-header 显示elf文件开始的文件头信息.

-l

--program-headers

--segments 显示程序头(段头)信息(如果有的话)。

-S

--section-headers

--sections 显示节头信息(如果有的话)。

-g

--section-groups 显示节组信息(如果有的话)。

-t

--section-details 显示节的详细信息(-S的)。

-s

--syms

--symbols 显示符号表段中的项(如果有的话)。

-e

--headers 显示全部头信息,等价于: -h -l -S

-n

--notes 显示note段(内核注释)的信息。

-r

--relocs 显示可重定位段的信息。

-u

--unwind 显示unwind段信息。当前只支持IA64 ELF的unwind段信息。

-d

--dynamic 显示动态段的信息。

-V

--version-info 显示版本段的信息。

-A

--arch-specific 显示CPU构架信息。

-D

--use-dynamic 使用动态段中的符号表显磨芦示符号,而不是使用符号段。

-x <number or name>

--hex-dump=<number or name>以16进制方式显示指定段内内容。number指定段表中段的索引,或字符串指定文件中的段名。

-w[liaprmfFsoR] or

--debug-dump[=line,=info,=abbrev,=pubnames,=aranges,=macro,=frames,=frames-interp,=str,=loc,=Ranges]

显示调试段中指定的内容。

-I

--histogram 显示符号的时候,显示bucket list长度的柱状图。

-v

--version 显示readelf的版本信息。

-H

--help 显示readelf所支持的命令行选项。

-W

--wide 宽行输出。

@file 可以将选项集中到一个文件中,然后使用这个@file选项载入。

[举例]

先给出如下例子:

1,对于可执行文件形式的elf格式文件:

1)查看可执行程序的源代码如下:

[quietheart@lv-k cppDemo]$ cat main.cpp

#include <iostream>

using std::cout

using std::endl

void my_print()

int main(int argc, char *argv[])

{

my_print()

cout<<"hello!"<<endl

return 0

}

void my_print()

{

cout<<"print!"<<endl

}

2)编译如下:

[quietheart@lv-k cppDemo]$ g++ main.cpp -o main

[quietheart@lv-k cppDemo]$ g++ -g main.cpp -o main.debug

3)编译之后,查看生成的文件:

[quietheart@lv-k cppDemo]$ ls -l

总计 64

-rwxr-xr-x 1 quietheart quietheart 6700 07-07 18:04 main

-rw-r--r-- 1 quietheart quietheart 201 07-07 18:02 main.cpp

-rwxr-xr-x 1 quietheart quietheart 38932 07-07 18:04 main.debug

这里,main.debug是带有调试信息的可执行文件,main是一般的可执行文件。

2,对于库文件形式的elf格式文件:

1)查看库的源代码如下:

//myfile.h

#ifndef __MYFILE_H

#define __MYFILE_H

void printInfo()

#endif

//myfile.cpp

#include "myfile.h"

#include <iostream>

using std::cout

using std::endl

void printInfo()

{

cout<<"hello"<<endl

}

2)编译如下:

[quietheart@lv-k bak]$ g++ -c myfile.cpp

[quietheart@lv-k bak]$ g++ -shared -fPCI -o libmy.so myfile.o

[quietheart@lv-k bak]$ ar -r libmy.a myfile.o

ar: creating libmy.a

3)编译之后,查看生成的文件:

[quietheart@lv-k bak]$ ls -l

总计 44

-rw-r--r-- 1 quietheart quietheart 2154 07-08 16:14 libmy.a

-rwxr-xr-x 1 quietheart quietheart 5707 07-08 16:08 libmy.so

-rwxr-xr-x 1 quietheart quietheart 117 07-08 16:06 myfile.cpp

-rwxr-xr-x 1 quietheart quietheart 63 07-08 16:08 myfile.h

-rw-r--r-- 1 quietheart quietheart 2004 07-08 16:08 myfile.o

libmy.a libmy.so myfile.cpp myfile.h myfile.o

这里,分别生成目标文件myfile.o,共享库文件libmy.so,和静态库文件libmy.a。

我是这样理解的:

存储物信器空间是和硬件相关联的,可以对某些地址上写数据来控制硬桐此件,为了方便使用(总不可局蚂迅能都用地址来直接控制,那样就工作量就太大了),将这些地址赋予了一些变量名,通过变量名来控制硬件(也就是寄存器的概念)。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/12223858.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-22
下一篇 2023-05-22

发表评论

登录后才能评论

评论列表(0条)

保存