编译技术什么是程序的入口语句_软件运维

编译技术什么是程序的入口语句？我们刚开始学习C语言的时候，总会以一个hello world程序开始了解，并会被告知main是程序的入口函数。

那么是否有怀疑过，既然main是函数的入口，那么全局函数是如何初始化的？

实际上main并不是一个程序的入口地址。

以linux为例，一个可执行程序是ELF格式（Executable and Linkable Format）。在ELF的文件头里老档记录了当程序入口地址，该入口地址是内核加载该文件后的第一条指令执行的地方。

可以写个hello world，生成可执行文件，然后通过readelf -h a.out查看文件头：

ELF 头： Magic： 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00 类别: ELF64 数据: 2 补码，小端序 (little endian) 版本: 1 (current) OS/ABI: UNIX - System V ABI 版本: 0 类型: DYN (共享目标文件) 系统架构: Advanced Micro Devices X86-64 版本: 0x1 入口点地址： 0x1040 程序头起点： 64 (bytes into file) Start of section headers: 14688 (bytes into file) 标志： 0x0 本头的大小： 64 (字节) 程序头大小： 56 (字节) Number of program headers: 11 节头大小： 64 (字节) 节头数量： 29 字符串表索引键含帆节头： 28

这里入口地址是0x1040。

让我们反编译看看：

0000000000001040 <_start>: 1040: f3 0f 1e fa endbr64 1044: 31 ed xor %ebp,%ebp 1046: 49 89 d1 mov %rdx,%r9 1049: 5e pop %rsi 104a: 48 89 e2 mov %rsp,%rdx 104d: 48 83 e4 f0 and $0xfffffffffffffff0,%rsp 1051: 50 push %rax 1052: 54 push %rsp 1053: 4c 8d 05 76 01 00 00 lea 0x176(%rip),%r8 # 11d0 <__libc_csu_fini>105a: 48 8d 0d ff 00 00 00 lea 0xff(%rip),%rcx # 1160 <__libc_csu_init>1061: 48 8d 3d d1 00 00 00 lea 0xd1(%rip),%rdi # 1139 <main>1068: ff 15 72 2f 00 00 callq *0x2f72(%rip) # 3fe0 <__libc_start_main@GLIBC_2.2.5>106e: f4 hlt 106f: 90 nop

0x1040对应的是_start函数，_start调用了glibc中的__libc_strat_main.__libc_strat_main最终会调用main函数。（_start和__libc_start_main的分析见《程序员的自我修改——链接、装载与库》11.1）

既然知道main不是程序的真正入口，那么是否稿雹有办法在main之前或之后执行代码呢？

gcc提供了一组“进入”、“退出”函数可以首先这个功能：

readelf <option(s)>elf-file(s)

[功能]

用于显示elf格式文件的信息。

[描述]

readelf用来显示一个或者多个elf格式的目标文件的信息，可以通过它的选项来控制显示哪些信息。这里的elf-file(s)就表示那些被检查的文件。可以支持32位，64位的elf格式文件，也支持包含elf文件的文档（这里一般指的是使用ar命令将一些elf文件打包之后生成的例如lib*.a之类的“静态库”文件）。

这个程序和objdump提供的功能类似，但是它显示的信息更为具体，并且它不依赖BFD库(BFD库是一个GNU项目，它的目标就是希望通过一种统一的接口来处理不同的目标文件)，所以即使BFD库有什么bug存在的话也不会影响到readelf程序。

运行readelf的时候，除了-v和-H之外，其它的选项必须有一个被指定。

ELF文件类型：

种类型的ELF文件：

a)可重定位文件:用户和其他目标文件一起创建可执行文件或者共享目标文件,例如lib*.a文件。

b)可执行文件：用于生成进程映像，载入内存执行,例如编译好的可执行文件a.out。

c)共享目标文件：用于和其他共享目标文件或者可重定位文件一起生成elf目标文件或者和执行文件一起创建进程映像，例如lib*.so文件。

ELF文件作用：

ELF文件参与程序的连接(建立一个程序)和程序的执行(运行一个程序)，所以可以从不同的角瞎斗带度来看待elf格式的文件：

a)如果用于编译和链接（可重定位文件），则编译器和链接器将把elf文件看作是节头表描述的节的集合,程序头表可选。

b)如果用于加载执行（可执行文件），则加载器则将把elf文件看作是程序头表描述的段的集合，一个段可能包含多个节，节头表可选。

c)如果是共享文件，则两者都含有。

ELF文件总体组成：

elf文件头描述elf文件的总体信息。包括：

系统相关，类型相关，加载相关，链接相关。

系统相关表示：elf文件标识的魔术数，以及硬件和平台等相关信息，增加了elf文件的移植性,使交叉编译成为可能。

类型相关就是前面说的那个类型。

加载相关：包销此括程序头表相关信息。

链接相关：节头表相关信息。

项(分别以长格式和短格式给出了)：

-a

--all 显示全部信息,等价于 -h -l -S -s -r -d -V -A -I.

-h

--file-header 显示elf文件开始的文件头信息.

-l

--program-headers

--segments 显示程序头（段头）信息(如果有的话)。

-S

--section-headers

--sections 显示节头信息(如果有的话)。

-g

--section-groups 显示节组信息(如果有的话)。

-t

--section-details 显示节的详细信息(-S的)。

-s

--syms

--symbols 显示符号表段中的项（如果有的话）。

-e

--headers 显示全部头信息，等价于: -h -l -S

-n

--notes 显示note段（内核注释）的信息。

-r

--relocs 显示可重定位段的信息。

-u

--unwind 显示unwind段信息。当前只支持IA64 ELF的unwind段信息。

-d

--dynamic 显示动态段的信息。

-V

--version-info 显示版本段的信息。

-A

--arch-specific 显示CPU构架信息。

-D

--use-dynamic 使用动态段中的符号表显磨芦示符号，而不是使用符号段。

-x <number or name>

--hex-dump=<number or name>以16进制方式显示指定段内内容。number指定段表中段的索引,或字符串指定文件中的段名。

-w[liaprmfFsoR] or

--debug-dump[=line,=info,=abbrev,=pubnames,=aranges,=macro,=frames,=frames-interp,=str,=loc,=Ranges]

显示调试段中指定的内容。

-I

--histogram 显示符号的时候，显示bucket list长度的柱状图。

-v

--version 显示readelf的版本信息。

-H

--help 显示readelf所支持的命令行选项。

-W

--wide 宽行输出。

@file 可以将选项集中到一个文件中，然后使用这个@file选项载入。

[举例]

先给出如下例子：

1,对于可执行文件形式的elf格式文件：

1)查看可执行程序的源代码如下：

[quietheart@lv-k cppDemo]$ cat main.cpp

#include <iostream>

using std::cout

using std::endl

void my_print()

int main(int argc, char *argv[])

{

my_print()

cout<<"hello!"<<endl

return 0

}

void my_print()

{

cout<<"print!"<<endl

}

2)编译如下：

[quietheart@lv-k cppDemo]$ g++ main.cpp -o main

[quietheart@lv-k cppDemo]$ g++ -g main.cpp -o main.debug

3)编译之后，查看生成的文件：

[quietheart@lv-k cppDemo]$ ls -l

总计 64

-rwxr-xr-x 1 quietheart quietheart 6700 07-07 18:04 main

-rw-r--r-- 1 quietheart quietheart 201 07-07 18:02 main.cpp

-rwxr-xr-x 1 quietheart quietheart 38932 07-07 18:04 main.debug

这里，main.debug是带有调试信息的可执行文件，main是一般的可执行文件。

2,对于库文件形式的elf格式文件：

1)查看库的源代码如下：

//myfile.h

#ifndef __MYFILE_H

#define __MYFILE_H

void printInfo()

#endif

//myfile.cpp

#include "myfile.h"

#include <iostream>

using std::cout

using std::endl

void printInfo()

{

cout<<"hello"<<endl

}

2)编译如下：

[quietheart@lv-k bak]$ g++ -c myfile.cpp

[quietheart@lv-k bak]$ g++ -shared -fPCI -o libmy.so myfile.o

[quietheart@lv-k bak]$ ar -r libmy.a myfile.o

ar: creating libmy.a

3)编译之后，查看生成的文件：

[quietheart@lv-k bak]$ ls -l

总计 44

-rw-r--r-- 1 quietheart quietheart 2154 07-08 16:14 libmy.a

-rwxr-xr-x 1 quietheart quietheart 5707 07-08 16:08 libmy.so

-rwxr-xr-x 1 quietheart quietheart 117 07-08 16:06 myfile.cpp

-rwxr-xr-x 1 quietheart quietheart 63 07-08 16:08 myfile.h

-rw-r--r-- 1 quietheart quietheart 2004 07-08 16:08 myfile.o

libmy.a libmy.so myfile.cpp myfile.h myfile.o

这里，分别生成目标文件myfile.o，共享库文件libmy.so，和静态库文件libmy.a。

我是这样理解的：

存储物信器空间是和硬件相关联的，可以对某些地址上写数据来控制硬桐此件，为了方便使用（总不可局蚂迅能都用地址来直接控制，那样就工作量就太大了），将这些地址赋予了一些变量名，通过变量名来控制硬件（也就是寄存器的概念）。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/12223858.html

编译技术什么是程序的入口语句

发表评论

评论列表（0条）