1.源程序的编译
在Linux下面,如果要编译一个C语言源程序,我们要使用GNU的gcc编译器. 下面
我们以一个实例来说明如何使用gcc编译器.
假设我们有下面一个非常简单的源程序(hello.c):
int main(int argc,char **argv)
{
printf("Hello Linux\n")
}
要编译这个程序,我们只要在命令行下执行:
gcc -o hello hello.c
gcc 编译器就会为我们生成一个hello的可执行文件.执行./hello就可以看到程
序的输出结果了.命令行中 gcc表示我们是用gcc来编译我们的源程序,-o 选项表示
我们要求编译器给我们输出的可执行文件名为hello 而hello.c是我们的源程序文件.
gcc编译器有许多选项,一般来说我们只要知道其中的几个就够了. -o选项我们
已经知道了,表示我们要求输出的可执行文件名. -c选项表示我们只要求编译器输出
目标代码,而不必要输出可执行文件. -g选项表示我们要求编译器在编译的时候提
供我们以后对程序进行调试的信息.
知道了这三个选项,我们就可以编译我们自己所写的简单的源程序了,如果你
想要知道更多的选项,可以查看gcc的帮助文档,那里有着许多对其它选项的详细说
明.
2.Makefile的编写
假设我们有下面这样的一个程序,源代码如下:
#include "mytool1.h"
#include "mytool2.h"
int main(int argc,char **argv)
{
mytool1_print("hello")
mytool2_print("hello")
}
#ifndef _MYTOOL_1_H
#define _MYTOOL_1_H
void mytool1_print(char *print_str)
#endif
#include "mytool1.h"
void mytool1_print(char *print_str)
{
printf("This is mytool1 print %s\n",print_str)
}
#ifndef _MYTOOL_2_H
#define _MYTOOL_2_H
void mytool2_print(char *print_str)
#endif
#include "mytool2.h"
void mytool2_print(char *print_str)
{
printf("This is mytool2 print %s\n",print_str)
}
当然由于这个程序是很短的我们可以这样来编译
gcc -c main.c
gcc -c mytool1.c
gcc -c mytool2.c
gcc -o main main.o mytool1.o mytool2.o
这样的话我们也可以产生main程序,而且也不时很麻烦.但是如果我们考虑一
下如果有一天我们修改了其中的一个文件(比如说mytool1.c)那么我们难道还要重
新输入上面的命令?也许你会说,这个很容易解决啊,我写一个SHELL脚本,让她帮我
去完成不就可以了.是的对于这个程序来说,是可以起到作用的.但是当我们把事情
想的更复杂一点,如果我们的程序有几百个源程序的时候,难道也要编译器重新一
个一个的去编译?
为此,聪明的程序员们想出了一个很好的工具来做这件事情,这就是make.我们
只要执行以下make,就可以把上面的问题解决掉.在我们执行make之前,我们要先
编写一个非常重要的文件.--Makefile.对于上面的那个程序来说,可能的一个
Makefile的文件是:
# 这是上面那个程序的Makefile文件
main:main.o mytool1.o mytool2.o
gcc -o main main.o mytool1.o mytool2.o
main.o:main.c mytool1.h mytool2.h
gcc -c main.c
mytool1.o:mytool1.c mytool1.h
gcc -c mytool1.c
mytool2.o:mytool2.c mytool2.h
gcc -c mytool2.c
有了这个Makefile文件,不过我们什么时候修改了源程序当中的什么文件,我们
只要执行make命令,我们的编译器都只会去编译和我们修改的文件有关的文件,其
它的文件她连理都不想去理的.
下面我们学习Makefile是如何编写的.
在Makefile中也#开始的行都是注释行.Makefile中最重要的是描述文件的依赖
关系的说明.一般的格式是:
target: components
TAB rule
第一行表示的是依赖关系.第二行是规则.
比如说我们上面的那个Makefile文件的第二行
main:main.o mytool1.o mytool2.o
表示我们的目标(target)main的依赖对象(components)是main.o mytool1.o
mytool2.o 当倚赖的对象在目标修改后修改的话,就要去执行规则一行所指定的命
令.就象我们的上面那个Makefile第三行所说的一样要执行 gcc -o main main.o
mytool1.o mytool2.o 注意规则一行中的TAB表示那里是一个TAB键
Makefile有三个非常有用的变量.分别是$@,$^,$<代表的意义分别是:
$@--目标文件,$^--所有的依赖文件,$<--第一个依赖文件.
如果我们使用上面三个变量,那么我们可以简化我们的Makefile文件为:
# 这是简化后的Makefile
main:main.o mytool1.o mytool2.o
gcc -o $@ $^
main.o:main.c mytool1.h mytool2.h
gcc -c $<
mytool1.o:mytool1.c mytool1.h
gcc -c $<
mytool2.o:mytool2.c mytool2.h
gcc -c $<
经过简化后我们的Makefile是简单了一点,不过人们有时候还想简单一点.这里
我们学习一个Makefile的缺省规则
连接(link),是把目标文件转化为可执行文件或动态库的过程。高级语言的代码经过编译之后会生成目标文件(linux上是.o文件)。
目标文件不能直接运行,因为它并没有把高级语言里的变量名、函数名等符号转化为具体的内存地址。
把符号名转化成内存地址的工具,就是连接器(linker)。
它还要生成一个程序头,告诉 *** 作系统怎么加载这个程序。
在Linux上常用的连接器是ld。如果gcc在报错时打印了ld的错误信息,就说明是连接错误,而不是编译错误。
如上图,只有两个函数add()和sub(),打印的信息是要引用的标签main没有定义。也就是没找到main函数。
“在函数_start中”,说明main函数是被_start调用的。它是汇编的入口函数,一般汇编代码的开头要这么写:
.text
.global _start
_start:
call main
call exit
第一个call是调用main函数,开始运行C/C++代码。
在main函数返回之后,要主动调用exit()函数退出进程。否则程序在main函数返回之后就不可控了,然后程序会访问无效的内存,再被 *** 作系统干掉。
在C和C++中,这个_start函数是编译器提供的。
python和perl之类的脚本语言,不会直接编译成机器码,而是被解释器运行,所以不需要连接。只要它们的解释器能搞明白它们的语法树,就能直接运行,最多速度慢点。
一般会编译为字节码(例如java字节码),在虚拟机上运行,比直接遍历语法树要快。
直接编译为机器码的C语言,肯定是速度最快的。
编译为机器码,就要把各种函数和变量转化为具体的内存地址,才可以运行。
CPU没有数据结构的概念,只有地址和字节的概念。
读哪个位置的多少字节,把多少字节写到哪个位置,调用哪个位置的函数。
位置,就是内存地址。字节,就是内存的内容或大小。
所以,实际上汇编是远比C简单的(汗)。
汇编之所以难,在于汇编码的信息含量太低,同样的功能下代码冗长,可读性很差,所以才显得难。
需要在连接时转化为内存地址的函数和变量,有这么几类:
1,函数,
不管是全局函数,静态函数,还是成员函数,都属于代码。都要存放在目标文件的代码段,即以.text命名的节。
Linux的可执行文件,elf格式
(Linux上,目标文件、动态库、可执行文件都是elf格式)
在编译时,并不知道这些函数的具体地址。
因为编译的文件只是其中一个.o文件,能确定的只是函数在这个.o文件里的位置。
如果函数调用了其他文件里的函数,那
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)