-O设置一共有五种:-O0、-O1、-O2、-O3和-Os。你只能在/etc/make.conf里面设置其中的一种。

除了-O0以外,每一个-O设置都会多启用几个选项,请查阅gcc手册的优化选项章节,以便了解每个-O等级启用了哪些选项及它们有何作用。

让我们来逐一考察各个优化等级:

-O0: 这个等级(字母“O”后面跟个零)关闭所有优化选项。这样就不会优化代码,这通常不是我们想要的。
-O1:这是最基本的优化等级。与-o等同, 编译器会在不花费太多编译时间的同时试图生成更快更小的代码。这些优化是非常基础的,但一般这些任务肯定能顺利完成。
-O2:-O1的进阶。这是推荐的优化等级,除非你有特殊的需求。-O2会比-O1启用多一些标记。设置了-O2后,编译器会试图提高代码性能而不会增大体积和大量占用的编译时间。
-O3:这是最高最危险的优化等级。用这个选项会延长编译代码的时间,并且在使用gcc4.x的系统里不应全局启用。自从3.x版本以来gcc的行为已经有了极大地改变。在3.x,-O3生成的代码也只是比-O2快一点点而已,而gcc4.x中还未必更快。用-O3来编译所有的软件包将产生更大体积更耗内存的二进制文件,大大增加编译失败的机会或不可预知的程序行为(包括错误)。这样做将得不偿失,记住过犹不及。在gcc 4.x.中使用-O3是不推荐的。
-Os:这个等级用来优化代码尺寸。其中启用了-O2中不会增加磁盘空间占用的代码生成选项。这对于磁盘空间极其紧张或者CPU缓存较小的机器非常有用。但也可能产生些许问题,因此软件树中的大部分ebuild都过滤掉这个等级的优化。使用-Os是不推荐的。

GCC -g选项控制GDB调试级别

如果不打开-g或者-ggdb(GDB专用)调试开关,GCC编译时不会加入调试信息,因为这会增大生成代码的体积。GCC采用了分级调试,通过在-g选项后附加数字1、2或3来指定在代码中加入调试信息量。默认的级别是2(-g2),此时调试信息包括扩展的符号表、行号、局部或外部变量信息。级别3(- g3)包含级别2中的调试信息和源代码中定义的宏。级别1(-g1)不包含局部变量和与行号有关的调试信息,只能用于回溯跟踪和堆栈转储之用。[ 回溯跟踪指的是监视程序在运行过程中的函数调用历史,堆栈转储则是一种以原始的十六进制格式保存程序执行环境的方法,两者都是经常用到的调试手段。

objdump & nm & addr2line

1. objdump

objdump 命令是 Linux 下的反汇编目标文件或者可执行文件的命令.

a. 反汇编test文件中需要执行指令的section

objdump –d test

b. 反汇编test文件中所有section

objdump –D test

c. 显示test文件的section header信息

objdump –h test

d. 反汇编test文件中需要执行指令的section,并且保留c源代码作为参照

objdump –S test

e. 指定反汇编的指令架构i386,  i386:x86-64等

objdump –d –m i386 test

2. nm

nm 用来列出一个目标文件中的各种符号

#cat test.c

static int uninit_static_global;

static int init_static_global = 2;

int unit_global;

char *init_global = "hello, world";

const readOnly = 10;

extern int extern_global;

void function()

{undefined

printf("Hello");

int get_local()

{undefined

int local;

static int uninit_local_static;

static int init_local_static = 10;

local = 33;

return local;

#gcc  -c test.c –g

# nm -A -l -n test.o

test.o:                                 U printf    /home/cr7/test/test.c:31

test.o:0000000000000000 T function /home/cr7/test/test.c:29

test.o:0000000000000000 d init_static_global           /home/cr7/test/test.c:24

test.o:0000000000000000 b uninit_static_global       /home/cr7/test/test.c:23

test.o:0000000000000004 C uninit_global

test.o:0000000000000004 b uninit_local_static.4246            /home/cr7/test/test.c:31

test.o:0000000000000008 D init_global        /home/cr7/test/test.c:26

test.o:0000000000000010 d init_local_static.4247

test.o:0000000000000010 R readOnly           /home/cr7/test/test.c:27

test.o:0000000000000018 T get_local            /home/cr7/test/test.c:33

T: text段代表函数

D: 已初始化data段全局数据

d: 已初始化bss段(static)数据

R: 只读数据

C: 未初始化data段全局数据

b: 未初始化bss段(static)数据

-A: 显示符号所属文件

-l: 显示符号所属源文件行号

-n: 所有符号从低地址到高地址排序

Others: –u 只列出未定义符号; --defined-only 将只列出已定义符号

3. addr2line

Addr2line 根据一个代码地址,定位到对应的源文件与代码行

#cat test.c

static int global = 2;

void function()

{undefined

printf("Hello");

global = 10;

int main()

{undefined

function();

return 0;

#gcc  -o test test.c  –g

#nm test

00000000004004f4 T function

0000000000601020 d global

0000000000400516 T main

U printf@@GLIBC_2.2.5

#addr2line -a 4004f4 -e test

0x00000000004004f4

/home/cr7/test/test.c:26

-a 文件中地址, -e可执行文件

#addr2line -f 4004f4 -e test

function

/home/cr7/test/test.c:26

-f 显示文件中地址所在函数

ar & objcopy & readelf & gprof

ar 用于建立、修改、提取档案文件(archive)。archive是一个包含多个被包含文件的单一文件(也称之为库文件),其结构保证了可以从中检索并得 到原始的被包含文件(称之为archive中的member)。member的原始文件内容、模式(权限)、时间戳、所有着和组等属性都被保存在 archive中。member被提取后,他们的属性被恢复到初始状态。

ar主要用于创建C库文件

创建静态库
(1) 生成目标文件:

$ gcc -Wall -c file1.c file2.c file3.c


不用指定生成.o文件名(默认生成file1.o, file2.o, file3.o)。

(2) 从.o目标文件创建静态连接库
$ ar rv libNAME.a file1.o file2.o file3.o

ar生成了libNAME.a库,并列出库中的文件。
r : 将flie1.o, file2,o, file3.o插入archive,如故原先archive中已经存在某文件,则先将该文件删除。
v : 显示ar操作的附加信息


创建动态库(利用gcc,未用ar)

(1) 生成目标文件

$ gcc -Wall -c -fpic file1.c file2.c file3.c


-fpic: 指定生成的.o目标文件可被重定址. pic是position idependent code的缩写: 位置无关代码.

(2)生成动态库文件

$ gcc -shared -o libNAME.so file1.o file2.o file3.o


一般地, 连接器使用main()函数作为程序入口. 但在动态共享库中没有这样的入口. 所以就要指定-shared选项来避免编译器显示出错信息.

实际上, 上述的两条命令可以合并为下面这条:

$ gcc -Wall -shared -fpic -o libNAME.so file1.c file2.c file3.c



此后,将main函数所在的程序与libNAME.so连接

至此,与动态库连接的函数编译成了一个可执行文件。貌似成功了,但还差最后一步。如果直接运行该程序,会给出这样的错误信息:

error while loading shared libraries: libhello.so:
cannot open shared object file: No such file or directory


这是因为与动态库连接的程序在运行时,首先将该动态库加载到内存中,而gcc默认加载动态库文件所在目录为/usr/local/lib, /usr/lib。刚才的程序虽然能编译成功,但如果我们自己建立的动态库没有位于默认目录中,则执行时会应为无法找到它而失败。

解决办法:改变加载路径对应的环境变量,然后再执行。


export LD_LIBRARY_PATH=动态库所在目录:$LD_LIBRARY_PATH


查看archive内容

$ ar tv archiveNAME


t : 显示archive中member的内容,若不指定member,则列出所有。
v : 与t结合使用时,显示member的详细信息。

要想进了解ar的详细选项,参考ar的on-line manual

objcopy

objcopy可以将一种格式的目标文件转化为另外一种格式的目标文件. 它使用GNU BFD库进行读/写目标文件.使用BFD, objcopy就能将原格式的目标文件转化为不同格式的目标文件.
以我们在nm中使用的hello.o目标文件和hello可执行为例:

$ file hello.o hello


file命令用来判别文件类型, 输出如下:

hello.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped
hello: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 2.2.0, dynamically linked (uses shared libs), not stripped

现在运行objcopy来改变hello的文件类型: 原先它是ELF格式的可执行程序, 现将它转换为srec格式. srec格式文件是Motolora S-Record格式的文件, 主要用来在主机和目标机之间传输数据.


$ objcopy -O srec hello hello_srec
$ file hello.o hello


file命令结果: hello_srec: Motorola S-Record; binary data in text format

注意objcopy的格式, "-O"指定输出文件类型; 输入文件名和输出文件名位于命令末尾. 关于objcopy命令的详细选项, 参考on-line manual

readelf

readelf用来显示ELF格式目标文件的信息.可通过参数选项来控制显示哪些特定信息.(注意: readelf不支持显示archive文档, 也不支持64位的ELF文件).
下面利用先前的hello可执行文件演示readelf的简单用法:


$ readelf -h hello


ELF Header:
Magic: 7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00
Class: ELF32
Data: 2's complement, little endian
Version: 1 (current)
OS/ABI: UNIX - System V
ABI Version: 0
Type: EXEC (Executable file)
Machine: Intel 80386
Version: 0x1
Entry point address: 0x80482c0
Start of program headers: 52 (bytes into file)
Start of section headers: 3848 (bytes into file)
Flags: 0x0
Size of this header: 52 (bytes)
Size of program headers: 32 (bytes)
Number of program headers: 7
Size of section headers: 40 (bytes)
Number of section headers: 34
Section header string table index: 31

注意: readelf只能用于ELF格式目标文件, 且选项中至少要指定一个(除V, H外)的选项!

gprof

gprof被用来测量程序的性能. 它记录每个函数被调用的次数以及相应的执行时间. 这样就能锁定程序执行时花费时间最多的部分, 对程序的优化就可集中于对它们的优化.

用一个简单的数值计算程序来掩饰gprof的用法:

collatz.c:
#include <stdio.h>
/* Computes the length of Collatz sequences */
unsigned int step (unsigned int x)
{
if (x % 2 == 0)
{
return (x / 2);
}
else
{
return (3 * x + 1);
}
}

unsigned int nseq (unsigned int x0)
{
unsigned int i = 1, x;
if (x0 == 1 || x0 == 0)
return i;
x = step (x0);
while (x != 1 && x != 0)
{
x = step (x);
i++;
}
return i;
}

int main (void)
{
unsigned int i, m = 0, im = 0;
for (i = 1; i < 500000; i++)
{
unsigned int k = nseq (i);
if (k > m)
{
m = k;
im = i;
printf ("sequence length = %u for %u\n", m, im);
}
}
return 0;
}


先将collatz.c编译成目标文件collatz.o, gcc通过 -pg选项来打开gprof支持:

$ gcc -Wall -c -pg collatz.c

$ gcc -Wall -pg -o collatz collatz.o


注意:两条命令都要加 "-pg"选项。前一条命令生成collatz.o目标文件。后一条命令生成可执行文件,该可执行文件中包含了记录函数执行时间的指令。
生成collatz可执行文件后,现执行它,结果与一般程序的执行无疑。但此时在PWD目录生成一个名为"gmon.out"的文件,gprof通过它来分析程序的执行。
如果不现执行程序,而直接用gprof来分析它,会提示“gmon.out: No such file or directory”。

gprof用法:

$ gprof ./collatz