DATE: 2018.11.13


nm命令介绍的很多,但大多不介绍其函数符号标志的含义。

最近在调试动态库时常用到,其中用的最多的用法:

nm -A * |grep “aaa” | c++filt  // -A 为了显示文件, c++filt转换为可读风格,好像有个参数也能实现类似功能

其他内容整理如下(原作者未知):

nm用于列出目标文件的符号清单,如果没有指定目标文件,则默认为“a.out”。nm的格式如下:

nm [‘-a’|‘--debug-syms’] [‘-g’|‘--extern-only’]

         [‘-B’] [‘-C’|‘--demangle’[=style]] [‘-D’|‘--dynamic’]

         [‘-S’|‘--print-size’] [‘-s’|‘--print-armap’]

         [‘-A’|‘-o’|‘--print-file-name’][‘--special-syms’]

         [‘-n’|‘-v’|‘--numeric-sort’] [‘-p’|‘--no-sort’]

         [‘-r’|‘--reverse-sort’] [‘--size-sort’] [‘-u’|‘--undefined-only’]

         [‘-t’ radix|‘--radix=’radix] [‘-P’|‘--portability’]

         [‘--target=’bfdname] [‘-f’format|‘--format=’format]

         [‘--defined-only’] [‘-l’|‘--line-numbers’] [‘--no-demangle’]

        [‘-V’|‘--version’] [‘-X 32_64’] [‘--help’] [objfile...]


对于每一个符号,nm列出其值(the symbol value),类型(the symbol type)和其名字(the symbol name)。

如下例:


     00000024 T cleanup_before_linux

     00000018 T cpu_init

     00000060 T dcache_disable

     00000054 T dcache_enable

     0000006c T dcache_status

     00000000 T do_reset

     0000003c T icache_disable

     00000030 T icache_enable

     00000048 T icache_status


上面的显示是使用nm cpu.o的输出,对于cleanup_before_linux这个符号来说,00000024是以16进制显示的其值,T为其类型,而cleanup_before_linux是其名字。可以看出,上面显示的cleanup_before_linux这个symbol的值实际上是该函数在text section中的偏移。但是,每个符号的值的具体含义依其类型而异。当然,对于每个符号的值,其类型、其值以及它们所属的section是密切相关的。

下面说明符号类型:对于每一个符号来说,其类型如果是小写的,则表明该符号是local的;大写则表明该符号是global(external)的。







符号
类型

说明

A

该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。

B

该符号的值出现在非初始化数据段(bss)中。例如,在一个文件中定义全局static int test。则该符号test的类型为b,位于bss section中。其值表示该符号在bss段中的偏移。一般而言,bss段分配于RAM中

C

该符号为common。common symbol是未初始话数据段。该符号没有包含于一个普通section中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个c文件中,定义int test,并且该符号在别的地方会被引用,则该符号类型即为C。否则其类型为B。

D

该符号位于初始话数据段中。一般来说,分配到data section中。例如定义全局int baud_table[5] = {9600, 19200, 38400, 57600, 115200},则会分配于初始化数据段中。

G

该符号也位于初始化数据段中。主要用于small object提高访问small data object的一种方式。

I

该符号是对另一个符号的间接引用。

N

该符号是一个debugging符号。

R

该符号位于只读数据区。例如定义全局const int test[] = {123, 123};则test就是一个只读数据区的符号。注意在cygwin下如果使用gcc直接编译成MZ格式时,源文件中的test对应_test,并且其符号类型为D,即初始化数据段中。但是如果使用m6812-elf-gcc这样的交叉编译工具,源文件中的test对应目标文件的test,即没有添加下划线,并且其符号类型为R。一般而言,位于rodata section。值得注意的是,如果在一个函数中定义const char *test = “abc”, const char test_int = 3。使用nm都不会得到符号信息,但是字符串“abc”分配于只读存储器中,test在rodata section中,大小为4。

S

符号位于非初始化数据区,用于small object。

T

该符号位于代码区text section。

U

该符号在当前文件中是未定义的,即该符号的定义在别的文件中。例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是T。但是对于全局变量来说,在定义它的文件中,其符号类型为C,在使用它的文件中,其类型为U。

V

该符号是一个weak object。

W

The symbol is a weak symbol that has not been specifically tagged as a weak object symbol.

-

该符号是a.out格式文件中的stabs symbol。

?

该符号类型没有定义