构造符号的双重发射

今天,我发现了一个非常有趣的事情,关于 g++nm... ... 构造函数定义似乎在库中有两个条目。

我有一个标题 thing.hpp:

class Thing
{
Thing();


Thing(int x);


void foo();
};

And thing.cpp:

#include "thing.hpp"


Thing::Thing()
{ }


Thing::Thing(int x)
{ }


void Thing::foo()
{ }

我用以下方法编译:

g++ thing.cpp -c -o libthing.a

然后,我在上面运行 nm:

%> nm -gC libthing.a
0000000000000030 T Thing::foo()
0000000000000022 T Thing::Thing(int)
000000000000000a T Thing::Thing()
0000000000000014 T Thing::Thing(int)
0000000000000000 T Thing::Thing()
U __gxx_personality_v0

As you can see, both of the constructors for Thing are listed with two entries in the generated static library. My g++ is 4.4.3, but the same behavior happens in clang, so it isn't just a gcc issue.

这没有引起任何明显的问题,但我想知道:

  • 为什么定义的构造函数被列出两次?
  • 为什么这不会导致“符号的多重定义 _ _”问题?

编辑 : 对于卡尔来说,没有 C参数的输出:

%> nm -g libthing.a
0000000000000030 T _ZN5Thing3fooEv
0000000000000022 T _ZN5ThingC1Ei
000000000000000a T _ZN5ThingC1Ev
0000000000000014 T _ZN5ThingC2Ei
0000000000000000 T _ZN5ThingC2Ev
U __gxx_personality_v0

正如你所看到的,同一个函数正在生成多个符号,这仍然很奇怪。

当我们在这里的时候,这里是一个生成的组装部分:

.globl _ZN5ThingC2Ev
.type   _ZN5ThingC2Ev, @function
_ZN5ThingC2Ev:
.LFB1:
.cfi_startproc
.cfi_personality 0x3,__gxx_personality_v0
pushq   %rbp
.cfi_def_cfa_offset 16
movq    %rsp, %rbp
.cfi_offset 6, -16
.cfi_def_cfa_register 6
movq    %rdi, -8(%rbp)
leave
ret
.cfi_endproc
.LFE1:
.size   _ZN5ThingC2Ev, .-_ZN5ThingC2Ev
.align 2
.globl _ZN5ThingC1Ev
.type   _ZN5ThingC1Ev, @function
_ZN5ThingC1Ev:
.LFB2:
.cfi_startproc
.cfi_personality 0x3,__gxx_personality_v0
pushq   %rbp
.cfi_def_cfa_offset 16
movq    %rsp, %rbp
.cfi_offset 6, -16
.cfi_def_cfa_register 6
movq    %rdi, -8(%rbp)
leave
ret
.cfi_endproc

所以生成的代码是一样的。


编辑 : 为了查看实际调用了什么构造函数,我将 Thing::foo()更改为:

void Thing::foo()
{
Thing t;
}

生成的程序集是:

.globl _ZN5Thing3fooEv
.type   _ZN5Thing3fooEv, @function
_ZN5Thing3fooEv:
.LFB550:
.cfi_startproc
.cfi_personality 0x3,__gxx_personality_v0
pushq   %rbp
.cfi_def_cfa_offset 16
movq    %rsp, %rbp
.cfi_offset 6, -16
.cfi_def_cfa_register 6
subq    $48, %rsp
movq    %rdi, -40(%rbp)
leaq    -32(%rbp), %rax
movq    %rax, %rdi
call    _ZN5ThingC1Ev
leaq    -32(%rbp), %rax
movq    %rax, %rdi
call    _ZN5ThingD1Ev
leave
ret
.cfi_endproc

因此它正在调用完整的对象构造函数。

10601 次浏览

We'll start by declaring that 海湾合作委员会紧随其后 安腾 C + + ABI.


根据 ABI,你的 Thing::foo()的错误名称很容易解析:

_Z     | N      | 5Thing  | 3foo | E          | v
prefix | nested | `Thing` | `foo`| end nested | parameters: `void`

您可以以类似的方式读取构造函数名,如下所示。注意构造函数“ name”没有给出,而是一个 C子句:

_Z     | N      | 5Thing  | C1          | E          | i
prefix | nested | `Thing` | Constructor | end nested | parameters: `int`

但是这个 C1是什么? 你的复制品有 C2。这个 刻薄是什么?

Well, 这也很简单:

  <ctor-dtor-name> ::= C1   # complete object constructor
::= C2   # base object constructor
::= C3   # complete object allocating constructor
::= D0   # deleting destructor
::= D1   # complete object destructor
::= D2   # base object destructor

等等,为什么是 很简单?这个类没有基础。为什么它有一个“完整的对象构造函数”还有一个“基本对象构造函数”为每个?

  • 这个问答 对我来说意味着这只是多态性支持的一个副产品,即使在这种情况下实际上并不需要它。

  • 请注意,c++filt过去常常将这些信息包含在其分离的输出 但现在不是了中。

  • 这篇论坛帖子 提出了同样的问题,唯一的回复并没有更好地回答这个问题,除了暗示当不涉及多态时 GCC 可以避免发出两个构造函数,并且这种行为应该在将来得到改进。

  • 这个新闻组发布 描述了由于这种双重发射而在构造函数中设置断点的问题。再次声明,问题的根源是支持多态性。

事实上,这被列为海湾合作委员会的“已知问题”:

G + + 发出构造函数和析构函数的两个副本。

通常有三种类型的构造函数(和 破坏程序)。

  • 完整的对象构造函数/析构函数。
  • 基对象构造函数/析构函数。
  • 分配构造函数/释放析构函数。

当虚拟基类 牵涉其中。


这些不同构造函数的含义 看起来是这样的:

  • “完整的对象构造函数”。它还构造虚拟基类。

  • 它创建对象本身,以及数据成员和非虚拟基类。

  • “分配对象构造函数”。它执行完整对象构造函数所做的所有事情,并且调用运算符 new 来实际分配内存... < em > 但显然这种情况并不常见。

如果没有虚拟基类,[前两个]是 相同; GCC 将在足够的优化级别上实际使用别名 the symbols to the same code for both.