最近在看 C++ 类继承中的字段内存布局,我就很好奇 C# 中的继承链那些 private 字段都哪里去了? 在内存中是如何布局的,毕竟在子类中是无法访问的。

一:举例说明

为了方便讲述,先上一个例子:

    internal class Program
{
static void Main(string[] args)
{
Chinese chinese = new Chinese();

int num = chinese.b; //b 字段无法访问,编译报错

Console.WriteLine(num);
}
}

public class Person
{
public int a = 10;
private int b = 11;
}

public class Chinese : Person
{
public int c = 12;
}

根据 C# 的类继承原则,上面的 ​​chinese.b​​​ 写法肯定是无法被编译的,因为它属于父类的 私有字段,既然无法被访问,那这个 ​​private b​​​ 到底去了哪里呢?要想找到答案,只能先从 ​​chinese​​ 实例处的汇编代码看起,看看有没有什么意外收获。

二:查看 chinese 处汇编代码

在 ​​new chinese()​​​ 处下一个断点,查看 ​​Visual Stduio 2022​​ 的反汇编窗口。

C# 类继承中的私有字段都去了哪里?_字段

接下来我稍微解读下:

1. 根据 MT 类型 实例化 chinese

07FD6176  mov         ecx,87205C4h  
07FD617B call CORINFO_HELP_NEWSFAST (06E30C0h)

这里的 ​​87205C4h​​​ 就是 Chinese 类型的 MT,然后通过 CLR 下的 ​​CORINFO_HELP_NEWSFAST​​ 处的方法进行实例化。

2. 使用 chinese 的构造函数进行类初始化

07FD6180  mov         dword ptr [ebp-40h],eax  
07FD6183 mov ecx,dword ptr [ebp-40h]
07FD6186 call CLRStub[MethodDescPrestub]@7e34871e07fd5d20 (07FD5D20h)
07FD618B mov eax,dword ptr [ebp-40h]

这里的 eax 是 ​​CORINFO_HELP_NEWSFAST​​​ 初始化方法的返回值,可以在 ​​ecx,dword ptr [ebp-40h]​​ 处下一个断点,观察它的内存布局。

C# 类继承中的私有字段都去了哪里?_c#_02

从布局图看,此时的 chinese 只是一个清零的默认状态,此时的 ​​a,b,c​​​ 三个字段还没有被赋值,那什么时候被赋值呢?这就是构造函数要做的事情了,也就是上面的 ​​CLRStub[MethodDescPrestub]@7e34871e07fd5d20 (07FD5D20h)​​​ 指令,接下来在 ​​07FD618B​​​ 处下一个断点,再次观察 ​​0x02C9F528​​​ 处的内存地址,也就是 ​​ebp-40​​ 的位置,接下来我们继续执行,截图如下:

C# 类继承中的私有字段都去了哪里?_c#_03

从图中可以看到,当构造函数执行完之后,有三处内存地址(变红)被赋值了,依次是 ​​a,b,c​​,这时候是不是让人眼前一亮。

3. 洞察真相

原来那个 ​​b=11​​​ 并没有丢,而是被 ​​chinese​​​ 类给完全继承下来的,而且布局规则是 ​​父类​​​ 字段在前, ​​子类​​ 字段在后的一种方式,有点意思,接下来的问题是如何把它提取出来?

三:如何提取 b 字段

如果是 C 语言,我们用 ​​*(pointer+2)​​​ 就可以轻松提取,那用托管的 C# 如何去实现呢? 可以用复杂的 ​​Marshal​​​ 包装类,应该也可以变相的使用 ​​Span​​​ 去搞定,这里我就不麻烦了,直接用非安全代码下的 ​​指针​​​ 去摆平,在 ​​a​​ 字段偏移 +4 的位置上提取, 参考代码如下:

        static void Main(string[] args)
{
unsafe
{
Chinese chinese = new Chinese();

fixed (int* ch = &chinese.a)
{
int b = *(ch + 1);

Console.WriteLine($"b={b}");
}
}
}
}

哈哈,是不是挺有意思。

C# 类继承中的私有字段都去了哪里?_开发语言_04