.net内存管理与指针

推荐原创

张吉踉 2012-12-10 19:39:54 ©著作权

©著作权归作者所有：来自51CTO博客作者张吉踉的原创作品，请联系作者获取转载授权，否则将追究法律责任

本人前段时间准备做个TIN三角网的程序，思想是是分割合并法，分割的同时建立平衡二叉树，然后子树建三角网并相互合并，再向上加入父亲的点集。由于我对.net语言熟点，就准备用c#语言实现。但是不知从那听过当建立的类型只想用来存储数据时，最好是用结构即值类型，用类影响性能。想想我先建立二叉树的节点，只需要一个点集集合和左右孩子节点的指针，用c++表示如下：

struct Node
.net内存管理与指针_指针

{

char c;

Node* lChind;
.net内存管理与指针_指针

Node* rChild;
.net内存管理与指针_指针

}

C++等指针性语言很容易建立这种结构，但是c#呢，这就比较麻烦了。c#等非指针性语言不直接支持指针类型，值类型之间赋值时会进行值的复制，只有在函数参数有关键字ref或out时才又引用的功能，怎样才能方便的实现值类型的指针功能呢。查资料知道c#支持unsafe关键字，这里就顺便总结一下.net的这方面的相关知识。这里先给个上面结构的c#实现方法：

unsafe struct Node
.net内存管理与指针_指针

{

public char c;
.net内存管理与指针_指针

Node* lChild;
.net内存管理与指针_指针

Node* rChild;
.net内存管理与指针_指针

public Node(char value_ch)
.net内存管理与指针_指针

{

c = value_ch;
.net内存管理与指针_指针

lChild = null;
.net内存管理与指针_指针

rChild = null;
.net内存管理与指针_指针

}

public Node* LChild
.net内存管理与指针_指针

{

get { return lChild; }
.net内存管理与指针_指针

set { lChild = value; }
.net内存管理与指针_指针

}

public Node* RChild
.net内存管理与指针_指针

{

get { return rChild; }
.net内存管理与指针_指针

set { rChild = value; }
.net内存管理与指针_指针

}

public override string ToString()
.net内存管理与指针_指针

{

string s = "值为:" + c;
.net内存管理与指针_指针

if (lChild != null)
.net内存管理与指针_指针

s += "," + "左孩子节点值为:" + lChild->c;
.net内存管理与指针_指针

if(rChild!=null)
.net内存管理与指针_指针

s += "," + "右孩子节点值为:" + rChild->c;
.net内存管理与指针_指针

return s;

}

unsafe关键字支持以下的用法：

1.定义不安全类（unsafe class class_name{})

2定义类的不安全字段

3.定义不安全结构（unsafe struct{})。上面定义的那个结构就是个不安全结构。

4定义不安全方法,不管该方法是静态方法，虚方法，还是实例方法。

5定义不安全代码段（....safe code...unsafe{....不安全代码段...}....safe code...)

大家都知道.net平台支持垃圾收集功能，它提供了一个垃圾收集器。c#的类型总分为值类型和引用类型，垃圾收集器负责释放引用类型（准确的说是托管类型），所占的内存这很大程度上解决了c,c++等语言的内存泄露和重写问题。.NET平台的内存管理系统将值类型分配在堆栈上，分配时从高地址往低地址分配；引用类型则分配在堆上，分配时从低地址往高地址分配。下面定义的代码段说明了这个问题：

unsafe

{

int x, y, z;
.net内存管理与指针_指针

byte m=199;
.net内存管理与指针_指针

int n=200;
.net内存管理与指针_指针

x = 5;

y = 10;

z = 15;

int* _p = &x;
.net内存管理与指针_指针

Console.WriteLine("x的地址为{0}",(uint)_p);
.net内存管理与指针_指针

Console.WriteLine("_p的地址为{0})",(uint)&_p);
.net内存管理与指针_指针

_p--;

Console.WriteLine("y的地址为{0},_p的值为{1}",(uint)&y,(uint)_p);
.net内存管理与指针_指针

_p--;

Console.WriteLine("z的地址为{0},_p的值为{1}", (uint)&z, (uint)_p);
.net内存管理与指针_指针

_p--;

Console.WriteLine("m的地址为{0},_p的值为{1}", (uint)&m, (uint)_p);
.net内存管理与指针_指针

_p--;

Console.WriteLine("n的地址为{0},_p的值为{1}", (uint)&n, (uint)_p);
.net内存管理与指针_指针

}

这里定义了x,y,z,m,n五个变量，还有一个整型的指针变量_p。接着输出它们的地址。从运行结果（这里我采用是十进制表示地址）我们可以看到这六个变量的地址依次降低，每个变量占四个字节的内存（int存储在32位处理器堆栈的连续空间上，并不是所有数据类型在堆栈上都是连续分配）。指针本质上也是一个整数，只是这个整数表示的是内存中的一个地址（在32为系统上是0~40亿），我们可以使用uint来对地址进行整数化。同时这里还涉及了一个指针的运算，指针_p首先指向x，然后减1（实际减了sizeof(数据类型））,前面我们说过内存分配在堆栈中是从高到底分配的，这时指针就指向了y，从结果可以看到y的地址和_p的值一样；如果我们将_p加1即指向内存81783252，会发生什么情况呢?谁也不知道会发生什么事情，如果我们给这个内存赋值，可能会重写被别的程序使用的这块内存，也可能是一个空内存的简单存值而已。上面还有个问题，m变量是字节类型的，理论上是占一个字节内存，这里为什么占四个字节内存（81783236~81783232）呢？原因是32位处理器最擅长于4字节的内存块中获取数据，这种机器上的内存会划分为4字节的块，为了下次分配时堆栈指针指向的是一个4字节内存块的开始处，所以.net决定在堆栈上分配内存时分配的大小为4的倍数（这里我也不是太清楚，我也是一个在校初学者，各位可不在此深入追究），故为byte类型分配了4字节的空间。当出了这些变量的作用域时，堆栈指针的值会依次增加，这相当于删除了这些局部变量。

引用类型则不是这样。引用类型的变量（指针）依旧存储在堆栈上，占领的空间为4字节，实际对象则保存在堆上，引用变量的删除和它所引用的对象的删除不是同步进行的，这会导致堆上的内存空洞的问题。堆里面保存了很多对象，垃圾收集器会维护这些对象的相关信息，如对象引用数，内存地址等等信息。垃圾收集器运行时，由于前面讲的不同步删除问题，这里会删除这些对象引用数为0的对象，这时会出现内存空洞（很多情况下，当我们的程序使用了未托管的资源时，如网络连接，数据库连接，文件连接，我们要手动释放这些资源所占的内存，通过使这些使用未托管资源的类实现IDispose接口是一个很好的做好）。下次在堆上为新对象分配内存时，肯定要进行扫描直至找到一块符合大小的内存块，这必然会增加实例化一个对象所花的时间，降低程序的性能。但垃圾收集器不可能让堆出现这种情况，它对在垃圾收集结束后重排内存，将留下的对象挪至到端（往低地址方向移），让堆指针指向堆的第一个空内存，下次实例化对象时从这里为对象分配空间即可，虽然这会花费一些时间，但是相比前面一种情况，微软相信性能能提高不少。同时，这也造成了一个问题，即指向类字段的指针的无效化，所以，一般情况下，c#不允许声明指向类字段的指针，就是这个堆对象的移动所造成的，但是通过fixed关键字，我们可以锁定对象，从而声明一个指向类字段的指针。如

unsafe

{

Program pro=new Program();
.net内存管理与指针_指针

fixed(int* p_id=&(pro.id),p_age=&(pro.age))
.net内存管理与指针_指针

fixed(double* p_salary=&(pro.salary))
.net内存管理与指针_指针

{

.....add code.....
.net内存管理与指针_指针

}

上面申明了两个整型指针，一个双精度指针，它们分别指向类Program的几个字段。

高性能数组的构造。c#规定数组是引用类型，所以它分配在堆上，这和c++的不一样，c++的数组是值类型，它分配在栈上。栈的访问速度非常快，在要频繁访问某个数组的程序里，让这个数组分配在栈上，能提高程序的性能。通过stackalloc关键字，能实现这个功能，如下：

unsafe

{