拷贝构造函数

一个小例子

  最近在《剑指Offer》上看到了一道题(程序如下),要求我们分析编译运行的结果,并提供3个选项: A. 编译错误; B. 编译成功,运行时程序崩溃;C. 编译运行正常,输出10。 

 1 #include <iostream>
 2 using namespace std;
 3 
 4 class A
 5 {
 6 private:
 7     int value;
 8 
 9 public:
10     A(int n) { value = n; }
11     A(A other) { value = other.value; }
12     void Print() { cout << value << endl; }
13 };
14 
15 int main()
16 {
17     A a = 10;
18     A b = a;
19     b.Print();
20     return 0;
21 }

  这个程序是通不过编译的,GCC和VS均通不过。根据《剑指Offer》上的解释,上述程序中的拷贝构造函数A(A other)传入的参数是A的一个实例,所以由于是传值参数,我们把形参复制到实参会调用拷贝构造函数。因此如果允许拷贝构造函数传值,就会在拷贝构造函数内调用复制构造函数,就会形成无休止的递归调用从而导致栈溢出。为了说明这个解释,我们先看下稍微修改过的程序:

 1 #include <iostream>
 2 using namespace std;
 3 
 4 class A
 5 {
 6 private:
 7     int value;
 8 
 9 public:
10     A(int n) 
11     { 
12         value = n; 
13         cout << "constructor with argument" << endl;
14     }
15 
16     A(const A& other) 
17     { 
18         value = other.value; 
19         cout << "copy constructor" << endl;
20     }
21 
22     A& operator=(const A& other)
23     {
24         cout << "assignment operator" << endl;
25         value = other.value;
26         return *this;
27     }
28 
29     void func(A other) 
30     {  
31     }
32 };
33 
34 int main()
35 {
36     A a = 10;      //    constructor with argument
37     A b = 5;       //    constructor with argument
38     b = a;          //    assignment operator
39     A c = a;       //    copy constructor
40     b.func(a);      //    copy constructor
41 
42     return 0;
43 }

  程序的运行结果如下:

  拷贝构造函数与赋值运算符重载函数要点_c++

  对于上述程序的第39行,构造c,实质上是c.A(a)。假如拷贝构造函数参数不是引用类型的话,那么将使得c.A(a)变成a传值给c.A(A other),即A other = a,而other没有被初始化,所以other = a将继续调用拷贝构造函数(这也是为什么调用func函数会调用拷贝构造函数)。接下来是构造other,也就是other.A(a),即A other = a,又会触发拷贝构造函数,这样永远地递归下去。

  

  关于上述程序还有一些值得说明的:

  1)当某对象没被初始化,这时运用赋值运算符调用的是拷贝构造函数;否则调用的是赋值运算符重载函数;

  2)上述程序的“A a = 10”实际存在隐式类型转换(从int到A),这是编译器默认帮我们处理的。这条语句相当于:

A tmp(10);
A a(tmp);     // or a = tmp

  如果我们不想编译器默认帮我们做这种转换,我们可以在构造函数前加上关键字explicit:

explicit A(int n)
{...}

  这样,类似这样的赋值“A a = 10”将通不过编译。

  另外,当我们定义如下的函数:如果构造函数前没有加explicit,则我们这样子调用test(10)是可以的;但如果加了explicit就会提示无法从‘int’转换为‘A’。

void test(A other)
{
}

  关于explicit可参考:

  What does the explicit keyword in C++ mean?

  C++ explicit关键字 详解(用于构造函数)

 

  3)关于public、protected、private几个关键字的重新理解。如果我们直接在main函数用a.value是不行的(因为权限是private),但在拷贝构造函数和重载赋值运算符函数中确是可以的,而且,当我们不将传入参数设定为const的话,我们在函数中还可以修改传入参数的值,这不是自相矛盾了吗?具体解释可以参考博文C++ 类访问控制public/private/protected探讨的说法:

  “   

  类是将数据成员和进行于其上的一系列操作(成员函数)封装在一起。注意:成员函数可以操作数据成员(可以称类中的数据成员为泛数据成员)!  

  对象是类的实例化,怎样理解实例化?其实每一个实例对象都只是对其中的数据成员初始化,内存映像中每个对象仅仅保留属于自己的那份数据成员副本。而成员函数对于整个类而言却是共享的,即一个类只保留一份成员函数。

  那么每个对象怎样和这些可以认为是“分离”的成员函数发生联系,即成员函数如何操作对象的数据成员?记住this指针,无论对象通过(.)操作或者(->)操作调用成员函数。编译时刻,编译器都会将这种调用转换成我们常见的全局函数的形式,并且多出一个参数(一般这个参数放在第一个,有点像python中类中函数声明中的self参数),然后将this指针传入这个参数。于是就完成了对象与成员函数的绑定(或联系)。

  实例化后就得到同一个类的多个不同的对象,既然成员函数共享的,那么成员函数就可以操作对象的数据成员。

  问题是现在有多个对象,成员函数需要知道操作的是哪个对象的数据成员?比如有对象obj1和obj2,都属于A类,A类有public成员函数foo()。如果obj1调用该函数,编译时会给foo函数传入this指针,obj1.foo中操作obj1自身的成员就不用任何修饰,直接访问,因为其中的数据成员自动根据this指针找到。

  如果obj1调用该函数,同样可以访问同类的其他对象的数据成员!那么你需要做的是让foo函数知道是同类对象中哪个对象的数据成员,一个解决办法是传入同类其他对象的指针或引用,那么就可以操作同类其他对象的数据成员。

  foo(A& obj)

  这样定义,然后调用:

  obj1.foo(obj2)

  就可以在obj1访问obj2的数据成员,而无论这些数据成员是private还是protected

  " 

处理静态成员变量

  关于静态成员变量详细的可参考之前博文C/C++中关键字static的用法及作用。静态成员变量主要是为了同个类的不同实例之间数据的共享,所以其处理方法也跟其他成员变量稍微不一样。

  先看下程序:

 1 class Rect
 2 {
 3 public:
 4     Rect()      // 构造函数,计数器加1
 5     {
 6         count++;
 7     }
 8     ~Rect()     // 析构函数,计数器减1
 9     {
10         count--;
11     }
12     static int getCount()       // 返回计数器的值
13     {
14         return count;
15     }
16 private:
17     int width;
18     int height;
19     static int count;       // 一静态成员做为计数器
20 };
21 
22 int Rect::count = 0;        // 初始化计数器
23 
24 int main()
25 {
26     Rect rect1;
27     cout << "The count of Rect: " << Rect::getCount() << endl;
28 
29     Rect rect2(rect1);   // 使用rect1复制rect2,此时应该有两个对象
30     cout << "The count of Rect: " << Rect::getCount() << endl;
31 
32     return 0;
33 }

  程序的输出结果都是count = 1,这明显跟我们的期望值(应该是2)不一样。具体原因在于我们没有定制拷贝构造函数,而是由编译器帮我们自动生成一个默认拷贝函数:

1 Rect::Rect(const Rect& orig)
2 {
3     width = orig.width;
4     height = orig.height;
5 }

  显然这里并没有处理静态成员变量count,所以我们需要定制拷贝构造函数:

1 Rect(const Rect& orig)   // 拷贝构造函数
2 {
3     width = orig.width;
4     height = orig.height;
5     count++;             // 计数器加1
6 }

深拷贝与浅拷贝

  深拷贝主要解决的问题是指针成员变量浅拷贝的问题。这方面的博文很多,可以参考博文C++拷贝构造函数详解。这篇博文有提到了几点值得注意的:

  1. 防止默认拷贝(也能够禁止复制)

  有一个小技巧可以防止按值传递——声明一个私有拷贝构造函数。甚至不必去定义这个拷贝构造函数,这样因为拷贝构造函数是私有的,如果用户试图按值传递或函数返回该类对象,将得到一个编译错误,从而可以避免按值传递或返回对象。如下程序:

 1 #include <iostream>
 2 using namespace std;
 3 
 4 class CExample
 5 {
 6 private:
 7     int value;
 8 
 9 public:
10     //构造函数
11     CExample(int val)
12     {
13         value = val;
14         cout << "creat: " << value << endl;
15     }
16 
17 private:
18     //拷贝构造,只是声明
19     CExample(const CExample& C);
20 
21 public:
22     ~CExample()
23     {
24         cout << "delete: " << value << endl;
25     }
26 
27     void Show()
28     {
29         cout << value << endl;
30     }
31 };
32 
33 //全局函数
34 void g_Fun(CExample C)
35 {
36     cout << "test" << endl;
37 }
38 
39 int main()
40 {
41     CExample test(1);
42     // g_Fun(test); // 按值传递将出错
43 
44     return 0;
45 }

  而根据《C++ Primer》第四版13.1.3节,要禁止类的复制, 类必须显示声明其复制构造函数为private。

  

  2. 小问题1:以下哪个函数是拷贝构造函数,为什么?

1 X::X(const X&);    
2 X::X(X);    
3 X::X(X&, int a=1);    
4 X::X(X&, int a=1, int b=2);

  解答:对于一个类X,如果一个构造函数的第一个参数是下列之一:
  a)X&
  b)const X&
  c) volatile X&
  d)const volatile X&
  且没有其他参数或其他参数都有默认值,那么这个函数是拷贝构造函数.

1 X::X(const X&);  //是拷贝构造函数    
2 X::X(X&, int=1); //是拷贝构造函数   
3 X::X(X&, int a=1, int b=2); //当然也是拷贝构造函数

  

  3. 小问题2:一个类中可以有多个拷贝构造函数吗?

  解答:类中可以存在超过一个拷贝构造函数。 

1 class X { 
2 public:       
3   X(const X&);      // const 的拷贝构造
4   X(X&);            // 非const的拷贝构造
5 };
赋值运算符重载

    关于运算符重载可参考之前博文C++运算符重载。

  在本文的第2个程序中我们就已经对赋值运算符进行了重载:

1 A& operator=(const A& other)
2 {
3     cout << "assignment operator" << endl;
4     value = other.value;
5 
6     return *this;
7 }

  为了便于说明,我们用一个新的例子(我们极容易写出这样的代码):

 1 class CMyString
 2 {
 3 public:
 4     CMyString(char *ptr = nullptr);
 5     CMyString(const CMyString &str);
 6     ~CMyString();
 7     CMyString& operator=(const CMyString& str);
 8 
 9 private:
10     char *pData;
11 };
12 
13 CMyString& CMyString::operator=(const CMyString& str)
14 {
15     pData = str.pData;
16     return *this;
17 }

   这个赋值运算符重载函数存在的问题如下:

  1)浅拷贝;

  2)没有(检查)释放实例自身已有的内存。如果我们忘记在分配新内存之前释放自身已有的空间,程序将出现内存泄漏;

  3)没有判断传入的参数和当前的实例(*this)是不是同一个实例。如果是同一个,则不进行复制操作,直接返回。如果事先不判断就进行赋值,那么在释放实例自身的内存的时候就会导致严重问题:当*this和传入的参数是同一个实例时,那么一旦释放了自身的内存,传入的参数的内存也同时被释放了,因此在也找不到需要赋值的内容了。

  修改之后的赋值运算符重载函数如下:

 1 CMyString& CMyString::operator=(const CMyString& str)
 2 {
 3     if (this == &str)
 4         return *this;
 5 
 6     delete []pData;
 7     pData = nullptr;
 8 
 9     pData = new char[strlen(str.pData) + 1];
10     strcpy(pData, str.pData);
11 
12     return *this;
13 }

  上述代码现在的问题在于4)异常安全性,即new可能会抛出异常,而我们却没有处理!所以我们可以将程序继续修改:

 1 CMyString& CMyString::operator=(const CMyString& str)
 2 {
 3     if (this == &str)
 4         return *this;
 5 
 6     char *tmp = new(nothrow) char[strlen(str.pData) + 1];
 7     if (tmp == nullptr)
 8         return *this;
 9 
10     strcpy(tmp, str.pData);
11 
12     delete []pData;
13     pData = tmp;
14     tmp = nullptr;
15     
16     return *this;
17 }

  除了前边提到的4个点,赋值运算符重载还有两点需要注意:

  5)是否把返回值的类型声明为该类型的引用,并在函数结束前返回实例自身的引用(即*this)。只有返回一个引用,才可以允许连续赋值。否则如果函数的返回值是void,应用该赋值将不能做连续赋值。假设有3个CMyString对象:str1、str2和str3,在程序中语句str1=str2=str3将不能通过编译。

  6)是否把传入的参数的类型声明为常量引用。如果传入的参数不是引用而是实例,那么从形参到实参会调用一次拷贝构造函数。把参数声明为引用可以避免这样的无谓消耗,从而提高代码效率。同时,我们在赋值运算符函数内不会修改传入的实例的状态,因此应该为传入的引用参数加上const关键字。

参考资料

  《剑指Offer》

  C++拷贝构造函数详解

  C++ 类访问控制public/private/protected探讨