一: 背景

最近在看 C++ 的右值引用和移动构造函数,感觉这东西一时半会还挺难理解的,可能是没踩过这方面的坑,所以没有那么大的深有体会,不管怎么说,这一篇我试着聊一下。

二: 右值引用

1. 它到底解决了什么问题?

在其他编程语言中,很少听到 ​​右值引用​​​ 这个词,我个人感觉还是 ​​C++​​​ 这个 ​​值类型​​​ 优先的语言基因决定的,我们都知道 ​​值类型​​​ 作为方法参数或者返回值时会生成自身的副本,如果 ​​值类型​​ 很大,那一来一回生成若干个深复制的 临时对象 将会产生巨大的性能开销。

总结一句话:​​右值引用​​​ 就是尽可能的减少这中间 ​​临时对象​​ 个数,尤其是关联到 heap 上的对象,仅此而已。

2. 右值引用是个什么样子?

说到 ​​右值引用​​​ 得先说什么是 ​​右值,左值​​​ , ​​左值​​​ 一般都是带有内存地址的变量,而 ​​右值​​ 一般是立即数或者运算过程中的临时对象,这种对象不会有地址值,是不是很绕,我举个例子吧。

int main()
{
int i = 10;
int j = 11;

int sum = i + j;
}
  1. 10,11,(i+j)

属于右值,因为它本身没有内存地址,除非把它们放入到栈中或者堆中。

  1. i,j,sum

属于左值,因为它们是线程栈上地址的标识符。

知道了 ​​左右值​​​ 概念,接下来理解 ​​左右值引用​​​ 就很简单了,既然是 ​​引用​​,必然是多个变量指向同一个地址,对吧,修改下代码如下:

int main()
{
int i = 10;
int& k = i; //左值引用


int&& m = 10; //右值引用
}

接下来看下汇编代码:

33:     int i = 10;
00FB182F mov dword ptr [ebp-0Ch],0Ah
34: int& k = i;
00FB182F mov dword ptr [ebp-0Ch],0Ah
00FB1836 lea eax,[ebp-0Ch]
00FB1839 mov dword ptr [ebp-18h],eax
36: int&& m = 10;
00FB183C mov dword ptr [ebp-30h],0Ah
00FB1843 lea eax,[ebp-30h]
00FB1846 mov dword ptr [ebp-24h],eax

从汇编代码看,它们是一模一样的,也就是说在汇编层面,其实并没有 ​​右值引用​​​ 和 ​​左值引用​​ 一说。

有了这些基础,我们来看下更复杂的 class 结构。

三: 右值引用如何减少对象的创建

1. 简要思路

其实仔细想一想,减少临时对象的创建,无非就是在运算过程中复用一些对象,不需要每次都走赋值构造函数来进行深复制,画个图就像下面这样。

聊聊 C++ 右值引用 和 移动构造函数_深复制

明白了这个思路,接下来我们举一个例子说明。

2. 一个简单的例子

C++ 最烦的地方就是有太多的​​构造函数​​​, 数不胜数,太尴尬了,这里我做一个简单的 ​​+​​ 操作例子。

#include <iostream>
#include <vector>

using namespace std;

class StringBuidler {
public:
char* str;
int length;
public:
StringBuidler() {}
StringBuidler(int len, char c) {
this->str = new char[len];
this->str[0] = c;
this->length = len;
}

StringBuidler(const StringBuidler& s) {

printf("StringBuidler:深复制 \n");
this->length = s.length;
this->str = new char[s.length];

for (size_t i = 0; i < length; i++)
{
this->str[i] = s.str[i];
}
}

StringBuidler operator+(const StringBuidler& p) {

StringBuidler tmp;

tmp.length = this->length + p.length;
tmp.str = new char[tmp.length];

int index = 0;

for (size_t i = 0; i < this->length; i++)
{
tmp.str[index++] = this->str[i];
}
for (size_t i = 0; i < p.length; i++)
{
tmp.str[index++] = p.str[i];
}

return tmp;
}
};

int main()
{
StringBuidler s1(10, 'a');
StringBuidler s2(5, 'b');

StringBuidler s3 = s1 + s2;

printf("s3.length=%d, s1.length=%d, s2.length=%d \n", s3.length, s1.length, s2.length);
}

聊聊 C++ 右值引用 和 移动构造函数_c++_02

从这个例子中可以看到,​​s1+s2​​​ 操作中出现了一次 ​​深copy​​​,具体代码出现在 ​​return​​ 处,汇编代码如下:

聊聊 C++ 右值引用 和 移动构造函数_右值引用_03

因为是深复制,所以会再次生成一个 ​​new char[]​​​ ,如果 ​​new char[]​​​ 很大,那将会是不必要的性能开销,能不能像我画的图一样,将 s3 中的 ​​str​​​ 指针直接指向 tmp 所持有的 heap 上的 ​​char[]​​ 数组来达到复用目的呢? 肯定是可以的。

3. 性能优化方案

这里需要用 ​​右值引用​​​ + ​​移动构造函数​​​ 让 ​​s3.str​​​ 指向 ​​tmp.str​​,从而避免复制构造函数,在 StringBuilder 类中加一个方法如下:

StringBuidler(StringBuidler&& s) {
this->str = s.str;
this->length = s.length;

s.str = nullptr;
}

然后把程序跑起来,截图如下:

聊聊 C++ 右值引用 和 移动构造函数_深复制_04

可以看到,深复制已经没有了,这个过程会在 ​​return​​​ 处被调用,编译器会判断如果是右值的话,自动走 ​​移动构造函数​​​,没有这个函数就会走 ​​赋值构造函数​​。

四: 总结

总之 ​​右值引用​​ 可以让你尽可能的复用一些中间对象,达到一个性能上的提升,其实对 C# 程序员来说,这么简单的引用赋值,C++ 搞出了这么多概念,真的很难理解,可能还是那句话,这是 C++ 的值类型优先的基因决定的。