带着10万字的草稿,C++优化系列来了!_优化

# 干了这碗鸡汤

人生犹如一本书,愚蠢者草草翻过,聪明人细细阅读。为何如此。因为他们只能读它一次。

 

——保罗

 

我们平时编写工程程序时,除了功能可用性外,性能也是最主要的考虑因素。编写功能可用的代码很容易,往往难到我们的不是实现某个功能,困难的永远是保证功能可用的同时又能满足对性能的要求。

 

一般公司对程序的体积以及运行速度都有严格的要求,有时候因为几字节的代码段体积或者多了几十毫秒的运行时间,整个项目就达不到验收标准,导致不能成功上线。说了这么多只是为了突出性能优化的重要性。如何做好优化才能体现一个C++程序员的真正水平。

 

关于性能优化,有三个概念我们需要了解:

 

1. 性能指标要靠测量,不能靠猜:

 

我做过一段时间的SDK开发工作,每当我们发版SDK时候,都要附带着SDK使用文档以及性能测试报告,性能测试报告里面有很详细的指标测试数据,这个数据当然不能是自己猜测出来的,一定要进行测试。

2. 帕累托法则

 

帕累托法则,也称二八原则,80%的执行时间花在大约20%代码身上,80%的内存被大约20%的代码使用,80%的维护成本花在20%的代码上面。我们做程序优化也是如此,多数情况下也许我们只需要找到那20%代码,对其进行深度优化,基本上就可以满足性能要求。

3. 阿姆达尔定律

SPRING

阿姆达尔定律:有一个公式,公式中:St表示优化后整体性能提升的比例,P表示被优化部分运行时间占总运行时间的比例,Sp表示被优化部分性能提升的比例。

带着10万字的草稿,C++优化系列来了!_优化_02

 

举个例子:

1. 程序运行时间100s,其中有90s调用函数func,func优化后性能提升30%,即P=90/100=0.9,Sp=1+30%=1.3,则程序整体效率为St=1/((1-0.9)+0.9/1.3)=1.26214,程序整体性能提升了26%。

 

2. 程序运行时间100s,其中有10s调用函数func,func优化后性能提升80%,即P=10/100=0.1,Sp=1+80%=1.8,则程序整体效率为St=1/((1-0.1)+0.1/1.8)=1.04651,程序整体性能提升了4%。

 

该定律其实也间接验证了帕累托法则的正确性,去优化那些至关重要的部分吧。

 

聊完了性能优化的原则,再来说下我的优化系列规划吧,目前打算优化大体分为以下几个专题:

 

1. 测量分析专题:例如使用什么函数来测量函数耗时,使用什么代码分析工具来动态和静态的分析代码。例如:

带着10万字的草稿,C++优化系列来了!_优化_03

点击查看高清图片

 

2. 编码规范专题:分析C++各种操作的效率,包括不同类型变量的存储效率,使用智能指针、循环、函数参数、虚函数、数组等的效率,以及如何更好的利用他们进行代码优化。例如各个操作占用的时钟周期:

 

带着10万字的草稿,C++优化系列来了!_优化_04

点击查看高清图片

 

3. 编译优化专题:各种编译器性能分析,理解常见的编译优化选项,分析编译器是如何对代码进行优化的,都做了什么优化,以及编译器优化的障碍(它不能做什么),如何充分利用好编译器的优化选项。例如优化编译器优化级别介绍:

 

  • O0(默认选项):不开启优化,方便功能调试

  • Og:方便调试的优化选项(比O1更保守)

  • O1:保守的优化选项,打开了四十多个优化选项

  • Os:产生较小代码体积的优化选项(比O2更保守)

  • O2:常用的发布优化选项,在O1的基础上额外打开了四十多个优化选项,包括自动内联等规则

  • O3:较为激进的优化选项(对错误编码容忍度最低),在O2的基础上额外打开了十多个优化选项

  • Ofast:打开可导致不符合IEEE浮点数等标准的性能优化选项。

 

如图:

带着10万字的草稿,C++优化系列来了!_优化_05

 

4. 内存优化专题:内存使用情况往往是影响程序性能的关键因素,该专题会介绍如何有效利用缓存,如何操作缓存,优化内存访问速度,如何使用更少的内存,如何防止内存抖动,内存对齐等等。

 

5. 多线程优化专题:如何充分利用CPU,如何做好线程同步,如何使用锁,使用什么锁,理解和调试上下文切换,如何使关键线程运行效率更高等等。

 

6. 乱序执行专题:理解CPU的乱序执行策略,如何利用此特性写出高效代码。

 

7. 矢量运算专题:理解CPU的矢量运算以及各种指令集、寄存器以及内置函数,提高数据计算的效率。

 

8. 特殊的优化编码技巧:这里会介绍很多高效的编码技巧,如何降低分支预测率,如何优化低效的除法操作,如何更好的进行数据边界检查,介绍一些高效的数学函数库等等。

 

9.模板元编程的编码技巧:如何利用模板编程来优化程序运行效率。

 

10.大杂烩:其它一些实用小技巧。

 

介绍到这里,向大家推荐个好用的网站链接,第一个是:https://godbolt.org/

 

带着10万字的草稿,C++优化系列来了!_优化_06

 

如图,输入C++代码,在右半部分会显示编译器编译后的汇编代码,通过查看高级语言背后的汇编指令我们可以更好的分析代码的性能。网站更强大的功能是它支持市面上几乎所有的编译器,而且各个版本都有。

 

如果我们看汇编代码比较吃力,那可以上这个网站:

https://cppinsights.io/

 

带着10万字的草稿,C++优化系列来了!_优化_07

 

如图,该网站右半部分会展示编译器眼中的代码,对于我们分析程序也有很大帮助。

 

带着10万字的草稿,C++优化系列来了!_优化_08