属于arm架构的CPU品牌有哪些 arm架构性能排行

转载

数据探索先锋 2024-06-30 09:09:31

作为技术人员最近总是到处沾花惹草，缺乏技术上的专注，很是不对的。

最近一直在忙于鲲鹏930的锁的性能调优，那就顺带分享一下关于锁的一些姿势吧。

锁这个东西在软件上应用是非常广泛的，涉及到资源共享时，很多时候都依赖于调用硬件提供的锁指令来锁定资源的占用，所以锁的性能是系统scale时的一个重要影响维度。

我下面截图的一些东西都是我写的，主要是不想再写一遍所以截图了，但内容本身都是general的姿势以及本来就希望推广的生态本身，并不涉及什么公司或芯片的秘密。

属于arm架构的CPU品牌有哪些 arm架构性能排行_性能调优

没有人比我更懂锁的硬件实现了。

属于arm架构的CPU品牌有哪些 arm架构性能排行_属于arm架构的CPU品牌有哪些_02

属于arm架构的CPU品牌有哪些 arm架构性能排行_属于arm架构的CPU品牌有哪些_03

锁的行为在于读改写的原子性，而是否对读数据进行条件判断则再引入了一个变化量。

然后，作为ARM处理器架构师，遇到的最大困难就是ARM架构又引入一层变量。

属于arm架构的CPU品牌有哪些 arm架构性能排行_数据读取_04

exclusive操作是ARM架构的一个经典杰作，它的投机机制在ARM的主战场，包括IOT、mobile等小型系统里面，有非常杰出的表现。

但可惜，ARM要做server，做更大的系统，此时exclusive每次都要把数据读取到L1 cache导致的数据频繁搬运就成为了性能的累赘。

属于arm架构的CPU品牌有哪些 arm架构性能排行_性能调优_05

atomic我记得是在ARMv8.2定义的，软件能够快速地用起来嘛，答案是不能。

属于arm架构的CPU品牌有哪些 arm架构性能排行_数据读取_06

再其次，即使在某些地方能，也让我这种直肠子的硬件人员非常蛋疼。

属于arm架构的CPU品牌有哪些 arm架构性能排行_性能调优_07

CAS（atomic compare）本身就的语意就包含了写-判-改-读，四重意义了，只是顺序上和原子语意不一致，为啥程序员还要读一次？明明atomic已经让计算发生在冲突的memory层次上了，为啥要再读到L1 cache ?

属于arm架构的CPU品牌有哪些 arm架构性能排行_数据读取_08

看到楼上这样的atomic抢锁代码的时候，真的，我是崩溃的。

只能自我安慰一下，美女程序员写的代码都是对的✧ (ˊωˋ*) ✧

属于arm架构的CPU品牌有哪些 arm架构性能排行_arm的代码量大_09

综上。ARM多核处理器锁的性能需要软件的生态同步调优才能优化好（还有很多硬件优化的策略就不能讲了）。

1、软件的同学需要同步解决内核、libc、用户态调用等三个维度的问题，让exclusive操作都切换到atomic。

2、规范atomic抢锁代码写法，甚至用脚本对二进制作检查替换，保证抢锁用CAS（atomic compare）指令不额外加读，释放锁用atomic store或者直接用write而不用CAS。

3、抢锁失败时用delay_n暂缓下一次的抢锁避免抢锁风暴，类似x86的pause指令。

4、用timeout WFE替代spin N-time动作，WFE结束时转mutex。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客