计算机科学与技术系研究生课程
高等计算机系统结构
清华大学计算机科学与技术系高性能计算研究所
郑纬民教授
2007年9月
高等计算机系统结构
第一章高等计算机的核心技术——并行处理
第二章加速比性能模型与可扩展性分析
第三章互连与通信
第四章划分与调度
第五章并行存储器系统
第六章 Cache Coherence
第七章 Memory Consistency
第八章指令级并行处理
第九章微处理器设计与实现方法
第十章网格计算
高等计算机系统结构
第十
DSM
第十二章传感器网络
第十三章对等计算
第十四章海量网络存储器
第十五章多核CPU技术
第十六章可信计算系统
第十七章虚拟化技术
第十八章基于集群的海量数据处理
第二章加速比性能模型与可扩展性分析
2.1加速比性能分析
2.1.1一般概念
2.1.2加速比
1.3三种加速比性能模型
22可扩展性分析
2.1加速比性能模型
2.1.1一般概念
1处理机一时间积
处理机数目与处理时间的乘积用以度量
这些处理机运行时的资源利用率
若一程序在
Tp,则此P台处理机在Tp时间间隔内完成的工
作最大数量为Ip*P。
可将处理机实际工作曲线对时间的积分
看成是这些处理机完成的有效工作量。
效率为有效工作量与最大工作量之比。
2.并行度( Degree Of Parallelism--DOP)
并行度(DOP)是在一定时间间隔内执行
个程序所用的处理机的数目。
3.并行性分布图
执行一个给定的程序时DOP对时间的分布
图
DOP与对应时间的间隔之积即为处理机要
完成的工作或工作负载
下图所示为一个并行性分布图。
DOP
tI
并行性分布图
2.1.2加速比
1.绝对加速比
将最好的串行算法与并行算法相比较.
定义一(与具体机器有关)将最好的串行算
法在一台上的运行时间与并行算法在N台运行
的时间相比
定义二(与具体机器无关)将最好的串行算
法在最快的顺序机上的执行时间与并行算法
在并行机上的运行时间相比。
2相对加速比
同一并行算法在单节点上运行时间
与在多个相同节点构成的处理机系统上的
运行时间之比。
这种定义侧重于描述算法和并行计
算机本身的可扩展性。
线性加速比:中间开销小,通信少,弱耦合计算
超线性加速比:当应用需要大内存时可能出现
病态加速比:加速比递减,可能是计算量太小
2.1.3三种加速比性能模型
1.固定负载加速比性能模型— Adah定律
在许多实时应用领域,计算负载的大小常固
定。在并行机中,此负载可分布至多台并行执行,
获得的加速比称为fxed- oad speedup。一个问题的
负载可表示如下
W=WS+ Wp
其中,Ws代表问题中不可并行化的串行部分负载,
Wp表示可并行化的部分负载。
则n个节点情况下,加速比可以表示如下
Ws+wp
Ws+wp/n