高性能计算概述

高性能计算机体系结构

  • 并行向量处理机(PVP)

高性能计算存储架构 高性能计算 架构_并行处理

  • 又称数组处理器,是一种实现了直接操作一维数组(向量)指令集的中央处理器(CPU)
  • 对称共享存储多处理机(SMP)

高性能计算存储架构 高性能计算 架构_结点_02

  • 大规模并行处理机(Massively Parallel Processor)是由多个由微处理器,局部存储器及网络接口电路构成的节点组成的并行计算体系;节点间以定制的高速网络互联。大规模并行处理机是一种异步的多指令流多数据流,因为它的程序有多个进程,它们分布在各个微处理器上,每个进程有自己独立的地址空间,进程之间以消息传递进行相互通信。
  • 分布共享存储多处理机(DSM)
  • 分布式共享存储处理机属于计算机科学的一种机制,可以透过硬件或软件来实作。分散式共享内存主要使用在丛集电脑中,丛集电脑中的每一个网络结点(node)都有非共享的内存空间与共享的内存空间。
    该共享内存的位置空间(address space)在所有结点是一致的。简单说,同一时间下在结点A读取0x00001234会和结点B读取0x00001234得到一样的值。
  • 集群(Cluster)

高性能计算存储架构 高性能计算 架构_高性能计算存储架构_03

  • 集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术
    集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。

并行体系结构发展史

高性能计算存储架构 高性能计算 架构_并行处理_04

20年来,提高计算性能的“三驾马车”:提高主频、优化体系结构、提高并行度

主频受功耗的限制难以提升

指令集并行的潜力已经挖尽,现在基于CISC的x86架构由于结构复杂发展受阻,更多研究聚焦于RISC技术。

并行计算面临的重大问题

  • 存储墙问题

高性能计算存储架构 高性能计算 架构_并行处理_05

CPU的执行速度远高于访存速度,如果计算中出现大量的内存访问就会降低速度

  • 能耗问题
    大型的高性能计算机如果要实现E级系统,需要专门的电站进行供电,并且高能耗还意味着需要制冷系统。
  • 可靠性问题
    系统规模增大导致系统固有的可靠性降低,千万亿次系统的平均无故障时间只有8小时左右,并且计算性能提升,故障发生时间显然提前。
  • 大规模并行程序设计问题
    1.现在的intel和一些其他公司已经开始对CPU进行异构设计,比如大小核设计,这样的技术势必会增加并行程序开发的复杂度。2.负载不平衡造成的扩展瓶颈。3.容错占用了大量的时间。