最近公司在实施高性能计算平台的项目,根据项目的要求查询了一些资料,整理如下:

1、什么是高性能计算平台?

又称高性能计算集群,简称HPC(High Performance Computing),是一套计算性能强大,数据传输率超高,具有大规模存储空间和完整软件的系统,通常包含计算处理单元、并行存储单元、网络单元、管理调度软件单元,主要采用集群架构,通过网络将大量的服务器连接起来,让所有服务器协调工作来完成一系列计算任务。 

2、高性能计算平台的主要作用?

主要应对的问题是缩短超大规模复杂计算任务的时间和扩大求解规模;

应用方向包括:

(1)计算密集型应用:大型科学工程计算,数值模拟等;应用领域包括石油、气象、CAD/CAE、生命科学、核能、制药、环境监测分析

(2)数据密集型应用:数字图书馆,数据仓库,数据挖掘,计算可视化等;应用领域包括图书馆、银行、证券、税务、决策支持系统等

(3)通信密集型应用:协同工作、网络计算、遥控和远程诊断等;应用领域包括网站、信息中心、搜索引擎、电信、流媒体等

典型的案例:

石油勘探行业已经由原来基于地质学方法的钻井探索方式改变为更先进的地震波法,所谓地震波法就是在地面用炸药激起人工地震波,碰到不同岩层会形成不同的反射波,反射波经接收器收集转变为电子信号数据,经过数据分析模拟还原地下地质构造。

地震波法的基本原理:波在介质中持续传播,介质对高频信号吸收,地震波信号逐渐减弱;当波入射到两种介质的分界面时,一部分波回到第一种介质中,这就是所谓的反射波,两种介质之间的波阻抗差别越大,反射波越强。 

3、高性能计算平台性能衡量主要指标是什么?

每秒钟双精度浮点计算次数,XX万亿次/s,XX Tflops的写法意思就是XX万亿次/s

 4、高性能计算平台的基本组成架构是什么?

(1)计算节点:一个高性能、高读写率、高传输率、高可靠性、高稳定性的计算单元,通常为节约空间常选择刀片服务器,整个计算节点采用Cluster集群架构,通过高速InfiniBand计算网络连接服务器计算资源,通过千兆以太网协同调度、管理整个系统。

(2)网络系统:一般分为计算网络和管理网络,计算网络采用InfiniBand网络,高带宽、低延迟,可达到100G/s以上的传输率;管理网络采用万兆或千兆以太网络,用户通过资源调度管理软件管理整个高性能计算平台,用户通过网络远程访问高性能计算平台,获取高性能计算平台的计算资源进行求解运算。

(3)数据并行存储系统:主要是用来提供高带宽的存储容量,缓解计算任务对临时文件的高速存储和读取需求。

(4)集群调度管理系统:通常采用B/S架构,通过浏览器进行操作。可以管理集群系统中的软硬件资源和用户提交的作业,根据集群中的资源使用情况来合理的调度用户提交的作业,从而达到提高资源利用率和作业执行效率的目的。 

5、GPU在高性能计算中的优势?

GPU设计初充为高性能三维图形应用,具有强大的计算能力和很高的存储带宽,而这两点对于高性能三维图形应用是至关重要的。GPU通常具有128位或256位的内存位宽,直接表明在一个时钟周期内,传输的数据要远大于CPU,CPU的内存位宽目前通常为32位和64位。此外GPU包含大量的流处理器(核),在并行计算能力上更远大于CPU。