NVIDIA GPU上的直接线性求解器

NVIDIA cuSOLVER库提供了密集且稀疏的直接线性求解器和本征求解器的集合,它们为计算机视觉,CFD,计算化学和线性优化应用程序提供了显着的加速。cuSOLVER库包含在NVIDIA HPC SDKCUDA Toolkit中

cuSOLVER性能

cuSOLVER 11自动利用DMMA Tensor Core。DGX A100比DGX-2快2倍以上,这要归功于A100以及第三代NVLINK和NVSWITCH,GPU数量只有一半。

cuSOLVER的主要功能

  • cusolverDN:关键的LAPACK密集型求解器比MKL快3-6倍。
    • Dense Cholesky,LU,SVD,QR
    • 应用程序包括:优化,计算机视觉,CFD
  • cusolverSP
    • 稀疏直接求解器
    • 对称和广义对称本征求解器
    • 应用程序包括:牛顿法,化学动力学Kinetics
  • 客体RF
    • 稀疏重构求解器
    • 应用程序包括:化学,ODE,电路仿真

NVIDIA GPU上的直接线性求解器_牛顿法

 

 

 

 

人工智能芯片与自动驾驶