NVIDIA GPU上的直接线性求解器
NVIDIA cuSOLVER库提供了密集且稀疏的直接线性求解器和本征求解器的集合,它们为计算机视觉,CFD,计算化学和线性优化应用程序提供了显着的加速。cuSOLVER库包含在NVIDIA HPC SDK和CUDA Toolkit中。
cuSOLVER性能
cuSOLVER 11自动利用DMMA Tensor Core。DGX A100比DGX-2快2倍以上,这要归功于A100以及第三代NVLINK和NVSWITCH,GPU数量只有一半。
cuSOLVER的主要功能
- cusolverDN:关键的LAPACK密集型求解器比MKL快3-6倍。
- Dense Cholesky,LU,SVD,QR
- 应用程序包括:优化,计算机视觉,CFD
- cusolverSP
- 稀疏直接求解器
- 对称和广义对称本征求解器
- 应用程序包括:牛顿法,化学动力学Kinetics
- 客体RF
- 稀疏重构求解器
- 应用程序包括:化学,ODE,电路仿真