NCCL使用/调用步骤源码解读(单设备单进程为例):步骤总结:通过MPI获取本机rank(可理解为进程)数量localrank,用于rank绑定GPU;rank0获取NCCL通信组ID,并通过MPI_Bcast广播给其它rank;借助MPI获取的这些信息NCCL完成初始化,并进行集合通信。核心步骤:1、初试化和启动MPI通信。2、计算主机名的哈希值,并MPI_allgather通信使得每个rank
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号