python广播机制的前提 pytorch的广播机制

转载

mob6454cc692b0f 2023-08-10 12:59:28

当使用广播机制进行计算时，系统会自动将数据形状扩展并对齐，然后对每个元素进行对应的计算操作。这样，虽然两个数组的形状不同，但依然可以使用相同的代码进行计算，方便快捷。

广播机制在科学计算和深度学习等领域中经常被使用，例如计算两个矩阵的乘积、对图像进行缩放和旋转等。对广播机制的熟练应用可以提高代码效率，简化开发过程。

当对两个形状不同的Tensor按元素运算时，会触发广播（broadcasting）机制：先适当复制元素使这两个Tensor形状相同后再按元素运算。例如：

x = torch.arange(1, 3).view(1, 2)
print(x)
y = torch.arange(1, 4).view(3, 1)
print(y)
print(x + y)

输出：

tensor([[1, 2]])
tensor([[1],
        [2],
        [3]])
tensor([[2, 3],
        [3, 4],
        [4, 5]])

由于x和y分别是1行2列和3行1列的矩阵，如果要计算x + y，那么x中第一行的2个元素被广播（复制）到了第二行和第三行，而y中第一列的3个元素被广播（复制）到了第二列。如此，就可以对2个3行2列的矩阵按元素相加。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客