numpy在gpu numpy在gpu运行

关注温柔一刀

numpy在gpu numpy在gpu运行

转载

温柔一刀 2024-03-16 15:35:17

文章标签 numpy在gpu python 深度学习 numpy 广播 文章分类 游戏开发

通常，深度学习模型都是运行在GPU(图像处理器单元），因为它有SIMD并行化指令，所以能够快速处理图片。SIMD全称Single Instruction Multiple Data，单指令多数据流，能够复制多个操作数，并把它们打包在大型寄存器的一组指令集。其实CPU也可以使用SIMD指令，只不过GPU更擅长使用SIMD并行指令，GPU拥有更好地性能。Python的numpy库中矩阵运算会运用SIMD并行指令，从而获得更高的运算速度。所以深度学习会尽可能避免使用循环，尽量地多使用numpy库。下面举一个例子，看看他们之间的性能差距：

numpy在gpu numpy在gpu运行_深度学习

例子中可以看出，矩阵运算的效率会比循环运算高出将近600倍。

在使用numpy库时，通常有两点值得注意：

（1）使用矩阵而不要使用数组，如果该使用矩阵的时候使用了数组，会报一些莫名其妙的错误，下面举一个例子，以便于理解：

numpy在gpu numpy在gpu运行_python_02

创建数组的时候，通常使用np.random.randn(5,1)形式，而不要使用np.random.randn(5)，因为后者创建的是数组而不是矩阵。

（2）理解numpy的广播原则

首先举一个例子，计算每种食物各种成分的百分比：

numpy在gpu numpy在gpu运行_python_03

下面是该题的源代码：

numpy在gpu numpy在gpu运行_深度学习_04

上面代码中，In [5]处的cal.reshape(1,4)显得有些多余，因为cal已经是一个1行4列的矩阵，但是这样做能够有效避免（1）所提到的错误。

计算percentage = 100*A/cal.reshape(1,4)时，cal矩阵首先进行了广播，广播后的形式为：

[ 59. 239. 155.4 76.9

59. 239. 155.4 76.9

59. 239. 155.4 76.9

59. 239. 155.4 76.9]

那么numpy的广播原则是怎样的呢，先看看下面这图：

numpy在gpu numpy在gpu运行_广播_05

图中，前两行的意思是：当一个m行n列矩阵与一个（1，n)或（m,1)矩阵运算时，(1,n)会复制m行广播为（m,n)矩阵，（m,1)会复制n列广播为(m,n)矩阵。

图中，后三行的意思是：当一个行矩阵或列矩阵与一个实数运算时，实数会广播成为与矩阵维数相同的同元素矩阵。

参考资料：

网易云课堂《神经网络和深度学习》第二周，吴恩达

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：springcloud服务间调用 springcloud 服务调用

下一篇：db2 特别卡 db2 catalog db

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册