Pytorch中的gemm操作 pytorch operator

转载

mob64ca140b466e 2023-12-20 17:45:28

文章标签 Pytorch中的gemm操作机器学习 pytorch 神经网络全连接 文章分类 PyTorch 人工智能

新手初学，在此记录，希望能对大家有所帮助

一、安装pytorch(安装前先安装anaconda，或是在其他虚拟环境下比如virtualenv)

下载网址https://ptorch.com/news/30.html

在此网址内选择自己系统以及版本进行下载，避免了官网点不动、commend无法生成的问题。

安装过程中遇到问题：oserror 13 permission deny

解决方法：1.sudo 参考

2.鉴于1的方法因为我使用hpc服务器不在sudo用户组所以不可用，我的解决方法是（多谢师姐）pip install --user 后正常

二、初步学习使用pytorch

找到一个比较好的简书作者，但是该作者只写了五篇，链接已分别对应着一一附上。

1.参考网址：http://www.jianshu.com/p/5ae644748f21这篇简书内容较为简单，适合0基础初学。

其中有介绍【Tensor的加法(四种)】方法四：>>>b.add_(a) #把运算结果覆盖掉b 方法五： >>>b.add(a) #把结果输出但并不覆盖b

其中有介绍【tensor（张量）除加法以外的其他操作】（比如转置、切片等）：参考网址http://pytorch.org/docs/master/torch.html（英文版）

其中有介绍【张量tensor可与多维数组array互换】公用一块内存，只是不同表达方式。对于ones()函数，torch.ones()与numpy.ones()生成的结果不同，向量&数组。

其中有介绍【CUDA的神助攻】

2.autograd自动微分 http://www.jianshu.com/p/cbce2dd60120

其中有介绍【Variable：是Tensor的一个wrapper，不仅保存了值，而且保存了这个值的creator，需要BP的网络都是Variable参与运算

其中有介绍【norm()函数求平方根

其中有介绍【>>>y.backward() #backward()函数表示backprop

>>>x.grad #返回y关于x的梯度向量

其中有介绍【autograd是专门为了BP算法设计的，所以这autograd只对输出值为标量的有用。

其中有介绍【我们之所以可以实现autograd多亏了Variable和Function这两种数据类型的功劳。要进行autograd必需先将tensor数据包成Variable。

2.99.在三讲开始之前需要掌握深度卷积神经网络知识

其中对偏置参数解释：

3.构造一个小型CNN http://www.jianshu.com/p/cde4a33fa129

3.0 讲解正式代码前我们需要先了解torch.nn包所具有的基本类型，这个包是用来构建神经网络的。

学习网址：

构建一个神经网络需要以下几步：

定义神经网络的

权重

,搭建网络结构
遍历整个数据集进行训练

将数据输入神经网络
计算loss
计算网络权重的梯度
更新网络权重

weight = weight + learning_rate * gradient

3.1 这个小型cnn 完成了lenet。其完整代码及注释：https://pan.baidu.com/s/1slnkpxN（来源简书）

（神经网络中的激活函数l：参考网站：神经网络回顾-Relu激活函数 - 1357 - 博客园）

#coding=utf-8

import torch

import torch.nn as nn

import torch.nn.functional as F

from torch.autograd import Variable

class Net(nn.Module): #需要继承这个类

#定义Net的初始化函数，这个函数定义了该神经网络的基本结构

def __init__( self ):

super (Net, self ).__init__() #复制并使用Net的父类的初始化方法，即先运行nn.Module的初始化函数

self .conv1 = nn.Conv2d( 1 , 6 , 5 ) # 定义conv1函数的是图像卷积函数：输入为图像（1个频道，即灰度图）,输出为 6张特征图, 卷积核为5x5正方形

self .conv2 = nn.Conv2d( 6 , 16 , 5 ) # 定义conv2函数的是图像卷积函数：输入为6张特征图,输出为16张特征图, 卷积核为5x5正方形

#以上是两个卷积层，都不包含激活函数的。#以下是三个全连接层。

self .fc1 = nn.Linear( 16 * 5 * 5 , 120 ) # 定义fc1（fullconnect）全连接函数1为线性函数：y = Wx + b，并将16*5*5个节点连接到120个节点上。

self .fc2 = nn.Linear( 120 , 84 ) #定义fc2（fullconnect）全连接函数2为线性函数：y = Wx + b，并将120个节点连接到84个节点上。

self .fc3 = nn.Linear( 84 , 10 ) #定义fc3（fullconnect）全连接函数3为线性函数：y = Wx + b，并将84个节点连接到10个节点上。

#定义该神经网络的向前传播函数。该函数必须定义，一旦定义成功，向后传播函数也会自动生成（autograd）

def forward( self , x): #输入x

x = F.max_pool2d(F.relu( self .conv1(x)), ( 2 , 2 )) #输入x经过卷积conv1之后（x->c1），经过激活函数ReLU，使用2x2的窗口进行最大池化Max pooling(c1->s2)，然后更新到x。

x = F.max_pool2d(F.relu( self .conv2(x)), 2 ) #输入x经过卷积conv2之后(s2->c3)，经过激活函数ReLU，使用2x2的窗口进行最大池化Max pooling，然后更新到x。

x = x.view( - 1 , self .num_flat_features(x)) #view函数将张量x变形成一维的向量形式（c3->s4），总特征数并不改变，为接下来的全连接作准备。

x = F.relu( self .fc1(x)) #输入x经过全连接1，再经过ReLU激活函数，然后更新x (s4->c5)

x = F.relu( self .fc2(x)) #输入x经过全连接2，再经过ReLU激活函数，然后更新x (c5->f6)

x = self .fc3(x) #输入x经过全连接3，然后更新x (f6->output)

return x

#使用num_flat_features函数计算张量x的总特征量（把每个数字都看出是一个特征，即特征总量），比如x是4*2*2的张量，那么它的特征总量就是16。

def num_flat_features( self , x):

size = x.size()[ 1 :] # 这里为什么要使用[1:],是因为pytorch只接受批输入，也就是说一次性输入好几张图片，那么输入数据张量的维度自然上升到了4维。【1:】让我们把注意力放在后3维上面

num_features = 1

for s in size:

num_features * = s

return num_features

net = Net() #对net类实例化一个对象net

net

# 以下代码是为了看一下我们需要训练的参数的数量

print net #输出该类的五个变量c1\c3\c5\f6\output 以及定义他的函数及参数

params = list (net.parameters()) c1 S2\c3 S4\c5 s4->c5（即fc1）\c5->f6 f6（即fc2）\f6->output output （即fc3）

k = 0

for i in params: #eg:x->c1 c1

l = 1

print "该层的结构：" + str ( list (i.size())) #c1有6个卷积层 x有1个卷积层 c1在x上的卷积核大小为5*5

for j in i.size():

l * = j

print "参数和：" + str (l) #参数和6*1*5*5

k = k + l #用来累加总参数和

print "总参数和：" + str (k)

4.该作者在此整理了可下载图片训练数据集的网址：http://www.jianshu.com/p/8da9b24b2fb6

5.此作者的最后一篇：训练和测试cnn ：http://www.jianshu.com/p/e4c7b3eb8f3d

6.关于softmax分类器的讲解

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：iOS 二进制数据转换成json ios二进制打包

下一篇：android flipview 闪屏 android 闪烁动画

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

Pytorch中的gemm操作 pytorch operator

Pytorch中的gemm操作 pytorch operator

51CTO博客