深度学习卷积核计算器卷积核怎么训练

转载

mob64ca1410eb61 2024-04-07 18:23:42

文章标签 深度学习卷积核计算器 pytorch 深度学习神经网络 2d 文章分类 深度学习人工智能

文章目录

1. 原理

1.1 代码思路

2.代码
3.运行结果
2. 分析
3.思考

1. 原理

我们在思考，深度神经网络到底是在学习什么？程序在经过学习后到底是做什么？其实很简单，当我们得到一个输入 X和输出 Y,我们希望得到一个映射函数，即所谓的卷积核，通过不断的迭代来更新我们权重的值，最终得到一个符合我们输入X 和输出 Y 的卷积核值；我们可以通过这个值来进行后续的预测

1.1 代码思路

深度学习卷积核计算器卷积核怎么训练_神经网络

2.代码

# 1. 定义卷积操作
import torch
from torch import nn
from d2l import torch as d2l

# 1. 定义卷积操作
def conv2dd(X, K):
    H, W = K.shape
    Y = torch.zeros((X.shape[0] - H + 1, X.shape[1] - W + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i:i + H, j:j + W] * K).sum()
    return Y


# 2. 定义卷积类
class Conv2d(nn.Module):
    def __init__(self, kernel_size):
        super().__init__()
        self.weight = nn.Parameter(torch.rand(kernel_size))
        self.bias = nn.Parameter(torch.ones(1))

    def forward(self, x):
        return conv2dd(x, self.weight) + self.bias


# 3. 定义需要学习的卷积核：
# 注：构造⼀个⼆维卷积层，它具有1个输出通道和形状为（1，2）的卷积核
conv2d = nn.Conv2d(1, 1, kernel_size=(1, 2), bias=False)

# 4. 定义初始数据
X = torch.ones((6, 8))
X[:, 2:6] = 0

# 这是我们需要学习到的卷积核，
# 目标：最终通过梯度下降的情况下看是否跟这个卷积核一样
K = torch.tensor([[1.0, -1.0]])

# 5. 定义目标数据
Y = conv2dd(X, K)


# 6. 将初始数据与目标数据进行整理

X = X.reshape((1, 1, 6, 8))
Y = Y.reshape((1, 1, 6, 7))

# 7.十次迭代，训练得到需要的卷积核
for i in range(30):
    Y_hat = conv2d(X)  # 对初始化数据X 进行卷积操作，卷积核kernel_size=(1,2)
    l = (Y_hat - Y) ** 2 # 计算损失值
    conv2d.zero_grad()  # 对卷积核进行梯度清零
    l.sum().backward()  # 损失值反向传播
    conv2d.weight.data[:] -= 3e-2 * conv2d.weight.grad # 对卷积核值进行更新学习
    if (i + 1) % 2 == 0:
        print(f'batch{i + 1},loss={l.sum():.3f}')

print(f'weight={conv2d.weight.data.reshape(1, 2)}')

3.运行结果

batch2,loss=1.970
batch4,loss=0.335
batch6,loss=0.058
batch8,loss=0.011
batch10,loss=0.002
batch12,loss=0.000
batch14,loss=0.000
batch16,loss=0.000
batch18,loss=0.000
batch20,loss=0.000
batch22,loss=0.000
batch24,loss=0.000
batch26,loss=0.000
batch28,loss=0.000
batch30,loss=0.000
weight=tensor([[ 1.0000, -1.0000]])

2. 分析

通过上述例子，我们手写了一个纯机器学习模型。我们可以清楚地发现。在只有输入和输出情况下，神经网络是如何学习到卷积核的参数的，我们发现最后所得的权重 weight矩阵与我们起初的矩阵值差不多了，是不是很神奇，居然学出来了。。。

# 最初我们定义的矩阵
K = torch.tensor([[1.0, -1.0]])
# 我们通过神经网络学习到的矩阵
weight=tensor([[ 1.0000, -1.0000]])
# 以上两个矩阵 K ≈ weight

3.思考

由上述问题来说，我们发现神经网络就像一个函数模拟器一样，通过输入和输出的结果，我们通过学习，就可以得到一个比较好的函数模拟器，通过这个函数模拟器来处理这类问题(输入和输出类别一样的数据集)

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：spring list 对象配置 spring mvc list参数

下一篇：android gradle下载依赖task gradle项目依赖无法下载

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

深度学习卷积核计算器 卷积核怎么训练

深度学习卷积核计算器 卷积核怎么训练

文章目录

1. 原理

1.1 代码思路

2.代码

3.运行结果

2. 分析

3.思考

51CTO博客

深度学习卷积核计算器卷积核怎么训练

深度学习卷积核计算器卷积核怎么训练