06 | 线性回归模型:在问题中回顾与了解基础概念

先来个线性回归的简要介绍:

初始化一组数据 (x,y),使其满足这样的线性关系 y=wx+b 。然后基于反向传播法,用均方误差(mean squared error)作为损失函数

LinearRegression输出k值 linear regression公式_迭代

我们用最简单的一元变量去拟合这组数据,其实一元线性回归的表达式 y=wx+b

LinearRegression输出k值 linear regression公式_神经网络_02

该神经网络有一个输入、一个输出(so use the function: nn.Linear(1, 1)、不使用任何激活函数。这就是一元线性回归的神经网络表示结果。相比较于下图这种神经网络的形式化表示,上图是一种简单的特例。

LinearRegression输出k值 linear regression公式_算法_03

About torch.nn.Linear(1,1)

self.prediction = torch.nn.Linear(1, 1)

接下来在看一下Linear包含的属性:

从__init__函数中可以看出Linear中包含四个属性:

  • in_features: 上层神经元个数
  • out_features: 本层神经元个数
  • weight:权重, 形状 [out_features , in_features]
  • bias: 偏置, 形状 [out_features]

nn.Linear(1,1)就是weight[1,1]、bias[1]、input[1]也就是自变量X

这一行代码,实际是维护了两个变量,其描述了这样的一种关系:

LinearRegression输出k值 linear regression公式_线性回归_04

 

  Code explanation:

LinearRegression输出k值 linear regression公式_回归_05

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt


# Hyper-parameters 定义迭代次数, 学习率以及模型形状的超参数
input_size = 1
output_size = 1
num_epochs = 60
learning_rate = 0.001

# Toy dataset  1. 准备数据集
x_train = np.array([[3.3], [4.4], [5.5], [6.71], [6.93], [4.168], 
                    [9.779], [6.182], [7.59], [2.167], [7.042], 
                    [10.791], [5.313], [7.997], [3.1]], dtype=np.float32)

y_train = np.array([[1.7], [2.76], [2.09], [3.19], [1.694], [1.573], 
                    [3.366], [2.596], [2.53], [1.221], [2.827], 
                    [3.465], [1.65], [2.904], [1.3]], dtype=np.float32)

# Linear regression model  2. 定义网络结构 y=w*x+b 其中w的size [1,1], b的size[1,]
model = nn.Linear(input_size, output_size)

# Loss and optimizer 3.定义损失函数, 使用的是最小平方误差函数
criterion = nn.MSELoss()
# 4.定义迭代优化算法, 使用的是随机梯度下降算法
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)  
loss_dict = []
# Train the model 5. 迭代训练
for epoch in range(num_epochs):
    # Convert numpy arrays to torch tensors  5.1 准备tensor的训练数据和标签
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)

    # Forward pass  5.2 前向传播计算网络结构的输出结果
    outputs = model(inputs)
    # 5.3 计算损失函数
    loss = criterion(outputs, targets)
    
    # Backward and optimize 5.4 反向传播更新参数
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    
    # 可选 5.5 打印训练信息和保存loss
    loss_dict.append(loss.item())
    if (epoch+1) % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, loss.item()))

# Plot the graph 画出原y与x的曲线与网络结构拟合后的曲线
predicted = model(torch.from_numpy(x_train)).detach().numpy()
plt.plot(x_train, y_train, 'ro', label='Original data')
plt.plot(x_train, predicted, label='Fitted line')
plt.legend()
plt.show()

# 画loss在迭代过程中的变化情况
plt.plot(loss_dict, label='loss for every epoch')
plt.legend()
plt.show()

 pytorch-tutorial/main.py at master · yunjey/pytorch-tutorial · GitHub