二元逻辑回归报错R

转载

mob64ca14147fe3 2024-11-18 14:17:12

文章标签 二元逻辑回归报错R 机器学习逻辑回归分类感知器 文章分类 机器学习人工智能

文章目录

感知器的种类
sigmoid（logistics）函数
代价/损失函数（cost function）——对数损失函数（log loss function）
梯度下降算法（gradient descent algorithm）
正则化逻辑回归（regularization logistics regression）
代码实现
运行结果

感知器的种类

离散感知器：输出的预测值仅为 0 或 1
连续感知器（逻辑分类器）：输出的预测值可以是 0 到 1 的任何数字，标签为 0 的点输出接近于 0 的数，标签为 1 的点输出接近于 1 的数
逻辑回归算法（logistics regression algorithm）：用于训练逻辑分类器的算法

sigmoid（logistics）函数

sigmoid 函数：

$二元逻辑回归报错R_二元逻辑回归报错R$

决策边界（decision boundary）：

$二元逻辑回归报错R_分类_02$

sigmoid 函数与线性决策边界函数的结合：

$二元逻辑回归报错R_分类_03$

决策原理（ $二元逻辑回归报错R_分类_04$

$二元逻辑回归报错R_分类_05$

代价/损失函数（cost function）——对数损失函数（log loss function）

一个训练样本： $二元逻辑回归报错R_机器学习_06$ 和 $二元逻辑回归报错R_感知器_07$
训练样本总数 = $二元逻辑回归报错R_逻辑回归_08$
对数损失函数（log loss function）：

$二元逻辑回归报错R_机器学习_09$

代价函数（cost function）：

$二元逻辑回归报错R_机器学习_10$

梯度下降算法（gradient descent algorithm）

$二元逻辑回归报错R_机器学习_11$ ：学习率（learning rate），用于控制梯度下降时的步长，以抵达损失函数的最小值处。
逻辑回归的梯度下降算法：
$二元逻辑回归报错R_感知器_12$

正则化逻辑回归（regularization logistics regression）

正则化的作用：解决过拟合（overfitting）问题（也可通过增加训练样本数据解决）。
损失/代价函数（仅需正则化 $二元逻辑回归报错R_感知器_13$ ，无需正则化 $二元逻辑回归报错R_逻辑回归_14$ ）：

$二元逻辑回归报错R_分类_15$

其中，第二项为正则化项（regularization term），使 $二元逻辑回归报错R_感知器_16$ 变小。初始设置的 $二元逻辑回归报错R_感知器_17$ 越大，最终得到的 $二元逻辑回归报错R_感知器_16$

梯度下降算法：

$二元逻辑回归报错R_机器学习_19$

代码实现

import numpy as np
import matplotlib.pyplot as plt

# sigmoid 函数 f = 1/(1+e^(-x))
def sigmoid(x):
    return np.exp(x) / (1 + np.exp(x))

# 计算分数 z = w*x+b
def score(x, w, b):
    return np.dot(w, x) + b

# 预测值 f_pred = sigmoid(z)
def prediction(x, w, b):
    return sigmoid(score(x, w, b))

# 对数损失函数 f = -y*ln(a)-(1-y)*ln(1-a)
# 训练样本: (vec{X[i]}, y[i])
def log_loss(X_i, y_i, w, b):
    pred = prediction(X_i, w, b)
    return - y_i * np.log(pred) - (1-y_i) * np.log(1-pred)

# 计算损失函数 J(w, b)
# 训练样本: (vec{X[i]}, y[i])
def cost_function(X, y, w, b):
    cost_sum = 0
    m = X.shape[0]
    for i in range(m):
        cost_sum += log_loss(X[i], y[i], w, b)
    return cost_sum / m

# 计算梯度值 dJ/dw, dJ/db
def compute_gradient(X, y, w, b):
    m = X.shape[0]  # 训练集的数据样本数（矩阵行数）
    n = X.shape[1]  # 每个数据样本的维度（矩阵列数，即特征个数）
    dj_dw = np.zeros((n,))
    dj_db = 0.0
    for i in range(m):  # 每个数据样本
        pred = prediction(X[i], w, b)
        for j in range(n):  # 每个数据样本的维度
            dj_dw[j] += (pred - y[i]) * X[i, j]
        dj_db += (pred - y[i])
    dj_dw = dj_dw / m
    dj_db = dj_db / m
    return dj_dw, dj_db

# 梯度下降算法，以得到决策边界（decision boundary）方程
def logistic_function(X, y, w, b, learning_rate=0.01, epochs=1000):
    J_history = []
    for epoch in range(epochs):
        dj_dw, dj_db = compute_gradient(X, y, w, b)
        # w 和 b 需同步更新
        w = w - learning_rate * dj_dw
        b = b - learning_rate * dj_db
        J_history.append(cost_function(X, y, w, b))  # 记录每次迭代产生的误差值
    return w, b, J_history

# 绘制线性方程的图像
def draw_line(w, b, xmin, xmax, title):
    x = np.linspace(xmin, xmax)
    y = w * x + b
    plt.xlabel("feature-0", size=15)
    plt.ylabel("feature-1", size=15)
    plt.title(title, size=20)
    plt.plot(x, y)

# 绘制散点图
def draw_scatter(x, y, title):
    plt.xlabel("epoch", size=15)
    plt.ylabel("error", size=15)
    plt.title(title, size=20)
    plt.scatter(x, y)

# 从这里开始执行
if __name__ == '__main__':
    # 加载训练集
    X_train = np.array([[1, 0], [0, 2], [1, 1], [1, 2], [1, 3], [2, 2], [2, 3], [3, 2]])
    y_train = np.array([0, 0, 0, 0, 1, 1, 1, 1])
    w = np.zeros((X_train.shape[1],)) # 权重
    b = 0.0 # 偏置
    learning_rate = 0.01 # 学习率
    epochs = 10000 # 迭代次数
    J_history = [] # 记录每次迭代产生的误差值

    # 逻辑回归建立模型
    w, b, J_history = logistic_function(X_train, y_train, w, b, learning_rate, epochs)
    print(f"result: w = {np.round(w, 4)}, b = {b:0.4f}")  # 打印结果

    # 绘制迭代计算得到的决策边界（decision boundary）方程
    # w[0] * x_feature0 + w[1] * x_feature1 + b = 0
    # --> x_feature1 = -w[0]/w[1] * x_feature0 - b/w[1]
    plt.figure(1)
    draw_line(-w[0]/w[1], -b/w[1], 0.0, 3.0, "Decision Boundary")
    plt.scatter(X_train[0:4, 0], X_train[0:4, 1], label="label-0: sad", marker='s')  # 将训练集也表示在图中
    plt.scatter(X_train[4:8, 0], X_train[4:8, 1], label="label-1: happy", marker='^')  # 将训练集也表示在图中
    plt.legend()
    plt.show()

    # 绘制误差值的散点图
    plt.figure(2)
    x_axis = list(range(0, epochs))
    draw_scatter(x_axis, J_history, "Cost Function in Every Epoch")
    plt.show()

运行结果

二元逻辑回归报错R_二元逻辑回归报错R_20

二元逻辑回归报错R_二元逻辑回归报错R_21

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Android根据rabbitmq在发送通知

下一篇：android 设置全局 dbHelper

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

二元逻辑回归报错R

二元逻辑回归报错R

文章目录

感知器的种类

sigmoid（logistics）函数

代价/损失函数（cost function）——对数损失函数（log loss function）

梯度下降算法（gradient descent algorithm）

正则化逻辑回归（regularization logistics regression）

代码实现

运行结果

51CTO博客