lr模型python

原创

mob64ca12f062df 2024-09-09 06:50:44 ©著作权

文章标签 线性回归数据集 python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12f062df的原创作品，请联系作者获取转载授权，否则将追究法律责任

线性回归模型（LR模型）在Python中的应用

线性回归（Linear Regression）是一种基础且常用的统计分析方法，用于研究自变量（独立变量）与因变量（响应变量）之间的线性关系。在机器学习与数据科学领域，线性回归被广泛应用于预测与模型构建方面。本文将通过代码示例，介绍如何在Python中实现线性回归模型。

什么是线性回归？

线性回归的目标是寻找一个线性方程，通过该方程将自变量与因变量连接起来。最简单的线性回归模型表达式为：

[ y = \beta_0 + \beta_1 x + \epsilon ]

其中：

( y ) 是因变量（目标变量）。
( x ) 是自变量（特征变量）。
( \beta_0 ) 是截距（y轴的交点）。
( \beta_1 ) 是自变量的系数，代表自变量变化一个单位时，因变量的变化量。
( \epsilon ) 是误差项，表示模型与实际值之间的差距。

在Python中实现线性回归

Python是进行数据分析和机器学习的热门语言，提供了多个库来实现线性回归模型。最常用的库是scikit-learn。在接下来的部分，我们将逐步介绍如何使用scikit-learn库构建线性回归模型。

1. 安装必要的库

首先，你需要确保安装了scikit-learn和pandas。你可以通过pip来安装这些库：

pip install scikit-learn pandas matplotlib seaborn

2. 导入库

在你的Python文件中，导入必要的库：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

3. 准备数据集

在这篇文章中，我们将使用一个简单的模拟数据集。你可以通过以下代码创建一个包含自变量和因变量的数据集：

# 创建示例数据集
np.random.seed(42)
x = 2.5 * np.random.randn(100) + 5  # 自变量
residuals = 0.5 * np.random.randn(100)  # 误差项
y = 2 + 0.3 * x + residuals  # 因变量

# 将数据集存储到DataFrame
data = pd.DataFrame({"X": x, "Y": y})

# 显示数据集的前几行
print(data.head())

4. 数据可视化

在建模之前，我们可以通过数据可视化来观察自变量与因变量之间的关系：

# 数据可视化
plt.figure(figsize=(10, 6))
sns.scatterplot(x=data["X"], y=data["Y"])
plt.title("Scatter Plot of X vs Y")
plt.xlabel("X (Independent Variable)")
plt.ylabel("Y (Dependent Variable)")
plt.show()

5. 划分数据集

为了能够更好地评估模型性能，我们将数据集划分为训练集和测试集：

# 划分数据集
X = data[["X"]]
y = data["Y"]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

6. 构建线性回归模型

接下来，我们将构建线性回归模型，并在训练集中进行训练：

# 创建线性回归模型
model = LinearRegression()

# 拟合模型
model.fit(X_train, y_train)

# 输出模型的截距和系数
print(f"Model Intercept: {model.intercept_}")
print(f"Model Coefficient: {model.coef_[0]}")

7. 进行预测

在模型训练完成后，我们可以对测试集进行预测：

# 进行预测
y_pred = model.predict(X_test)

# 输出预测结果
pred_df = pd.DataFrame({"Actual": y_test, "Predicted": y_pred})
print(pred_df.head())

8. 评估模型

我们使用均方误差（MSE）和决定系数（R²）来评估模型的性能：

# 评估模型性能
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f"Mean Squared Error: {mse}")
print(f"R² Score: {r2}")

9. 可视化预测结果

最后，我们可以通过图表对比实际值和预测值，以便观察模型的拟合情况：

# 可视化预测结果与实际值
plt.figure(figsize=(10, 6))
plt.scatter(X_test, y_test, color='blue', label='Actual')
plt.scatter(X_test, y_pred, color='red', label='Predicted')
plt.title("Actual vs Predicted Values")
plt.xlabel("X (Independent Variable)")
plt.ylabel("Y (Dependent Variable)")
plt.legend()
plt.show()

总结

线性回归是一种简单有效的回归分析方法，能够帮助我们理解自变量与因变量之间的关系。在Python中，通过使用scikit-learn库，我们可以轻松建立、训练和评估线性回归模型。

旅行图概述

下面是一个旅行图，它描述了构建线性回归模型的步骤：

journey
    title 构建线性回归模型的旅程
    section 数据准备
      收集数据: 5: 用户
      数据清洗: 5: 用户
    section 数据分析
      数据可视化: 4: 用户
      划分数据集: 3: 用户
    section 模型构建
      拟合模型: 5: 用户
      进行预测: 4: 用户
    section 模型评估
      计算MSE和R²: 5: 用户
      可视化结果: 4: 用户

通过以上内容，你应该对线性回归模型有了更深的理解，同时学会了在Python中如何实现这一模型。希望这篇文章能在你的学习与实践中有所帮助！

上一篇：android 读写file

下一篇：harbor使用外部redis

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯