线性回归是一种用于建立自变量与因变量之间关系的统计分析方法。它是利用“最小二乘法”对数据进行拟合,从而得到一个最佳的线性模型,该模型可以用来预测因变量的值。线性回归模型是一个简单的模型,它假设自变量和因变量之间的关系是线性的,即它们之间的关系可以用一条直线来表示 。
——使用讯飞星火认知大模型提问“线性回归介绍”
文章目录
- 前言
- 一、线性回归介绍
- (一)线性回归的概念
- (二)简单线性回归公式及其解析
- 二、利用Excel绘制线性回归趋势线
- (一)生成测试数据
- (二)绘制趋势线
- (三)趋势线解析
- 1. 案例套用分享——书店销售量和日人流量的关系
- 总结
前言
前几天在公司培训上听同事用Excel对线性回归的讲解,感觉使用这种常用的办公软件有助于理解也易懂,在这里分享给大家。
一、线性回归介绍
(一)线性回归的概念
在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归或者一元回归,大于一个自变量情况的叫做多元回归。(这反过来又应当由多个相关的因变量预测的多元线性回归区别,而不是一个单一的标量变量。)
(二)简单线性回归公式及其解析
- 公式:y=ax+b
- 解析:
y:因变量
x:自变量
a:斜率
b:截距
二、利用Excel绘制线性回归趋势线
(一)生成测试数据
- 维度:水果名称、日期
- 度量:销售量(借助RANDBETWEEN()函数生成)
- 将数据选择性粘贴为值,避免随机数点击变化。
(二)绘制趋势线
- 生成图表,选择数据区域,点击上方工具栏中的“插入”选项,选择全部图表中的折线图。
- 绘制趋势线,点击图表右上角第一个按钮,选择趋势线中的线性。
- 显示公式,点击趋势线,选择右侧显示公式,可以看到相应的y=ax+b公式。
(三)趋势线解析
如上图所示,梨在2023年1月1日至10日的销量呈下滑的趋势,也就是销售量受到日期的影响,我们可以根据该趋势来预测下一个周期的值。
1. 案例套用分享——书店销售量和日人流量的关系
自变量(x):影响因变量的要素,该案例分享中为日人流量
因变量(y):要预测的值,该案例分享中为书店销售量
变量 | 作用 | 案例中相应值 |
自变量 | 影响因变量的要素,即我们要控制的值 | 日人流量 |
因变量 | 我们预测的值,即我们想要达到的结果 | 书店销售量 |
(1)测试数据如下:
(2)绘制散点图
(3)绘制简单线性回归线
(4)结论
书店销售额受到日人流量影响的情况可以概况为以下公式:
y=25.327x-408.77
(5)预测
当我们的日人流量达到1000人时,可以有多少销售额?
预测销售额=25.327*1000-408.77=24918.23,则当我们的日人流量达到1000人时,预计有约两万五的销售额。
同理,我们也可以先定销售额目标,计算出所需日人流量,以此来制定吸引人流的计划,进而促销。
总结
线性回归经常运用在预测的场景,它说明的是变量之间的关系,即公式中自变量x对因变量y的影响。