回归基础概念

回归分析:在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

在初等数学中,一元一次函数y=kx+b是一种理想的线性关系。在知道两个点(x, y)时,采用待定系数法就能够求解出系数k和b。而现实中的很多数据和样品,并不存在这样理想的线性关系,但是他们之间存在一种近似的线性关系,可以表示为y=kx+b+e。其中e是数据偏离线性的误差,这个误差是服从正态分布的。就是因为这个e的存在,所以对于每一组数据(x,y),他们的误差都是不同的。要求解出这个公式y=kx+b+e,就需要计算出固定系数k和b,同时使得随机误差e尽量小,才是最能满足已知数据之间的关系的。

|e|=|y−kx−b|,此处,利用已知的(x,y)来找的合适的k,b使|e|的和对于所有的已知点最小,这就是线性回归的思路。当然此处评价误差最小的方式有多种,并一定是求|e|的和,也存在其他的方式,比如方差、均方差等。

 

回归分析 基准回归 什么叫基准回归_回归分析 基准回归

回归分析 基准回归 什么叫基准回归_方差_02

解上述方程可以求得a和b。通常将a和b的计算公式写为如下形式: