概述

菜单驱动  点击菜单栏

命令行驱动 在命令窗口里输入命令。 结果窗看结果,变量窗 历史窗口

程序驱动

findit :不知道具体命令名字

findit regression :弹出所有能做回归的包出来

help :知道命令确切名字

如果要加标签,打开变量管理器,在标签处添加

常用命令 dsec     

420个观测值,18个变量,所有变量以什么形式和格式存储

描述统计量命令:sum

双击变量窗口里想要的变量

 mean:均值,变量的平均位置,大概得知变量数量级的信息

std.Dev反映的是变量的变差,比如这个数字也变小,回归结果很有可能不显著

minmax 有助于发现数据记录错误,异常值

如果对所有小班感兴趣,想看生师比小于等于15的班的数据

在做回归之前想了解相关关系,数值/图像的方法:

命令:

corr(看相关系数)

plot(看两者的散点图)

因变量放第一个位置,自变量放第二个位置

尽量用标签代替变量名字

关掉上一个数据集,打开另一个数据集,

用命令:

clear(清除上一个数据集的变量窗口里的变量)

对数据进行变形

产生一个的对数

产生一个变量用的命令:

gen (新变量名字)=log(原变量)

Regress(回归分析)命令的使用以及结果分析

如何使用stata进行一元回归分析

回归分析命令简称:reg

Reg 因变量 自变量

回归结果分为三个部分

  1. 方差分解

     2.回归整体的质量的汇报

     3.回归系数

statsmodels 逐步回归 stata 逐步回归法命令步骤_数据挖掘

 

roe:自变量

Coef:回归的系数

Cons:常数项

Std.Err. 方差开根号得到的系数的Std.Err.

t:检验系数是否显著

P:是否可以拒绝原假设

最后一个是以bhat为中心,t a/2构建的置信区间

statsmodels 逐步回归 stata 逐步回归法命令步骤_回归_02

 

Total:SST

Model:回归方程所解释的数据变差的部分

Residual:残差平方和

df:各自对应的自由度

MS:SS/df得到的均方

statsmodels 逐步回归 stata 逐步回归法命令步骤_人工智能_03

 

Number of obs:总共有多少观测值

R-squared:()%的数据的总的变差可以被回归所解释

MSE:残差平方和/(n-2)后开根号所得到的

如果想计算拟合值和残差

命令:

Predict

例:

如果想计算yhat

首先定义一个拟合值的名字

每个命令如果使用了带选项的命令用’ ’表示命令输完了

Predict uhat, resi

Resi:残差

除了看回归结果外,作图

命令:toway(图形的代表例如scatter )

散点图:scatter

线性拟合曲线:lfit

图可以通过保存,以eps或tif的格式存在文件里

在逆方差和同方差时需使用不同公式

同方差情况下,使用默认的reg命令

逆方差情况下,使用reg 因变量 自变量   ,robust(逆方差的公式,r为robust的缩写)