面板数据(panel data)是指不同对象在不同时间上的指标数据。目前面板数据被广泛地应用于经济研究中。本文简单介绍下,使用SPSSAU进行面板数据回归分析步骤。
一、数据格式
下图中,展示的就是一个面板数据的例子。数据为9个地区2008~2018共11年的各项经济指标数据。
地区列反映的是数据不同的截面,即不同的研究个体。日期列反映了数据的时序性,即反映不同时期的数据。面板数据是二者的结合,上传数据时需要注意标识出研究个体编号(地区)和时间点(年份)分别是什么。
二、模型识别
面板数据进行回归影响关系研究时,即称为面板模型(面板回归)。一般情况下,面板模型可分为三种类型,分别是FE模型(固定效应模型),POOL模型(混合估计模型)和RE模型(随机效应模型)。
最终应该选择哪个模型,可通过各个检验进行判断。SPSSAU分别进行F检验,BP检验和Hausman检验(豪斯曼检验),结合三个检验,最终判断出哪个模型最优。
如果是经济类数据,多数情况下FE模型更优,因而很多研究直接默认不检验直接使用FE模型;一般情况下,三种模型的选择上有区别,但结论上一般区别不会太大。
三、SPSSAU操作
案例:这里我们以上面提到的9个地区的11年的数据作为案例数据,用以说明。
数据中包括X1(城乡居民年末储蓄存款), X2(年末常住人口), X3(城镇化率), X4(教育支出)共4个自变量,因变量为GDP。
操作步骤:点击【计量经济研究】→【面板模型】。
SPSSAU面板模型
研究4个自变量对于因变量GDP的影响,并且需要标识出面板数据,分别将地区和日期放入对应的‘个体ID’和‘时间’框中。
四、结果分析
SPSSAU共输出3类表格,分别是检验汇总表格,面板模型结果汇总表格,模型中间过程结果表格。
- 通过F检验比较FE模型与POOL模。
- 通过BP检验确定应该建立RE模型还是POOL模型。
- 通过Hausman检验选择FE模型或RE模型。
分析步骤参考SPSSAU提供的“分析建议”及“智能分析”。本案例中通过检验给出最终选择“FE模型”。
SPSSAU会提供全部三种模型的分析结果,我们只需要以FE模型结果作为标准。
SPSSAU分析结果
从表格中可以看出:针对X1(城乡居民年末储蓄存款)而言,其呈现出0.01水平的显著性(t =11.880,p =0.000 <0.01),并且回归系数值为0.967>0,说明X1(城乡居民年末储蓄存款)对GDP会产生显著的正向影响关系。
针对X2(年末常住人口)而言,其并没有呈现出显著性(t =1.623,p =0.108>0.05),因而说明X2(年末常住人口)对GDP不会产生影响关系。
针对X3(城镇化率)而言,其呈现出0.01水平的显著性(t =-4.073,p =0.000 <0.01),并且回归系数值为-1.076<0,说明X3(城镇化率)对GDP会产生显著的负向影响关系。
针对X4(教育支出)而言,其并没有呈现出显著性(t =1.461,p =0.148>0.05),因而说明X4(教育支出)对GDP不会产生影响关系。
每个模型的具体过程值可查看对应模型的“模型中间过程结果表格”,这里不再赘述。