引言

在作者大学学习计量经济学时,曾经为之深深困扰过,和其他的经济专业书不同,计量经济学的教材书写方式过于晦涩。因此,决定开始此篇教程更新。由于目前时间有限,所以以草稿的形式写出,待日后重新排版和修改。

序章

问题的引入—计量经济学

现在我们有一组家庭收入与丈夫受教育年限的数据,我们想要估计丈夫增加一年的教育对家庭收入的影响。

大部分人高中时都学过最小二乘法以拟合回归直线,理论上我们只需要将数据带入即可。然而,这个问题实际上并不像我们看到的这么简单。

比如,当一个人的学历更高时,往往同时这个人的智力水平也越高,即使他不多接受一年的教育,工资也会比普通人高一些,当我们使用教育年限作为回归自变量时,估计出来的参数可能夸大了教育的作用。

再比如,当我们估计丈夫的教育年限对家庭收入的影响时,仔细想想这个问题,我们还有没有遗漏其他东西?其中的一个答案是,妻子的受教育年限,当夫妻一方的受教育年限高时,往往其配偶的受教育年限也高,如果我们仅仅估计丈夫受教育年限的影响,而忽略妻子,那么可能会夸大丈夫的受教育年限在家庭收入中的作用。假设一个人多接受一年的教育能够增加一万元每年的收入,那么仅仅估计丈夫一人的受教育年限对家庭收入的影响,那么这个数字可能是两万元,我们就得到了一个夸大的答案!

然而,问题的麻烦之处在于,很多时候,我们不能明确我们忽视了哪些变量,比如也许当地的经济发展水平也影响了家庭收入。甚至,更进一步,受教育年限可能反过来取决于家庭收入!如果这个例子不够明显的话,我们换一个收入与家庭食品支出的示例,食品的支出可能反过来影响收入(生活成本增加倒逼工资上涨)!而这正是计量经济学的研究内容之一。

计量经济学的作用:

“当经济专业的学生找工作的时候,你的雇主可能会问你:你能为我做做什么?学习了传统经济学课程的学生可能回答:我能像一个经济学家一样思考。虽然我们认为这样的回答很有分量,但它并不是很明确,不懂经济学的雇主可能不会满意。事实上,只有少部分经济学家以研究理论为主,而大多数经济学家做的是实证研究。”

计量经济学的作用简单说来包括:

1、尽可能准确的估计经济参数,如一年的教育能带来多少的工资回报。

2、预测和估计未来,如明年的GDP增速为多少

3、检验经济假说,如报纸广告比杂志广告更好的促进销量么?

计量经济学的数据的不同之处:

实验数据与非实验数据 非实验数据一般难以做对照实验。

警示!

对于社会科学的学生而言,需要注意的是,当你试图学习计量经济学或实证分析,希望在毕业后到企业中找到一份数据分析的工作的话,或许要失望了。因为目前只有学校体系还在使用传统的计量进行实证分析以发表论文。现在数据分析的主流已经变成了大数据、机器学习、决策树之类的东西。之后我们也会看到,往往他们更加准确,而传统的计量经济学,很多时候,只要一个参数稍微改变,拟合的回归直线就可能天翻地覆。

很多时候的计量经济学家们,是调整模型以让结论靠近现实(这样才能得到不过于离谱的答案以发表论文),而非用得出的理论去指导实践(如伽利略大小球重力实验)!

但是,尽管如此,计量经济学仍然能让我们更好的了解事情的本质。

容易混淆的入门概念

随机变量的定义

本杰明·富兰克林曾经说过,一生中唯一能确定的时间是死亡和税收。虽然不是原意,但是这个常识指出几乎所有我们在生活中遇到的事件都是不确定的,比如你不知道你下次世界杯哪个国家会夺冠。因此,一 个随机变量是一个变量,其值是未知的,直到它被观测到。

随机变量实际上包括了两个内容:

1、随机的含义。事实上随机性也分为两类:

第一类是“无知的随机”,即epistemic类,本质是信息缺位,一旦我们掌握了足够的信息就消除了这种随机性,比如明天股票的涨跌对操盘手来说就没有随机性。再比如,手动操作计时器计算百米赛跑的速度就具有很大的随机性,然而当我们使用电子计时器时,就消除了这种随机性。

第二类是aleatoric类,是固有而不可消除的不确定性,比如量子现象,其本质是人类对宇宙认识能力的有限性(也可能本来就是如此)。

(注:混沌体系是第一类还是第二类?)

2、随机变量的含义,其含义一是随机,二是变量,变量指的能够把现实中的东西映射为一个确定的函数。比如掷硬币,我们能够将其正反映射为0或1,且其各取值的概率分布是确定的!所以说,当我们说随机变量的时候,其实就暗示了其有一个明确的概率分布!

思考:对y=a+bx+e,其中e是一个随机变量,那么y是一个随机变量么?因为y似乎加入了某种确定的规律性。

答案为:是,我们不能因为它部分可预测,就说它不是随机变量。

Y=ax+e 随机误差项e解释许多会影响销量,但是被忽略的因素,同时它也反映了经济活动中内在的不确定性。

经济数据类型

P6