统计数据的搜集、整理与回归分析

学习目标

学习、了解相关工具的统计学原理;
熟练掌握各种统计技能和方法
接触统计年鉴和统计书籍
查找、输入、整理数据
表格的计算操作与图形设计
统计学回归分析分析


统计年鉴是最重要和最普及的国家或地区数据源

数据收集  20分钟

每组取一本统计年鉴, 查看年鉴指标目录,翻阅年鉴指标内容
**第1、3、5组任务:
查找三个数据:2000年-2018期间的,

中国农牧业生产总值;内蒙古农牧民数量;内蒙古牲畜总头数(牛+羊)年末存栏数据

使用1头牛=5只羊折算

**第2、4、6组任务:查找三个数据:2000年-2018期间的,

内蒙古农牧业生产总值;内蒙古农牧民数量;内蒙古牲畜总头数(牛+羊)年末存栏数据

使用1头牛=5只羊折算

**第7、8组 查找三个数据:2000年-2018期间的,

二连农牧业生产总值;内蒙古农牧民数量;内蒙古牲畜总头数(牛+羊)年末存栏数据

使用1头牛=5只羊折算


计算整理

excel计算
求和 =sum()
计算人均农牧业生产总值,  =农牧业生产总值/农牧民数量
计算人均牲畜数量    =牲畜数量/农牧民数量


图形

练习折线图 看一下变量的变动情况

练习散点图,看变量之间的图形直观


线性回归——OLS(最小二乘法)

打开stat软件 打开stat表格,(上面有一支笔的那个表格)

将人均农牧业生产总值和人均牲畜数量复制粘贴到表格里
首行数据确认为变量名
统计——线性模型及相关——线性回归
因变量选择——人均农牧业生产总值
自变量选择——人均牲畜存栏


各组展示


结果解释



R-squared ——总体显著性水平,结果靠谱程度
var 代表变量
coef 系数,表示自变量变动一单位,因变量变动的倍数
t——,表示自变量的显著性,t>3为显著 P>|t|,p值,代表自变量显著水平,p>0.1代表不显著,0.1>P>0.05 代表显著;0.05>p>0.01,代表** 显著;p<0.01,代表** 显著


数据操作——对数模型

对人均农牧业产值和人均牲畜数量进行对数化处理
=ln(var)
将数据导入stata软件
因变量   选择 人均农牧业产值
自变量 选择 人均牲畜数量
重新回归
stata散点图(图形——二维图——选择,创建,散点图,选择y变量和x变量)


各组汇报结果


课程回顾

熟悉统计年鉴
数据搜集和计算整理
excel数据操作
图形分析
回归分析