1 描述统计分析简介
基本统计分析,又叫描述性统计分析,描述性统计主要包括数据的集中趋勢分析、数据的离散程度分析、频数分布分析等。
通常对收集来的数据进行直接的频率、频数等描述,描述性统计分析一般对样本的最小值、最大值、平均值、标准偏差等进行分析,这些数据有助于了解样本数据特征,能够清晰的看到各个统计量的分布情况。
中位数
如果有一组数据,把它按从小到大的顺序排列,将这一数列等分成两份,这个分位数称为中位数,对于奇数个数组成的数列,中位数就是中间的那个数,对于偶数个数组成的数列,中位数就是中间的那个两个数相加除以2。
由于均值受异常值的影响较大,因此用均值来估计中心趋势显得很不稳定,而中位数的优点是受异常值影响较小,估计量稳定。
众数
众数就是一组数据中出现次数最多的数。一组数据可能有一个众数,可能有多个众数,也可能没有。众数的这一性质使得其使用范围受到限制
极差
极差定义为:极差=最大值一最小值
极差越小,离散程度越小。由定义可知极差只用到了一组数据中的两个数据,而忽略了数据的分布状况等许多有用的信息,因此仅仅用极差来度量离散程度显得很不够。
2
高级计量经济学及Eviews应用
本文以Eviews软件为例,对计量经济学服务中心线上课程中回归分析章节我国1990至2014年相关数据进行描述性分析,操作步骤如下:
3
高级计量经济学及Stata应用
以Stata软件为例,操作步骤如下:
cd C:\Users\admin\Desktopimport excel 相关分析.xlsx, firstrow clearsummarize LNY LNX1 LNX2 LNX3 LNX4 LNX5
结果为:
4
高级计量经济学及Python应用
以Python软件为例,操作步骤如下:
# 导入数据import numpy as np import pandas as pddf=pd.read_excel(r'C:\Users\admin\Desktop\描述分析.xlsx',sheet_name="Sheet3" )df.headdf.describe()
结果为:
5
高级计量经济学及R应用
计算多组变量描述统计分析,结果为: