报表是统计描述的重要内容,用来计算和展示统计表格,这就是所谓的用数据说话。在文章撰写的结果部分,表格是展示文章结果的重要方式,因为它可以代替冗长的文字描述,便于资料见的对于和进一步的统计分析,小编在本文中介绍一下如何灵活的使用stata软件的tabulate命令和table命令将相应的统计指标用表格的形式展现出来。
1. 使用命令tabulate
二维频数表的stata命令为tabulate,对应的stata菜单操作方式为Statistics——Summaries, tables, and tests—— frequency tables——two-way table with measures of association.
二维频数表的stata命令格式如下:
Tabulate varname1 varname2 [if] [in] [weight] [,options]
其中options中的命令主要包括 column、row、cell、expected、nofreq和nolabel这几个选项,具体的含义见下表说明
选项 | 说明 |
Column | 输出每列的相对频数 |
Expected | 输出每个单元格的期望频数 |
Row | 输出每行的相对频数 |
Cell | 输出每个单元格的相对频数 |
Nofreq | 不输出频数 |
Nolabel | 输出数值而不是数值标签 |
举例:绘制地区和年龄的二维频数表,不显示频数,chi2表示卡方统计量,命令和结果如下
2. 使用命令table
概要统计表格的stata命令为table,对应的stata菜单操作方式为statistics——summaries, tables, and tests—— other tables —— flexible table of summary statistics
概要统计表格的stata命令格式如下:
table rowvar [colvar [supercolvar]] [if] [in] [weight] [,options]
其中option的选项如下表所示:
选项 | 命令说明 |
Contents(clist) | 表格内容,最多可以选5个统计量,默认为频数:contents(freq) |
By(superrowvarlist) | 超级行变量 |
Center | 表格单元格居中对齐,默认为右对齐 |
Left | 表格单元格左对齐,默认为右对齐 |
Row | 增加行合计 |
Column | 增加列合计 |
Scolumn | 增加超级列合计 |
Format(%fmt) | 设置表格单元格中数值的显示格式,默认为format(%9.0g) |
Content(clist)选项可输出的统计量如下表所示
统计量 | 说明 | 统计量 | 说明 |
Freq | 频数 | Max varname | 变量的最大值 |
Sd varname | 变量的均值 | Min varname | 变量的最小值 |
Semean varname | 变量的标准误 | P1 varname | 变量的百分位数 |
Sum varname | 变量的合计 | P2 varname | |
Iqr varname | 变量的四分位数间距(iqr=p75-p25) | P50 varname |
举例:
绘制一维表,并给出多个统计量,命令和结果如下:
绘制二维表,并给出多个统计量,命令和结果如下:
绘制三维表,命令和结果如下:
绘制更高维度的表格,通过by() 选项,table命令可以绘制更高维度的表格。命令和结果如下: