直方图

实例:nutshell包的births2006.smpl数据集,包含了2006年美国出生人口的数据的10%样本,每一条记录有13个变量。使用数据集前,需通过install.packages(“nutshell”)安装并加载。

以美国出生人口数据为例,利用直方图查看不同胎儿数下婴儿的平均重量。执行以下代码得到下图的直方图。

library(lattice)library(nutshell)data(births2006.smpl),histogram(~DBWT|DPLURAL,data=births2006.smpl,main=“Births in the UniTED States,2006”),layout=c(1,5),xlab=“Birth weight,in grams”

 为了方便地对不同的组做比较,我们通过layout参数将图形垂直堆积起来,

从图中可以看出,从单胞胎到多胞胎,婴儿的平均重量是减少的。

核密度图

   如果想用一条线而不是通过一组矩形块来展示连续型变量的分布,可以选择核密度图。

在lattice包中,核密度图可以用densityplot函数来绘制。

相比直方图,密度图的一个优势是可以在彼此上方堆放,而且结果还有可读性.

densityplot(~height|voice.part,data=singer,layout=c(1,8),xlab=”Height(inches)”,,main=”Height of New York Choral Society singers”)

核密度叠加图

densityplot(~height,group=voice.part,data=singer,xlab=”Height(inches)”,plot.points=FALSE,main=”Height of New York Choral Society singers”,lty=1:8,col=18,led=1.5,key=list(text=list(levels(singervoice.part)),column=4,lines=list(lty=1:8,col=1:8)))
densityplot( height,group=vioce.part,data=singer,xlab=“Height(inches)",plot.points=FALSE,main="HeightofNewYorkCHoralSocietysingers",lty=1:8,col=18,led=1.5,key=list(text=list(levels(singervoice.part)),column=4,lines=list(lty=1:8,col=1:8)))
densityplot(~height,group=vioce.part,data=singer,xlab=“Height(inches)",plot.points=FALSE,main="Height of New York CHoral Society singers",lty=1:8,col=18,led=1.5,key=list(text=list(levels(singervoice.part)),column=4,lines=list(lty=1:8,col=1:8)))
densityplot( height,group=vioce.part,data=singer,xlab=“Height(inches)",plot.points=FALSE,main="HeightofNewYorkCHoralSocietysingers",lty=1:8,col=18,led=1.5,key=list(text=list(levels(singervioce.part)),
library(lattice)mtcarstransmissionc(
densityplot(~mpg,data = mtcars,groups = transmission,main = “MPG Distribution by Transmission Type”,xlab = “Miles per Gallon”, auto.key = TRUE)

#groups 选项默认将分组变量各个水平下的图形叠加到一起。绘制的点为空心圆圈,线为实线,水平信息用颜色来区分。不过以灰色调输出时,颜色将很难区分。稍后我们将看看如何修改这些默认值。

#auto.key = TRUE将可以创建一个摆放在图形上方的、初步的图例符号,你可将所做的修改以列表形式添加到自动图例符号中.

带状图

    如果想用一条线而不是通过一组矩形块来展示连续型变量的分布,可以选择核密度图。

    在lattice包中绘,核密度图可以用densityplot函数来绘制。

相比直方图,密度图的一个优势是可以在彼此上方堆放,而且结果还有可读性。

Q-Q图

    Q-Q图是一种识别数据集与理论分布拟合程度优劣的非常有用的技术。它用于比较数据的实际分布与理论分布。具体来说,它绘制观测数据的分位与理论分布的分位图形。

    lattice包中的qqmath函数可绘制单变量Q-Q图,qq函数可生成比较两个分布的Q-Q图。

核密度图可以用densityplot函数来绘制

相比直方图,密度图的一个又是是可以再彼此上方堆放,而且结果还有可读性

箱线图

     箱线图通过绘制连续型变量的五数总括,即最小值,下四分位数(第25百分位数),中位数(第50百分位数),上四分位数(第75百分位数)以及最大值,描述了连续型变量的分布。

     箱线图能够显示出可能为离群点(范围为正负1.5*IQR以外的值,IQR表示四分位距,即上四分位数与下四分位数的差值)的观测。

     在lattice包中,绘制箱线图可以通过bwplot函数实现。

实例:lattice包中的singer数据集,我们将voice.part作为条件变量,查看不同类型歌手的身高数据分布情况。执行以下代码得到下图所示的箱线图。

bwplot(~height|voice.part,data=singer)

R语言多因素多重比较 r语言多重比较结果解读_直方图






R语言多因素多重比较 r语言多重比较结果解读_语言 重量计算_02