43数学统计函数
正态分布 x<-rnorm(n=100,mean=15,sd=2)
取整数:round(x)
正态分布图qqnorm()
生成随机数runif
runif(50,min=1,max=100)
44描述性统计函数
1.对数据集进行详细统计summary
summary(mtcars)
只对一列进行统计: fivenum(mtcars$hp)
2.包Hmisc
安装:install.packages("Hmisc")
载入:library(Hmisc)
函数describe计算统计量
describe(mtcars)
3.包pastecs
library(pastecs)
> stat.desc(mtcars,basic=TRUE,desc=TRUE,norm=TRUE)#basic基本值,desc描述值,norm统计值
4.包:psych
函数:describe()
5.
对分组信息进行统计
aggregate(mtcars,by=list(mtcars$carb),mean) #统计函数也可以是sd
6.安装包:install.packages(doBy)
载入:library(doBy)
函数: summaryBy(mpy+hp+wt~am,data=mtcars,FUN=mean)
45频数统计函数
因子:因子分组后进行频数统计
mtcars转为因子:x<-as.factor(mtcars$cy1)
分组split函数:split(mtcars,y)
cut:对连续数据进行分割 cut(mtcars$mpg,c(seq(10,50,10)))
频数的统计: table(因子)
频率的统计:prop.table
prop.table(table(因子))
二维列联表
安装:install.packages("vcd")载入: library(vcd)
table(Arthritis$Treatment,Arthritis$Improved)
xtabs(~Treatment+Improved,data=Arthritis)
x<- xtabs(~Treatment+Improved,data=Arthritis)
magin.table(x)
prop.table(x,1)#1代表行,2代表列