rep与replicate
replicate是重复操作,rep是重复值
高级循环
常规方法
# 利用for循环找到每个数不重复因子
# seq_along取位置
prime_factors<-list(one=1,two=2,three=list(3,3))
unique_primes<-vector("list",length(prime_factors))
for(i in seq_along(prime_factors)){
unique_primes[[i]]<-unique(prime_factors[[i]])
}
names(unique_primes)<-names(prime_factors)
unique_primes
高级方法:lapply
lapply(prime_factors,unique)
高级方法:vapply
#vapply
prime_factors<-list(one=1,two=2,three=list(3,3))
vapply(prime_factors,length,numeric(1))#返回每个元素的长度,每次返回的都是数值型numeric
length,numeric(1)表示返回每个元素的长度,每次返回的都是数值型numeric
prime_factors<-list(one=1,two=2,three=c(3,3))
f1<-function(x){
c(min(x),max(x))
}#返回最大值和最小值
vapply(prime_factors,f1,numeric(2)
高级方法:sapply
sapply(prime_factors,unique)# 返回list
sapply(prime_factors,length)# 返回vector
sapply(prime_factors,summary)# 返回array
vapply和sapply的区别:
vapply返回的结果是相同长度的,如果不清楚返回的类型,可以使用sapply,这样可以自动的返回一个类型
sapply(list(),length)#sapply的问题:没有报错空列表,无返回结果
str(x)#查看structure
dir(pattern="\\.ipynb$")#查看以ipynb结尾的文件
# 加载指定目录下的所有文件
r_fires<-dir(pattern="\\.ipynb$")
lapply(r_files,source)#sourve将所有文件加载进来
#apply系列函数中,多个参数的传递
complemented<-c(2,3,6,10)
lapply(complemented,rep.int,times=4)#对向量的每一个元素重复4次,返回list
complemented<-c(2,3,6,10)
sapply(complemented,rep.int,times=4)#对向量的每一个元素重复4次,返回matrix
rep4x<-function(x) rep.int(4,times=x)
lapply(complemented,rep4x)
# 利用匿名函数
lapply(complemented,function(x) rep.int(4,times=x))
高级方法:eapply
env<-new.env()
env$molien<-c(1,0,1,0,1,1,2,1,3)
env$larry<-c("rr","kk","ek","el")
eapply(env,length)
高级方法:apply
install.packages("matlab")
magic4<-magic(4)
magic4# 横竖相加相同
rowSums(magic4)#逐行求和
apply(magic4,1,sum)#第二个参数是维度,该语句表示对数组的第一个维度,即行,(2是列),求和
apply(magic4,1,toString)
高级方法:mapply
lapply只作用于单个向量参数,不能访问作用元素的名称
mapply可以传入多个向量作为参数
msg<-function(name,factors){
ifelse(
length(factors)==1,
paste(name,"is prime"),
paste(name,"has factors",toString(factors))
)
}
mapply(msg,names(prime_factors),prime_factors)
即使向量化Vectorize()
即使向量化Vectorize()
baby_gender_report<-function(gender){
switch(
gender,
male="is a boy",
female="is a girl")
}
genders<-c("male","female")
vectorize_baby<-Vectorize(baby_gender_report)#j
vectorize_baby(genders)
# 分割
with(frogger_scores,split(score,player))#返回的是列表
返回的是列表
lapply(score_by_player,mean)
# 合并
unlist(list_of_means_by_player)
plyr包
https://mirrors.tuna.tsinghua.edu.cn/CRAN/
找到plyr点击进入
install.packages("plyr")
library(plyr)
llply(prime_factors,unique)# 第二个字母l表示return l
str(llply(prime_factors,unique))
laply(prime_factors,length)# 第二个字母表示返回向量array
str(laply(prime_factors,length))
raply(5,runif(1))#r:rep,a:return array
rlply(5,runif(1))#r:rep,a:return list
rdply(5,runif(1))#r:rep,a:return dataframe
r_ply(5,runif(1))#discarded output
frogger_scores$level<-floor(log(frogger_scores$score))
frogger_scores
ddply(frogger_scores,.(player),colwise(mean))#dd表示对数据表做操作,操作为:用player分组,分组取均值
ddply(frogger_scores,.(player),summarise,mean_score=mean(score),max_level=max(level))#对数据表做summarise,取出summarize中的max和mean
# mean_score=mean(score),max_level=max(level)是summarize的参数
加载包
require
search
.libPaths()