工作空间
函数名称 | 功能 |
| 显示/创建当前目录 |
| 设置当前目录 |
| 保存/读取历史命令 |
| 保存/读取工作空间 |
输入输出
- 执行脚本
source("file")
- 文本输出
sink("file")
e.gsink("output",append=TRUE,split=TRUE)
- 输出图形
pdf/png/jpeg/bmp/postscript("fileName")
数据类型
数值型、字符型、逻辑型、复数型、原生型、日期类型
数据结构
- 向量
示例:a <- c("one", "two", "three")
- 在一个向量中,数据类型需要一致。
- 标量是只含一个元素的特殊向量
- 向量的编号从1开始。
- 读取一个元素 a[3],两个元素a[c(2,3)],一串元素a[2:4]
- 矩阵
用法:b <- matrix(元素向量, 行号, 列号, byrow(TRUE 按行, FALSE 按列),行列名=list(行名向量,列名向量))
- 一个矩阵中元素类型需要一致
- 和MATLAB一样默认按列填充
- 读取
b[row,col], b[1,3:4], b[2:3,3:4]
- 数组
用法:d <- array(元素向量,维度,维度名)
示例:dim1 = c("A1","A2")
dim2 = ...
a <- array(1:24, c(2,3,4),list(dim1,dim2,dim3))
- 元素类型一致
- 先填充前两维,按列填充
- 数据框
用法:e <- data.frame(col_vector1,col_vector2,...,row.names=col_vector1)
row.name是示例标识符。
示例:e <- data.frame(ID,age,type,status)
- 数据框是个框,什么都能往里装
- 一列中类型一致
- 读取
- 第一和第二列e[1:2]
- 按名读取e[c(”ID”,”age”)]
- 读取一行到向量
e$age
- 生成列联表
table(e$ID,e$age)
- 数据框与搜索路径 用前
attach(数据框名)
用完detach(数据框名)
即可直接用age 而不用写‘e$age’ - 如果遇到重名情况,可以使用with(e,{code})进入局部环境,如果局部环境里创建的数据要被外部使用,用
<<-
替换<-
,否则会出错,谁让R变量无法被声明呢 ╮( ̄▽ ̄)╭
- 因子
- 变量可以分为名义型和有序型,有序型变量值可以比较排序,而名义型仅仅是一个符号。
- 有序型和名义型变量在R中被称为因子。
- 函数
factor()
函数会将名义型变量按照字母顺序与一个整型数值对应。d <- factor(d)
- 有序型的数值对应按照字符的大小来排,例如”A”<”AC”<”B”,
d <- factor(d,ordered=TRUE)
- 手动定义排序 `d <- factor(d,order=TRUE,levels=(“C”,”B”,”A”)) 分别赋值1,2,3. 类似C中的枚举。
- 列表
- 列表里面的对象可以是向量、矩阵、数据框或者其他的列表。
li <- list(title = "TITLE", age <- c(1,2,3))
这里输出li,可以看到title被显示成为TITLE的字段名,$title
,而age则没有,这是第一处发现=号和<-赋值的不同。 - 访问
li[[1]]
和li[["title"]]
访问的都是”TITLE”。
数据导入
- 键盘输入
a <- data.frame( age=numeric(0), gender=character(0),weight=numeric(0))
a <- edit(a)
将弹出对话框,可以手动输入。 - 文本导入
d <- read.table("student.csv",header=TRUE,sep=",",row.names="STUDENT_ID")
- 其他
其他的导入方式例如XML/SPSS/SAS/Excel等等都用对应的函数可以调用。
逻辑运算符
< <= > >= == != != !x x|y x&y isTRUE(x)
没有什么特殊的地方
循环
for (var in seq) statement
while(cond) statement){}
分支
if (cond) statement1 else statement2
ifelse(cond, statement1, statement2)
switch(expr,...)
函数
myfunction <- function(arg1,arg2,...){
statements
return (object)
}