1、利用data.frame函数随机生成数据框,dat1为生成的数据框

c1 <- 1:5  
c2 <- c(2,5,1,8,6)
c3 <- c("w","q","r","t","p")
c4 <- c("i","w","u","z","v")
dat1 <- data.frame(c1,c2,c3,c4) ##生成数据框
dat1
  c1 c2 c3 c4
1  1  2  w  i
2  2  5  q  w
3  3  1  r  u
4  4  8  t  z
5  5  6  p  v

 

2、查看变量类型及维度

class(dat1)
[1] "data.frame"
dim(dat1)
[1] 5 4

变量类型为data.frame、数据维度为5行4列。

 

3、提取数据框中特定数据

dat1[1,] ##提取第一行
  c1 c2 c3 c4
1  1  2  w  i
dat1[2,] ##提取第二行
  c1 c2 c3 c4
2  2  5  q  w
dat1[,1] ##提取第一列
[1] 1 2 3 4 5
dat1[,2] ##提取第二列
[1] 2 5 1 8 6
dat1[1] ##仍然是提取第一列,和dat[,1]数据类型不同
  c1
1  1
2  2
3  3
4  4
5  5
dat1[2] ##仍然是提取第二列,同上
  c2
1  2
2  5
3  1
4  8
5  6
dat1[1:3,] ##提取1至3行数据
  c1 c2 c3 c4
1  1  2  w  i
2  2  5  q  w
3  3  1  r  u
dat1[c(1,3,5),] ##提取1、3,5行数据
  c1 c2 c3 c4
1  1  2  w  i
3  3  1  r  u
5  5  6  p  v
dat1[,1:3]  ##提取1至3列数据
  c1 c2 c3
1  1  2  w
2  2  5  q
3  3  1  r
4  4  8  t
5  5  6  p
dat1[1:3] ## 提取1至3列数据
  c1 c2 c3
1  1  2  w
2  2  5  q
3  3  1  r
4  4  8  t
5  5  6  p

 

3、删除数据框中特定数据

dat1[-1,]  ##删除第一行数据
  c1 c2 c3 c4
2  2  5  q  w
3  3  1  r  u
4  4  8  t  z
5  5  6  p  v
> dat1[-2,] ##删除第二行数据
  c1 c2 c3 c4
1  1  2  w  i
3  3  1  r  u
4  4  8  t  z
5  5  6  p  v
> dat1[-c(1,2),]  ##删除1至2行数据
  c1 c2 c3 c4
3  3  1  r  u
4  4  8  t  z
5  5  6  p  v
> dat1[,-1] ##删除第一列数据
  c2 c3 c4
1  2  w  i
2  5  q  w
3  1  r  u
4  8  t  z
5  6  p  v
> dat1[-1]  ##仍是删除第一列数据
  c2 c3 c4
1  2  w  i
2  5  q  w
3  1  r  u
4  8  t  z
5  6  p  v
> dat1[,-2] ##删除第二列数据
  c1 c3 c4
1  1  w  i
2  2  q  w
3  3  r  u
4  4  t  z
5  5  p  v
> dat1[-2]  ##仍是删除第二列数据
  c1 c3 c4
1  1  w  i
2  2  q  w
3  3  r  u
4  4  t  z
5  5  p  v
> dat1[,-c(1:2)] ##删除1至2列数据
  c3 c4
1  w  i
2  q  w
3  r  u
4  t  z
5  p  v
> dat1[-c(1:2)]  ##仍是删除1至2列数据
  c3 c4
1  w  i
2  q  w
3  r  u
4  t  z
5  p  v

 

4、重命名行名、列名

rownames(dat1) ##查看行名
[1] "1" "2" "3" "4" "5"
colnames(dat1) ##查看列名
"c1" "c2" "c3" "c4"
rownames(dat1) <- c("d","x","u","f","e") ## 重命行名
rownames(dat1)
[1] "d" "x" "u" "f" "e"
rownames(dat1)[2] ##查看第二个行名
[1] "x"
rownames(dat1)[2] <- "xxxx"  ##重命名第二个行名
rownames(dat1)
[1] "d"    "xxxx" "u"    "f"    "e"   
colnames(dat1) <- c("e","q","i","a") ##重命名列名
colnames(dat1)
[1] "e" "q" "i" "a"
colnames(dat1)[3]  ##查看第三个列名
[1] "i"
colnames(dat1)[3] <- "xxxx" ##重命名第三个列名
colnames(dat1)
[1] "e"    "q"    "xxxx" "a" 

 

5、数据框转置,(行列互换)

dat1 <- data.frame(c1,c2,c3,c4) ##重新生成数据框
dat1
c1 c2 c3 c4
1 1 2 w i
2 2 5 q w
3 3 1 r u
4 4 8 t z
5 5 6 p v
t(dat1) ## 数据框转置
[,1] [,2] [,3] [,4] [,5]
c1 "1" "2" "3" "4" "5" 
c2 "2" "5" "1" "8" "6" 
c3 "w" "q" "r" "t" "p" 
c4 "i" "w" "u" "z" "v"

 

6、依据特定条件过滤数据框数据

c1 <- c(1,3,1,1,3,9)
c2 <- c(2,2,2,8,6,7)
c3 <- c("w","w","r","w","p","u")
c4 <- c("i","i","u","z","v","y")
dat1 <- data.frame(c1,c2,c3,c4) ##重新生成一个测试数据框
dat1
  c1 c2 c3 c4
1  1  2  w  i
2  3  2  w  i
3  1  2  r  u
4  1  8  w  z
5  3  6  p  v
6  9  7  u  y
class(dat1) ##查看类型
[1] "data.frame"
dim(dat1) ##查看数据维度
[1] 6 4
dat1[dat1$c1 == 1,] ##提取数据框中第一列中等于1的数据
  c1 c2 c3 c4
1  1  2  w  i
3  1  2  r  u
4  1  8  w  z
dat1[dat1$c1 == 3,] ##提取数据框中第一列中等于3的数据
  c1 c2 c3 c4
2  3  2  w  i
5  3  6  p  v
dat1[dat1$c3 == "w",] ##提取数据框中第三列中等于w的数据
  c1 c2 c3 c4
1  1  2  w  i
2  3  2  w  i
4  1  8  w  z
dat1[dat1$c1 == 1 & dat1$c2 == 2,]  ##提取数据框中第一列等于1而且第二列等于2的数据
  c1 c2 c3 c4
1  1  2  w  i
3  1  2  r  u
dat1[dat1$c1 == 1 & dat1$c2 ==2 & dat1$c3 == "w",] ##提取数据框中第一列等于1、第二列等于2、并且第三列等于w的数据
  c1 c2 c3 c4
1  1  2  w  i
dat1
  c1 c2 c3 c4
1  1  2  w  i
2  3  2  w  i
3  1  2  r  u
4  1  8  w  z
5  3  6  p  v
6  9  7  u  y
dat1[dat1$c1 ==1 | dat1$c2 == 6,] ##提取数据框中第一列等于1或者第二列等于6的数据
  c1 c2 c3 c4
1  1  2  w  i
3  1  2  r  u
4  1  8  w  z
5  3  6  p  v
dat1[dat1$c1 ==1 | dat1$c2 == 6 | dat1$c4 == "i",] ##提取数据框中第一列等于1或者第二列等于6或者第四列等于i的数据
  c1 c2 c3 c4
1  1  2  w  i
2  3  2  w  i
3  1  2  r  u
4  1  8  w  z
5  3  6  p  v

### "&"号在R中表示而且,"|" 号表示或者。