创建数组 数组是矩阵的扩展,它把数据的维度扩展到两个以上。这意味着数组中的元素需要两个以上的索引。除此之外,数组与矩阵类似,可以用相同的方法使用。与函数matrix()类似,可以通过函数array()方便地创建数组。
数据的数组,其维度是253。在结果中会依次展示3个2行5列的矩阵。数组的索引 与矩阵还有向量类似,数组也可以通过下标和方括号来索引数组中的元素。不同的是数组的维度更高,下标也更为复杂。实例:数组索引的几种方式
xc(dim1c(“dim2c(“dim3c(“ac(a[2,4,1]a[“A2”,“B4”,“C1”]dim(a)
列表和数据框
列表list和数据框data.frame也是一个二维数据,其中向量vector、多维数组array以及矩阵matrix存储的元素,其数据类型是唯一的。列表和数据框内每列元素的数据类型可以不同,列表内的长度也可以不同。
一般地,在使用R语言进行数据分析和挖掘的过程中,向量和数据框的使用频率是最高的,list则在存储较复杂的数据时作为数据对象类型。
l列表和数据框内的每列的元素的数据类型可以不同,列表内的长度也可以不同
数据框创建
数据框是仅次于向量的最重要的数据对象类型。在R语言中,很多数据分析算法函数的输入对象都是数据框对象。而且,在使用读取excel/txt等格式数据集的函数时,也是以数据框对象输入的。类似于list,数据框也可以由不同的向量作为列来合成,并且不同列之间的元素可以是不同的数据类型。但是数据框并没有list那么灵活,数据框内每个列的长度必须相同。在实际操作中,通常会用数据框的一列代表某一变量属性的所有取值,用一行代表某一样本数据。
data.frame()函数可以直接把多个向量建立成为一个数据框,并为列设置名称
ac(1,3,5,7),c2=c(“a”,“b”,“c”,“d”),c3=c(3,5,6,7),row.names = c(“r1”,“r2”,“r3”,“r4”))
data_iris[,[1:2]],这种格式是不对的。data_iris[,1:2],以数据框返回前两列。data_iris[[2]],以数值返回第二列。data_iris[2,],以数据框返回前两行
数据框多列的读取。[1:2,c(1,3)]
names(数据框名) 查看数据框列明
rownames(数据框名) 查看数据框行明
返回数据框行列的数量:
nrow()
ncol()
nrow(),ncol()
names(数据框名称)查看数据框的列名
rownames(数据框名称)查看数据框的行名
数据框索引
数据框的索引和矩阵类似,由于都是二维数据,所以它也有两个维度的下标,同时数据框的列名称也可以方便地索引数据框的列数据。
索引列
iris$Sepal.Lengthiris[[“Sepal.Length”]]iris[[2]]iris[, 2]
如果想要读取多列的数据,则可以按照[,列下标向量]方式来获取元素,并以数据框对象的形式返回。注意,不可以采用[[列下标向量]]形式。如:iris[, 1:2]
索引行
通过[行下标, ],可以直接获取相应行的所有元素,并以数据框对象形式返回。例如:iris[1:2, ]