查看数据是不是数据框,is系列的函数还有很多,主要用于
编程时对数据类型的判断
利用as.state函数将数据转换为想要的格式
利用methods函数查看某一系列函数有多少,具体都是什么
向量可以转换为其他数据格式
将向量转换为矩阵:dim函数用于重新设置变量的维数
将向量转换为因子:
将向量转换为列表:
查看数据框的行和列
行:查看行时,必须用名字索引,且名字索引后必须有逗号
列:
查看列时可以用$,例如:
取消列名可以用unname函数
转换为向量
which函数的应用
# 新建数组
a=c(1,3,4,5,3,2,5,6,3,2,5,6,7,5,8)
# 取数组a中最大值的下标
which.max(a)
# 取数组a中最小值的下标
which.min(a)
# 取数组a中大于3值的下标
which(a>3)
数据框的添加和合并
将市的时间汇聚到省,然后汇总
合并列可用
也可以用
合并行(rbind函数)要求新数据和原数据有相同的列名
合并的数据存在重复值时,查看一共多少行:先用rownames函数
查看行名,然后用length函数计算rownames函数结果的个数
选中重复项:duplicated(data,)
选中非重复项:!uplicated(data,)
查看没有重复的数据有多少
也可以用unique函数
转置:t函数
行列转置
只转置某一行:使用rev函数
rev用于向量:
rev转置数据框分四步
一、查看数据框
二、用rownames函数查看数据框索引
三、用rev函数对数据框的索引进行转置
四、对数据框使用新的索引
修改数据框中的值(对某一列进行操作)
方法一
1、先拿出要操作的列的数据
2、对该列进行相应计算
3、用data.frame函数重新组合数据框
方法二:
transfrom函数
transform(women,height=height*2.54)
重新生成一列
对数据框进行排序:sort(仅向量)、order(对向量进行排序时,返回值为向量的位置即索引,不是向量排序的结果;取order默认相反的顺序时,在order前加#即可)、rank(返回值为向量对应的排名)
sort(x)是对向量x进行排序,返回值排序后的数值向量。rank()是求秩的函数,它的返回值是这个向量中对应元素的“排名”。而order()的返回值是对应“排名”的元素所在向量中的位置。
对数据框进行数学计算
1、将数据格式修改为数据框
2、求行总和
3、求列平均值
4、添加总和列
5、添加行平均值