一、根据时间范围筛选数据

数据的格式是,N行4列的dataframe,时间范围跨度很长,想筛选出其中某一段时间范围的数据,方法有几种:

(1)运用filter函数

library(dplyr)
ab<-a %>% filter(year(date)>=2000&year(date)<=2010)

(2)运用subset函数

startdate <- as.Date(“2000-01-01”) #生成起止时间
enddate <- as.Date(“2010-12-31”)
ab<-subset(a,date>=startdate & date<=enddate,select=c(date,STCD5,DT,DPR))

二、删除重复值

原始数据中,有重复的日期,根据日期列,删除该行数据。

(1)运用duplicate函数

abc<-ab[!duplicated(ab$date),] #ab是数据框格式

(2)运用unique函数

date_num<-unique(ab$date) #删除日期中重复值
abc<- ab[date_num,] #与duplicate结果一样