原文链接:http://www.datastudy.cc/to/53
网上有网友问到:在一个文件夹下,收集了几个股票数据的文件,对应的股票名称为第2列,对应的时间为第3列,对应的收盘价为第10列。
现在想做到下图所示的效果,也就是行为时间,列为对应的股票的收盘价,如何使用R语言来实现呢?
其实非常地简单,这个就是我们《R数据分析实战》(http://www.datastudy.cc/to/48,请右键在新标签页中打开链接)中的交叉分析法的一个应用,下面我们来演示一下如何实现这个效果。
数据文件,请大家从百度盘中自行下载:
链接: http://pan.baidu.com/s/1hqARwpu 密码: xx13
allData <- NULL;
files <- list.files("D://data", recursive=T)
#合并文件,把所有数据合并到allData变量中
for(file in files) {
fileName <- paste("D://data//", file, sep="");
data <- read.csv(fileName, stringsAsFactors = FALSE);
if(is.null(allData)) {
allData = data.frame(data[, c(2, 3, 10)]);
} else {
allData <- rbind(allData, data[, c(2, 3, 10)]);
}
};
#进行交叉分析,即可得到结果
result <- tapply(allData$收盘价, list(allData$交易日期, allData$股票名称), FUN=sum)
至于交叉分析的详细内容,请参考《R数据分析实战》(http://www.datastudy.cc/to/48,请右键在新标签页中打开链接)中的章节。