注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授:
Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
转载
2023-06-30 18:38:28
419阅读
HBase和rhbase的安装与使用,分为3个章节。环境准备及HBase安装rhbase安装rhbase程序用例每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。注:Hadoop环境及RHadoop的环境,请查看同系列前二篇文章,此文将不再介绍。环境准备及HBase安装文字说明部分:首先环境准备,这里我选择了Linux Ubuntu操作系统12.0...
转载
2021-06-09 17:32:54
343阅读
六、Hadoop1.x与Hadoop2的区别1、变更介绍Hadoop2相比较于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了很大的提高,Hadoop2中有两个重要的变更:l HDFS的NameNodes可以以集群的方式布署,增强了NameNodes的水平扩展能力和可用性;l MapReduce将JobTracker中的资源管
转载
2023-07-24 10:50:30
32阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载
2023-06-25 20:40:28
271阅读
http://blog.sina.com.cn/s/blog_597fcb450100c3um.html 【转】R与SAS、SPSS的比较 (2009-03-05 20:29:40)
转载 标签: 教育分类: 学习R与SAS、SPSS的比较R语言 R是用于统计分析、绘图的语言和操作环境。R是
R 语言作为我工作使用的第一门语言(有点初恋女友的感觉,羞涩), 所以颇有感情,也是它让我认识到了很多勤奋好学又独立的优秀的妹纸们(可惜她们都不是我的女票,泪崩),但是在现在 python 如日中天,连 kaggle 上的数据科学家们八成,甚至是九成都在使用 python 了,所以不能怪哥移情别恋,是现实太残酷。目前个人觉得是 Rstudio 公司撑起了 R 的商业应用,虽然微软爸爸也之前也
转载
2023-08-22 23:39:08
73阅读
基本理论知识ARMA模型称为自回归移动平均模型,是时间序列里常用的模型之一。ARMA模型是对不含季节变动的平稳序列进行建模。它将序列值表示为过去值和过去扰动项的加权和。模型形式如下: yt=c+a1yt−1+a2yt−2+...+apyt−p+ϵt−b1ϵt−1−b2ϵt−2−...−bqϵt−qyt=c+a1yt−1+a2yt−2+...+apyt−p+ϵt−b1ϵt−1−b2ϵt−2−...
转载
2023-08-17 16:13:10
174阅读
R语言和集算器吸引人的地方之一在于,它们的代码风格都比较敏捷,用简短的代码就可以实现丰富的功能。比如都可以写出”Vector Computing”表达式,对判断语句都进行了简化,都可以把基础函数扩展成高级函数,都支持泛型。其中向量化计算的特点是用函数和运算符处理批量数据,避免循环语句。这将带来2个优点:使程序员可以轻松掌握,降低学习成本;方便实现计算,提高性能。下面用几个例子来比较一下R和集算器在
转载
2023-08-18 13:01:45
159阅读
有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,我该迫使我的所有开发人员和数据科学家非要用哪种语言?)这个问题不会推迟太久,迟早要定夺。下面简要
转载
2024-05-15 10:49:15
34阅读
作者:丁点helper 前面的文章提到,R语言是一门针对『对象』的语言,这里说的对象,最主要的就是数据。R可以创建、读取、处理多种类型的数据。今天先讲一些基本概念。R语言中的数据类型稍微接触过统计的同学应该很熟悉下图所示的变量类型,R中的多种数据类型可以满足各类变量的表达,我们逐一讲解: 1. 数值型(numeric):数据的内容为数字。上图中,定量变量和定性变量都可以用数值
转载
2023-09-12 17:20:07
66阅读
下载和安装Windows环境的R1.进入主页,点击 蓝色加粗的 download R 2.随便点击一个镜像,这里点击的是http://mirror.fcaglp.unlp.edu.ar/CRAN/ 3.点击Download R for Windows 4.点击install R for the first time. 5.点击 Dow
转载
2023-11-03 09:07:58
380阅读
一、预备知识1.使用图形 #绑定数据框mtcarsattach(mtcars)#打开一个图形窗口并生成散点图plot(wt,mpg)#添加一条最优拟合曲线abline(lm(mpg~wt))#图形名称title("aaa")#数据框解除绑定detach(mtcars)2.图形的保存 pdf() 、 win.metafile()、png()、jpeg()、bmp()、tiff()、xfig()等其他
转载
2023-08-10 11:15:26
164阅读
一个关于 R作直方图的小例子 2010-04-27 19:31:36| 分类: R&Bioconductor|举报|字号订阅
首先是一串很简单的数据,有30个元素: 把它逐行打到一个TXT文件中去,命名为ex1.txt,保存在目录E:\Da 105
93
80 109 112
88
加载可能用到的包library(xml2)
library(rvest)
library(reshape2)
library(ggplot2)
library(dplyr)读取数据打开数据来源的链接,鼠标点击右键检查,将内容复制到文本文件中,我这里命名为new1.txtpage"new1.txt")
JokicJokic[[9]]
list(Jokic)
df1colnames(df1)首先看一看
转载
2023-11-03 12:30:17
96阅读
作者:圈圈Getting Data In and Out of R(一)读取数据读取数据所需的几种函数:read.table、 read.csv:最常用的读取列表数据函数,可返回数据框形式。readLines:逐行读取文本文件,返回一个字符向量source:读取R代码、脚本dget:读取R代码(读取的是以逆句法分析后以文本文件储存的R对象)load、 unserialize:把
转载
2023-10-12 11:04:39
144阅读
在既往文章中,我们已经介绍了R语言计算人年及可信区间的计算。但是计算的是总的人年发病率的比较情况,假如我们想知道分层发病率的情况呢?拿既往乳腺癌的数据为例子,我们已经知道了有淋巴结肿大和没有淋巴结肿大患者总的生存率的比较,但是如果我们想了解在每个年龄段有淋巴结肿大和没有淋巴结肿大患者生存率有无区别?如下图 我们以R语言survival包演示泊松回归年龄分层发病率统计,继续使用我们的乳腺癌数据(公众
转载
2023-08-30 19:55:00
138阅读
主要作用:可重现一样的结果R语言中set.seed()作用是设定生成随机数的种子,目的是为了让结果具有重复性,重现结果。不设定种子不行吗?当然可以,但是结果就不能复现。如:x<-rnorm(3) #随机生成3个随机数
结果:1.4197419 -0.7460519 0.3603622
x<-rnorm(3) #再来一遍,生成的3个随机数又不一样了
结果:1.0796213 0.55
转载
2023-06-19 16:17:51
210阅读
一.绘制基本散点图(1)使用plot()函数(2)使用ggplot()函数 heightweight是个多列数据集ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point()ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point(shape=21)二.使用点形和颜色属性
转载
2023-06-19 17:25:29
178阅读
文章目录一、数据调用与预处理二、一元线性回归分析三、多元线性回归分析(一)解释变量的多重共线性检测(二)多元回归1. 多元最小二乘回归2. 逐步回归(三)回归诊断四、模型评价-常用的准则统计量 一、数据调用与预处理本文使用的数据为R语言自带数据集“iris”。iris数据集包含5个变量: 数值变量:Sepal.Length, Sepal.Width, Petal.Length, Petal.Wi
转载
2023-07-18 11:44:04
52阅读
目录使用R中的ggplot2进行微阵列可视化(红绿热图)1、常用的方法:biclust包1.1 biclust包的安装1.2 导入biclust包1.3 生成一些测试数据1.4 调用drawHeatmap()函数绘制热图2、ggplot2绘制红绿热图2.1 ggplot2、reshape2包的安装1.2 导入ggplot2、reshape2包1.3 生成要绘制微阵列的模拟数据1.3 对数据进行相
转载
2023-07-18 16:36:05
161阅读