注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载 2023-06-25 20:40:28
271阅读
http://blog.sina.com.cn/s/blog_597fcb450100c3um.html  【转】R与SAS、SPSS的比较  (2009-03-05 20:29:40) 转载 标签: 教育分类: 学习R与SAS、SPSS的比较R语言 R是用于统计分析、绘图的语言和操作环境。R
一个关于 R作直方图的小例子  2010-04-27 19:31:36|  分类: R&Bioconductor|举报|字号订阅 首先是一串很简单的数据,有30个元素: 把它逐行打到一个TXT文件中去,命名为ex1.txt,保存在目录E:\Da 105 93 80 109 112 88
转载 2月前
377阅读
加载可能用到的包library(xml2) library(rvest) library(reshape2) library(ggplot2) library(dplyr)读取数据打开数据来源的链接,鼠标点击右键检查,将内容复制到文本文件中,我这里命名为new1.txtpage"new1.txt") JokicJokic[[9]] list(Jokic) df1colnames(df1)首先看一看
R语言和集算器吸引人的地方之一在于,它们的代码风格都比较敏捷,用简短的代码就可以实现丰富的功能。比如都可以写出”Vector Computing”表达式,对判断语句都进行了简化,都可以把基础函数扩展成高级函数,都支持泛型。其中向量化计算的特点是用函数和运算符处理批量数据,避免循环语句。这将带来2个优点:使程序员可以轻松掌握,降低学习成本;方便实现计算,提高性能。下面用几个例子来比较一下R和集算器在
转载 2023-08-18 13:01:45
159阅读
 下载和安装Windows环境的R1.进入主页,点击 蓝色加粗的 download R 2.随便点击一个镜像,这里点击的是http://mirror.fcaglp.unlp.edu.ar/CRAN/ 3.点击Download R for Windows  4.点击install R for the first time. 5.点击 Dow
转载 2023-11-03 09:07:58
380阅读
一、预备知识1.使用图形 #绑定数据框mtcarsattach(mtcars)#打开一个图形窗口并生成散点图plot(wt,mpg)#添加一条最优拟合曲线abline(lm(mpg~wt))#图形名称title("aaa")#数据框解除绑定detach(mtcars)2.图形的保存 pdf() 、 win.metafile()、png()、jpeg()、bmp()、tiff()、xfig()等其他
转载 2023-08-10 11:15:26
164阅读
在既往文章中,我们已经介绍了R语言计算人年及可信区间的计算。但是计算的是总的人年发病率的比较情况,假如我们想知道分层发病率的情况呢?拿既往乳腺癌的数据为例子,我们已经知道了有淋巴结肿大和没有淋巴结肿大患者总的生存率的比较,但是如果我们想了解在每个年龄段有淋巴结肿大和没有淋巴结肿大患者生存率有无区别?如下图 我们以R语言survival包演示泊松回归年龄分层发病率统计,继续使用我们的乳腺癌数据(公众
转载 2023-08-30 19:55:00
138阅读
作者:丁点helper 前面的文章提到,R语言是一门针对『对象』的语言,这里说的对象,最主要的就是数据。R可以创建、读取、处理多种类型的数据。今天先讲一些基本概念。R语言中的数据类型稍微接触过统计的同学应该很熟悉下图所示的变量类型,R中的多种数据类型可以满足各类变量的表达,我们逐一讲解: 1. 数值型(numeric):数据的内容为数字。上图中,定量变量和定性变量都可以用数值
回归分析是科学研究中十分重要的数据分析工具。随着现代统计技术发展,回归分析方法得到了极大改进。混合效应模型(Mixed effect model),或称多水平模型(Multilevel model)/分层模型(Hierarchical Model)/嵌套模型(Nested Model),无疑是现代回归分析中应用最为广泛的统计模型,代表了现代回归分析主流发展方向。混合效应模型形式灵活可以应对现代科学
作者:圈圈Getting Data In and Out of R(一)读取数据读取数据所需的几种函数:read.table、 read.csv:最常用的读取列表数据函数,可返回数据框形式。readLines:逐行读取文本文件,返回一个字符向量source:读取R代码、脚本dget:读取R代码(读取的是以逆句法分析后以文本文件储存的R对象)load、 unserialize:把
转载 2023-10-12 11:04:39
144阅读
3 数组数组类似于矩阵,其维度可以大于2.数组可以通过array函数创建,形式如下:> setarray <- array(vector,dimensions,dimnames)其中,vector包含了数组中的数据;dimensions是一个数值型向量,给出了各维度下标的最大值;而dimensions是可选的、各维度名称标签的列表。举个例子:> dim1 <- c("x1"
转载 2023-09-05 23:22:54
115阅读
文章目录一、数据调用与预处理二、一元线性回归分析三、多元线性回归分析(一)解释变量的多重共线性检测(二)多元回归1. 多元最小二乘回归2. 逐步回归(三)回归诊断四、模型评价-常用的准则统计量 一、数据调用与预处理本文使用的数据为R语言自带数据集“iris”。iris数据集包含5个变量: 数值变量:Sepal.Length, Sepal.Width, Petal.Length, Petal.Wi
主要作用:可重现一样的结果R语言中set.seed()作用是设定生成随机数的种子,目的是为了让结果具有重复性,重现结果。不设定种子不行吗?当然可以,但是结果就不能复现。如:x<-rnorm(3) #随机生成3个随机数 结果:1.4197419 -0.7460519 0.3603622 x<-rnorm(3) #再来一遍,生成的3个随机数又不一样了 结果:1.0796213 0.55
转载 2023-06-19 16:17:51
210阅读
一.绘制基本散点图(1)使用plot()函数(2)使用ggplot()函数  heightweight是个多列数据集ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point()ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point(shape=21)二.使用点形和颜色属性
转载 2023-06-19 17:25:29
178阅读
高级数据管理数值和字符处理函数数学函数函数描述np.abs(x)绝对值np.sqrt(x)平方根np.ceil(x)大于x的最小整数np.floor(x)小于x的最大整数np.trunc(x)向0截取x中的整数部分np.round(x, decimals=2)将x舍入为指定位的小数np.cos(x)/sin(x)/tan(x)余弦/正弦/正切np.arccos(x)/arcsin(x)/acrta
转载 2024-07-12 18:50:33
46阅读
温故而知新6.函数6.5 自定义函数基本使用> ce2fa <- function(ce){ + fa <- 1.8 * ce + 32 + return(fa) + } > ce2fa(0) [1] 32 > ce2fa(0:10) [1] 32.0 33.8 35.6 37.4 39.2 41.0 42.8 44.6 46.4 48.2 50.0 &gt
转载 2023-08-23 14:20:17
7阅读
R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2,3,4.....还有统计量的水平的时候用到的高、中、低,也是因子,因为他是一个点。与之区别的向量,是一个连续性的值,例如,数值中有1,1.1,1.2......可以作为数值来计算,而因子则不可以。如果用我自己的理解,简单通俗来讲:因子是一个点,向
转载 2023-06-21 22:48:48
223阅读
文本分词,就是对文本进行合理的分割,从而可以比较快捷地获取关键信息。例如,电商平台要想了解更多消费者的心声,就需要对消费者的文本评论数据进行内在信息的数据挖掘分析,而文本分词是文本挖掘的重要步骤。R语言中,对中文分词支持较好的包有RWordseg包和jiebaR包,这里学习jiebaR包。一、jiebaR包简介jiebaR 是中文分词的R语言版本,支持最大概率法(Maximum Probabili
转载 2022-05-21 11:46:00
477阅读
  • 1
  • 2
  • 3
  • 4
  • 5