注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授:
Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
转载
2023-06-30 18:38:28
419阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载
2023-06-25 20:40:28
271阅读
http://blog.sina.com.cn/s/blog_597fcb450100c3um.html 【转】R与SAS、SPSS的比较 (2009-03-05 20:29:40)
转载 标签: 教育分类: 学习R与SAS、SPSS的比较R语言 R是用于统计分析、绘图的语言和操作环境。R是
R语言︱情感分析—基于监督算法R语言实现笔记。可以与博客 R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)对着看。 词典型情感分析大致有以下几个步骤:训练数据集、neg/pos情感词典、分词+数据清洗清洗(一、二、三级清洗步骤)、计算情感得分、模型评价 ———————————————————————————————————————————— 
全面的回归分析包括对异常值的分析:离群点、高杠杆值点、强影响点。 离群点:模型效果不佳的观测点。 使用car包中的outlierTest()函数,可以求得最大标准化残差绝对值Bonferroni调整后的p值,若不显著,则说明数据集中没有离群点,若显著,则必须删除该离群点。 > library(car)
> outlierTest(fit)可见,在这个回归模
转载
2023-08-13 20:56:44
323阅读
(注明:以下文章均在Linux操作系统下执行)一、R语言简介R语言是用于统计分析,图形表示和报告的编程语言和软件环境。R语言由Ross Ihaka和Robert Gentleman在新西兰奥克兰大学创建,目前由R语言开发核心团队开发。R语言的核心是解释计算机语言,其允许分支和循环以及使用函数的模块化编程。R语言允许与以C,C ++,.Net,Python或FORTRAN语言编写的过程集
转载
2023-07-23 20:22:52
309阅读
文章目录1. 仅知道函数的部分名称,想列出全部2. 列出全部有tab字段的函数,或者访问3. 自动补全4. 更改小数点位数5. 显示错误信息6. 升级R,但不想重装packages?7. 卸载已安装的packages8. library()的逆向操作9. 得到加载package的列表10. 读取Excel数据两种方法补充:读取pdf文件11. 在对原数据进行了删除处理,但是希望调出原数据12.
转载
2023-07-21 18:29:31
154阅读
加载可能用到的包library(xml2)
library(rvest)
library(reshape2)
library(ggplot2)
library(dplyr)读取数据打开数据来源的链接,鼠标点击右键检查,将内容复制到文本文件中,我这里命名为new1.txtpage"new1.txt")
JokicJokic[[9]]
list(Jokic)
df1colnames(df1)首先看一看
转载
2023-11-03 12:30:17
96阅读
基本理论知识ARMA模型称为自回归移动平均模型,是时间序列里常用的模型之一。ARMA模型是对不含季节变动的平稳序列进行建模。它将序列值表示为过去值和过去扰动项的加权和。模型形式如下: yt=c+a1yt−1+a2yt−2+...+apyt−p+ϵt−b1ϵt−1−b2ϵt−2−...−bqϵt−qyt=c+a1yt−1+a2yt−2+...+apyt−p+ϵt−b1ϵt−1−b2ϵt−2−...
转载
2023-08-17 16:13:10
174阅读
1 replicationrep 函数能把输入的参数重复数次。另一个相关函数replicate 则能调用表达式数次。大多数情况下它们基本相等,只有当使用随机数时才会出现不同。现在,假定生成均匀分布随机数的runif 函数不是矢量化的,那么rep 函数每次都将重复相同的随机数,而replicate 每次的结果都不相同(由于历史的原因,其参数顺序竟然是从后到前的,这有点烦人):rep(runif(1)
转载
2023-07-09 17:00:04
293阅读
R语言 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R语言特点 R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个
转载
2023-07-25 19:51:49
126阅读
有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,我该迫使我的所有开发人员和数据科学家非要用哪种语言?)这个问题不会推迟太久,迟早要定夺。下面简要
转载
2024-05-15 10:49:15
34阅读
下载和安装Windows环境的R1.进入主页,点击 蓝色加粗的 download R 2.随便点击一个镜像,这里点击的是http://mirror.fcaglp.unlp.edu.ar/CRAN/ 3.点击Download R for Windows 4.点击install R for the first time. 5.点击 Dow
转载
2023-11-03 09:07:58
380阅读
一、预备知识1.使用图形 #绑定数据框mtcarsattach(mtcars)#打开一个图形窗口并生成散点图plot(wt,mpg)#添加一条最优拟合曲线abline(lm(mpg~wt))#图形名称title("aaa")#数据框解除绑定detach(mtcars)2.图形的保存 pdf() 、 win.metafile()、png()、jpeg()、bmp()、tiff()、xfig()等其他
转载
2023-08-10 11:15:26
164阅读
作者:圈圈Getting Data In and Out of R(一)读取数据读取数据所需的几种函数:read.table、 read.csv:最常用的读取列表数据函数,可返回数据框形式。readLines:逐行读取文本文件,返回一个字符向量source:读取R代码、脚本dget:读取R代码(读取的是以逆句法分析后以文本文件储存的R对象)load、 unserialize:把
转载
2023-10-12 11:04:39
144阅读
R 语言实战(第二版)## part 3 中级方法-------------第8章 回归------------------#概念:用一个或多个自变量(预测变量)来预测因变量(响应变量)的方法
#最常用:OLS——普通最小二乘回归法,包括简单线性回归、多项式回归、多元线性回归
#过程:拟合OLS回归模型——>评价拟合优度——>假设检验——>选择模型
#OLS回归
#目标:减少因
转载
2023-08-11 13:56:29
310阅读
plot(x, y, ...)
ylab, xlab: x轴与y轴名称设置参数子标题设置参数ylim, xlim: x轴与y轴数值界限设置参数
type:划线类型
col:划线颜色
lwd:线粗举个栗子:
plot(AvTemp,type="b",col=2,xlab="月份",ylab="平均温度",main="森林地区月平均温度时序折线图",sub = "子标题",lwd=2
转载
2023-08-31 13:52:51
159阅读
函数 par()中的参数可以分为三大类: (
1
) 只可以查询而不可以修改的参数
,
即
readonly
参数:
"cin", "cra", "csi", "cxy", "din" 和
"page"
。( 2
)只能通过
par
函数进行设置的参数
: "ask", "fig", "fin", "lheight", "mai", "mar", "mex"
转载
2023-07-06 16:50:29
274阅读
主要作用:可重现一样的结果R语言中set.seed()作用是设定生成随机数的种子,目的是为了让结果具有重复性,重现结果。不设定种子不行吗?当然可以,但是结果就不能复现。如:x<-rnorm(3) #随机生成3个随机数
结果:1.4197419 -0.7460519 0.3603622
x<-rnorm(3) #再来一遍,生成的3个随机数又不一样了
结果:1.0796213 0.55
转载
2023-06-19 16:17:51
210阅读
一.绘制基本散点图(1)使用plot()函数(2)使用ggplot()函数 heightweight是个多列数据集ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point()ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point(shape=21)二.使用点形和颜色属性
转载
2023-06-19 17:25:29
178阅读