R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。与Excel不同之处在于merge函数有4种匹配拼接模式,分别为inner,left,right和outer模式。 其中inner为默认的匹配模式,可与sql语言中的join语句用法。merge 连接两个数据,官方参考文档语法merge(x, y, by = intersect(names(x), n
转载 2024-02-19 20:14:47
75阅读
#include <cstdio> #include <cstring> #include <algor...
原创 2022-06-16 06:24:23
23阅读
Evelyn likes drawing very much. Today, she draws lots of rainbows on
原创 2022-11-10 08:07:34
90阅读
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
http://blog.sina.com.cn/s/blog_597fcb450100c3um.html  【转】R与SAS、SPSS的比较  (2009-03-05 20:29:40) 转载 标签: 教育分类: 学习R与SAS、SPSS的比较R语言 R是用于统计分析、绘图的语言和操作环境。R
全面的回归分析包括对异常值的分析:离群点、高杠杆值点、强影响点。 离群点:模型效果不佳的观测点。 使用car包中的outlierTest()函数,可以求得最大标准化残差绝对值Bonferroni调整后的p值,若不显著,则说明数据集中没有离群点,若显著,则必须删除该离群点。 > library(car) > outlierTest(fit)可见,在这个回归模
转载 2023-08-13 20:56:44
323阅读
作者:圈圈Getting Data In and Out of R(一)读取数据读取数据所需的几种函数:read.table、 read.csv:最常用的读取列表数据函数,可返回数据框形式。readLines:逐行读取文本文件,返回一个字符向量source:读取R代码、脚本dget:读取R代码(读取的是以逆句法分析后以文本文件储存的R对象)load、 unserialize:把
转载 2023-10-12 11:04:39
144阅读
plot(x, y, ...) ylab, xlab:  x轴与y轴名称设置参数子标题设置参数ylim, xlim: x轴与y轴数值界限设置参数 type:划线类型 col:划线颜色 lwd:线粗举个栗子: plot(AvTemp,type="b",col=2,xlab="月份",ylab="平均温度",main="森林地区月平均温度时序折线图",sub = "子标题",lwd=2
转载 2023-08-31 13:52:51
159阅读
函数 par()中的参数可以分为三大类: ( 1 ) 只可以查询而不可以修改的参数 , 即 readonly 参数: "cin", "cra", "csi", "cxy", "din" 和 "page" 。( 2 )只能通过 par 函数进行设置的参数 : "ask", "fig", "fin", "lheight", "mai", "mar", "mex"
转载 2023-07-06 16:50:29
274阅读
R 语言实战(第二版)## part 3 中级方法-------------第8章 回归------------------#概念:用一个或多个自变量(预测变量)来预测因变量(响应变量)的方法 #最常用:OLS——普通最小二乘回归法,包括简单线性回归、多项式回归、多元线性回归 #过程:拟合OLS回归模型——>评价拟合优度——>假设检验——>选择模型 #OLS回归 #目标:减少因
基本理论知识ARMA模型称为自回归移动平均模型,是时间序列里常用的模型之一。ARMA模型是对不含季节变动的平稳序列进行建模。它将序列值表示为过去值和过去扰动项的加权和。模型形式如下: yt=c+a1yt−1+a2yt−2+...+apyt−p+ϵt−b1ϵt−1−b2ϵt−2−...−bqϵt−qyt=c+a1yt−1+a2yt−2+...+apyt−p+ϵt−b1ϵt−1−b2ϵt−2−...
转载 2023-08-17 16:13:10
174阅读
下面录入文法文件,运行ANTLRWorks点击“File– New”菜单新建文法文件,在新文件中将前面的文法录入。(我的网站中有本书所有示例源代码,但我建议您还是手工录入一遍。这样您会有更好的学习效果。)录入文法后点击“File – Save” 菜单文件名为“E.g”。然后点击“Generate–GenerateCode”,如果ANTLRWorks提示“The grammar has been s
转载 2023-12-25 13:47:17
41阅读
R语言和集算器吸引人的地方之一在于,它们的代码风格都比较敏捷,用简短的代码就可以实现丰富的功能。比如都可以写出”Vector Computing”表达式,对判断语句都进行了简化,都可以把基础函数扩展成高级函数,都支持泛型。其中向量化计算的特点是用函数和运算符处理批量数据,避免循环语句。这将带来2个优点:使程序员可以轻松掌握,降低学习成本;方便实现计算,提高性能。下面用几个例子来比较一下R和集算器在
转载 2023-08-18 13:01:45
165阅读
高级数据管理数值和字符处理函数数学函数函数描述np.abs(x)绝对值np.sqrt(x)平方根np.ceil(x)大于x的最小整数np.floor(x)小于x的最大整数np.trunc(x)向0截取x中的整数部分np.round(x, decimals=2)将x舍入为指定位的小数np.cos(x)/sin(x)/tan(x)余弦/正弦/正切np.arccos(x)/arcsin(x)/acrta
转载 2024-07-12 18:50:33
46阅读
一、预备知识1.使用图形 #绑定数据框mtcarsattach(mtcars)#打开一个图形窗口并生成散点图plot(wt,mpg)#添加一条最优拟合曲线abline(lm(mpg~wt))#图形名称title("aaa")#数据框解除绑定detach(mtcars)2.图形的保存 pdf() 、 win.metafile()、png()、jpeg()、bmp()、tiff()、xfig()等其他
转载 2023-08-10 11:15:26
164阅读
在既往文章中,我们已经介绍了R语言计算人年及可信区间的计算。但是计算的是总的人年发病率的比较情况,假如我们想知道分层发病率的情况呢?拿既往乳腺癌的数据为例子,我们已经知道了有淋巴结肿大和没有淋巴结肿大患者总的生存率的比较,但是如果我们想了解在每个年龄段有淋巴结肿大和没有淋巴结肿大患者生存率有无区别?如下图 我们以R语言survival包演示泊松回归年龄分层发病率统计,继续使用我们的乳腺癌数据(公众
转载 2023-08-30 19:55:00
138阅读
 下载和安装Windows环境的R1.进入主页,点击 蓝色加粗的 download R 2.随便点击一个镜像,这里点击的是http://mirror.fcaglp.unlp.edu.ar/CRAN/ 3.点击Download R for Windows  4.点击install R for the first time. 5.点击 Dow
转载 2023-11-03 09:07:58
380阅读
R语言是为数学工作者设计的一种数学编程语言,主要用于统计分析。绘图、数据挖掘。R语言是一种解释型的面向数学理论工作者的语言,与C语言同样是出自贝尔实验室之手,但是C语言是面向计算机软件工程师设计的。R 语言的特点R语言属于GNU开源软件,兼容性好,使用免费语法十分有利于复杂的数学运算数据类型丰富,包括向量、矩阵、因子、数据集等常用数据结构代码风格好,可读性强R环境安装R语言的开发环境本身具备了图形
R语言︱情感分析—基于监督算法R语言实现笔记。可以与博客 R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)对着看。 词典型情感分析大致有以下几个步骤:训练数据集、neg/pos情感词典、分词+数据清洗清洗(一、二、三级清洗步骤)、计算情感得分、模型评价 ————————————————————————————————————————————&nbsp
R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2,3,4.....还有统计量的水平的时候用到的高、中、低,也是因子,因为他是一个点。与之区别的向量,是一个连续性的值,例如,数值中有1,1.1,1.2......可以作为数值来计算,而因子则不可以。如果用我自己的理解,简单通俗来讲:因子是一个点,向
转载 2023-06-21 22:48:48
223阅读
  • 1
  • 2
  • 3
  • 4
  • 5