注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载 2023-06-25 20:40:28
271阅读
最近几年关于利用shiny做web框架的需求越来越多,出去交流也经常有爱好者咨询如何学习shiny包(个人觉得RStuido官网的shiny学习资料是最快上手的途径之一)。今天晚上刚好给学员直播完shiny包的基本知识,顺便也写一篇关于shiny的扫盲文章出来,希望能对想学习shiny包的朋友有一点点启发。Shiny是R中的一种Web开发框架,使得R的使用者不必太了解css、js只需要了解一些ht
转载 2023-08-31 20:35:25
84阅读
      在 R 里面 numeric 类型包含了很多子类型,其中最常见的就是 double 和 integer, 但因为最常用的是 double, 除非你特别标明是 integer (用 as.integer), 系统都会认为是 double。     那为什么要有 integer 这个类型呢? 一是为了
转载 2023-06-02 16:16:31
226阅读
R语言是一种利基语言,除了研究学者和数据科学家,大部分的开发者对于这种动态语言都持欣赏的态度。当然,对于一个1993年首次开发的编程语言来说,R语言用户通过三百多万其实也没有太了不起。没错儿,R的年龄确实不算太小,但是由于缺乏JIT,所以R通常会很慢。R也是内存占用者,这是因为它有较大的对象,大量分配,并且有一个不移动的垃圾收集器。此外,R具有复杂的语义,这使得本科生和研究生很难在数据科学实验室中
转载 2023-09-07 21:18:28
117阅读
  在计量经济学中,经常要对时间序列数据进行回归建模。时间序列数据通常具有异方差(Heteroscedasticity)和自相关(Autocorrelation)的性质,此时使用传统的最小二乘法(OLS)估计回归参数虽然仍可得到参数的无偏估计,但是传统方法计算出来的参数方差具有偏差,会导致参数的t检验不准确,常出现虚假显著的情况。为避免这种情况,计量经济学中常对上述参数的方差进行调整,最常用的是N
高级数据管理简单的数据管理只是有效的管理数据,二高级数据管理则是更近一步,只有充分了解r语言的控制流程,算术函数等,才可以更高效的处理数据。 为了方便,以下所有的分析,我都会基于r提供的原始数据进行分析。本节目的学习用于创建和转换变量的算术函数、字符处理函数和统计函数。探索控制程序流程的方式之后,了解如何编写自己的函数。如何使用这些函数来整合及概括数据。一. 数值和字符处理函数> abs(x
转载 2023-09-19 21:30:17
101阅读
Nomogram,中文常称为诺莫图或者列线图,简单的说是将Logistic回归或Cox回归的结果进行可视化呈现。它根据所有自变量回归系数的大小来制定评分标准,给每个自变量的每种取值水平一个评分,对每个患者,就可计算得到一个总分,再通过得分与结局发生概率之间的转换函数来计算每个患者的结局时间发生的概率。 下图显示的 logisitc 回归的诺曼图。比如想知道年龄 70 岁的男性的患病风险,
转载 2023-09-10 15:14:22
183阅读
R语言使用dplyr包的groupby函数和summarise函数计算dataframe中不同分组的均值(分组为离散变量、被统计列为连续变量)目录R语言使用dplyr包的groupby函数和summarise函数计算dataframe中不同分组的均值(分组为离散变量、被统计列为连续变量)#导入包和库仿真数据1仿真数据2仿真数据3仿真数据4仿真数据5 R语言使用dplyr包的groupby
  R语言是进行统计分析和可视化的优秀语言(其实机器学习和网页制作也可以用R,小声说~|ω`))  R语言  相信大家在利用R语言进行数据分析的时候可能会有大数据分析需求。所谓大数据,很好理解,就是大样本高维度数据,这样的数据在当今信息爆炸时代,很是常见。比如医学数据,数据量大,维度极高,因为医学的检测指标多,而且随着基因测序特别是二代测序等高通量测序(High-throughput sequen
转载 2023-05-28 15:09:11
210阅读
安装R和Rstuido软件 R语言是用于统计分析,图形表示和报告的编程语言和软件环境;Rstudio是编辑、运行R语言的最为理想的工具之一。1、官网下载R安装包 下载地址为:https://cran.r-project.org 进入链接,如下图所示,在页面顶部提供了三个下载链接,分别对应三种操作系统:Windows、Mac和Linux。请选择自己操作系统对应的链接,接下来我将以windows为例给
R语言编译器中,设置当前工作文件夹可以用setwd()函数。> setwd("e://桌面//")> setwd("e:\桌面\")> setwd("e:/桌面/")这三种结构都是可以编译通过的,但是在VS C#中却不行,只有一种能运行成功。(PS:R语言在VS中运行要先配置环境,还没配置的童鞋先要配置好,才可运行,如有问题可看我前面的随笔。)就是这种结构,engine.Eva
转载 2023-05-26 08:50:28
281阅读
  上一节我们对自然语言处理中词性标注的基本问题进行了描述,从本节开始我们将详细介绍HMM与词性标注的关系以及如何利用HMM进行词性标注。首先回顾一下隐马尔科夫模型(HMM)的定义和三大基本问题,并由此与词性标注的基本问题进行一个对比。   隐马尔科夫模型(HMM)是什么?说白了,就是一个数学模型,用一堆数学符号和参数表示而已,包括隐藏状态集合、观察符号集合、初始概率向量pi, 状态转移矩阵A,混
转载 2023-11-01 21:50:42
98阅读
本文讲述R语言中apply家族的函数的使用方法。一、lapply 最好不要试图一开始就用apply函数,因为它比lapply函数复杂。lapply函数是apply家族的函数中逻辑最简单、版本兼容性、最user-friendly的函数。你甚至可以用lapply这一个函数打天下。其基本语法为:lapply(Vector, function(ii) { ... })。例如,有这样一个data.frame
转载 2023-06-16 19:39:15
111阅读
简介R语言主要用于数据可视化与统计分析,当然现在也可以通过扩展包实现数据挖掘等算法。与Python相比,R语言相当于天生就加载了NumPy,SciPy,Pandas的大多数功能。现在来介绍一些R语言的基本知识。正文一,入门操作1, 包(1)下载包install.packages( c("xts", "zoo"), lib = "some/other/folder/to/install/to",
转载 2023-08-15 21:49:10
143阅读
R中还有一个有趣的sqldf包,它可以让你用SQL来操作dataframe,这种功能能让会R的人能练习SQL,会SQL的人能练习R,不得不感叹R语言的强大技能和神奇魅力。 当然也可以将R与外部数据库连接,直接在R中操作数据库,并生成最终结果,这也是一种可行的方法。在R中连接数据库需要安装其它的扩展包,根据连接方式不同我们有两种选择:一种是ODBC方式,需要安装RODBC包并安装ODBC驱动。另一
转载 2023-08-08 17:17:47
121阅读
R语言入门学习笔记 从2018年秋季(大二上学期)开始接触R语言,曾在2019年寒假读过一遍本书的第一版,感觉受益匪浅,之后遇到问题也曾回头来查阅这本书,前几天刚学习过Simulink,趁现在有空再来温习这本书,回顾一下代码和各种命令,简单记录。虽然感觉R的功能和用途不如MATLAB广泛,但是需要派上用场的时候如果能熟练地运用真的是很好的体验。R用方括号
转载 2023-06-25 11:56:37
312阅读
玩转数据可视化之R语言ggplot2?个人主页:JoJo的数据分析历险记 ?个人介绍:小编大四统计在读,目前保研到统计学top3高校继续攻读统计研究生?如果文章对你有帮助,欢迎关注、点赞、收藏、订阅专栏本系列主要介绍R语言ggplot2的使用参考资料:ggplot2: Elegant Graphics for Data Analysis文章目录玩转数据可视化之R语言ggplot2?7.ggplot
转载 2023-07-04 14:12:26
229阅读
R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表,下面来为大家简单介绍一下标量标量是只含一个元素的向量,例如f <- 3、g <- "US"和h <- TRUE。它们用于保存常量向量函数c,是组合函数a <- c(1, 2, 5, 3, 6, -2, 4) b <- c("one", "two", "three") c <- c(TR
转载 2023-08-31 16:10:04
93阅读
bigmemory: 管理大规模矩阵的共享内存以及映射文件1 描述bigmemory        bigmemory负责创建,存储,访问和操作大量的矩阵。矩阵,默认情况下会分配给共享内存并且可以使用内存映射文件。        biganalytics,&n
转载 2023-07-04 13:42:52
388阅读
  • 1
  • 2
  • 3
  • 4
  • 5