注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授:
Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
转载
2023-06-30 18:38:28
419阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载
2023-06-25 20:40:28
271阅读
上一节我们对自然语言处理中词性标注的基本问题进行了描述,从本节开始我们将详细介绍HMM与词性标注的关系以及如何利用HMM进行词性标注。首先回顾一下隐马尔科夫模型(HMM)的定义和三大基本问题,并由此与词性标注的基本问题进行一个对比。 隐马尔科夫模型(HMM)是什么?说白了,就是一个数学模型,用一堆数学符号和参数表示而已,包括隐藏状态集合、观察符号集合、初始概率向量pi, 状态转移矩阵A,混
转载
2023-11-01 21:50:42
98阅读
本文讲述R语言中apply家族的函数的使用方法。一、lapply
最好不要试图一开始就用apply函数,因为它比lapply函数复杂。lapply函数是apply家族的函数中逻辑最简单、版本兼容性、最user-friendly的函数。你甚至可以用lapply这一个函数打天下。其基本语法为:lapply(Vector, function(ii) { ... })。例如,有这样一个data.frame
转载
2023-06-16 19:39:15
111阅读
R中还有一个有趣的sqldf包,它可以让你用SQL来操作dataframe,这种功能能让会R的人能练习SQL,会SQL的人能练习R,不得不感叹R语言的强大技能和神奇魅力。 当然也可以将R与外部数据库连接,直接在R中操作数据库,并生成最终结果,这也是一种可行的方法。在R中连接数据库需要安装其它的扩展包,根据连接方式不同我们有两种选择:一种是ODBC方式,需要安装RODBC包并安装ODBC驱动。另一
转载
2023-08-08 17:17:47
121阅读
R语言数据分析 听课笔记第三部分搏术目录R语言数据分析 听课笔记第三部分搏术观数以形:一维数据作图茎叶图直方图小提琴图箱线图小提琴图 + 箱线图观数以形:二维数据作图观数以形:高维数据作图三维散点图脸谱图平行坐标图11章 相随相伴,谓之关联关联规则 I关联规则 II关联规则 III分类:既是世间法,自当有分别近邻法, k-最近邻分类算法R语言实现树模型(决策树) CART算法R语言实现随机森林算法
转载
2023-09-14 13:22:06
115阅读
说起元编程,lisp的抽象能力无疑是最强的,独特的S-expression和macro,简直是居家旅行,杀人必备之神器= =其实erlang的元编程能力也不弱。让我们一切先从smerl开始,慢慢了解erlang的meta programmingsmerl是erlyweb项目中内部使用的一个模块,它可以让我们很容易的动态创建编译模块,动态添加function等等。首先我们来热下身,先做个小
转载
2023-12-12 11:43:03
79阅读
R语言有两种不同的OOP机制,分别是从其前身S语言继承而来的S3 Object和S4 Object,其中S4 Object更加的正式、也是现在用于开发的主力军,所以本文就从S4 Object谈起,并在最后讨论一下古老的S3 Object。那我们就开始吧!首先我们来设计一个时间序列类,在它的内部,需要包含主数据、起始时间与截止时间、取样间隔这些数据。在R中我们可以定义如下:setClass("Ti
转载
2023-08-25 00:50:38
93阅读
R操作关系型数据库基本要求: R语言基础,懂得一定SQL语法, 懂得使用搜索引擎目标: 学会使用DBI操作SQLite数据库简介R本身不具备数据库操作能力,需要额外的扩展包--DBI(database interface)。DBI将数据库管理分为前端和后端。用户在前端使用对应的API, 经由DBI转换成相应的底层操作.DBI分为三个部分:数据库驱动, 负责与数据库进行交互,比如说与SQLite数据
转载
2024-04-26 09:20:49
91阅读
Nomogram,中文常称为诺莫图或者列线图,简单的说是将Logistic回归或Cox回归的结果进行可视化呈现。它根据所有自变量回归系数的大小来制定评分标准,给每个自变量的每种取值水平一个评分,对每个患者,就可计算得到一个总分,再通过得分与结局发生概率之间的转换函数来计算每个患者的结局时间发生的概率。 下图显示的 logisitc
回归的诺曼图。比如想知道年龄
70
岁的男性的患病风险,
转载
2023-09-10 15:14:22
183阅读
文章目录1、资料下载2、注册用户3、安装和测试opencv 最近看到329的论坛又更新了好多东西,于是我又蠢蠢欲动了,另外也想好好熟悉下linux,就又拿起来了,这里记录下过程。1、资料下载首先是要下载什么东西优先还是去官方的网盘下载吧,更新速度还是内容都是最新的sipeed企业网盘这里我主要是为了下这个最新的镜像,就去了这边下载,因为最新的镜像已经内置了很多我们测试用的模型,就比较方便我们使用
转载
2023-11-05 20:24:06
103阅读
目录一、数据二、logistic回归1.拟合2.预测三、probit回归四、经典判别分析(线性、混合线性、灵活线性)五、交叉验证与比较一、数据脊柱数据(Column_2C.csv、Column_3C.csv)有两个版本,区别在于分为两类还是3类。不过是.dat文件,需要进行相应的转换或者直接下载我上传的文件,是已经对格式和数据经过处理,可以直接进行分析的csv文件。数据具有6个自变量(生物力学特征
转载
2023-09-11 12:41:45
132阅读
本文主要介绍R语言中基本图形的绘制,包含以下几种图形:1.条形图 2.饼图 3.直方图 4.核密度图 5.箱线图 6.点图1.直方图的绘制 #直方图绘制
barplot(height)
#height是一个向量或者矩阵
a<-c(1,2,3,4,5,6)
#垂直直方图
barplot(a,main="Simple Bar Plot",xlab="
转载
2023-07-16 16:45:09
118阅读
高级数据管理简单的数据管理只是有效的管理数据,二高级数据管理则是更近一步,只有充分了解r语言的控制流程,算术函数等,才可以更高效的处理数据。 为了方便,以下所有的分析,我都会基于r提供的原始数据进行分析。本节目的学习用于创建和转换变量的算术函数、字符处理函数和统计函数。探索控制程序流程的方式之后,了解如何编写自己的函数。如何使用这些函数来整合及概括数据。一. 数值和字符处理函数> abs(x
转载
2023-09-19 21:30:17
101阅读
Lasso的身世Lasso的思想从线性回归到Lasso认识LassoLasso相关文献 Lasso的身世Lasso全称为The Least Absolute Shrinkage and Selection Operator,是Tibshrani受到Breiman的Non-Negative Garrote(NNG)的启发在1996年提出的一种压缩估计方法,他把NNG的两步合并为一步,即L1-nor
转载
2024-01-19 23:26:17
70阅读
#第11章中级绘图(与ggplot2包进行对比)
#散点图
#图1 plot()函数
attach(mtcars)
plot(wt,mpg,
main="基本散点图",
xlab="车重",
ylab="每加仑英里数",pch=15)
abline(lm(mpg~wt),col="red",lwd=2,lty=1)
lines(lowess(wt,m
转载
2023-08-06 09:52:31
163阅读
关于softmax regression的数学模型部分可以参考Stanford的中英文Wiki:http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92 softmaxregR包的下载地址:https://cran.r-project.org/web/packages/softmaxreg/index.html一
转载
2024-04-18 15:05:05
94阅读
统计检验是将抽样结果和抽样分布相对照而作出判断的工作。主要分5个步骤:建立假设求抽样分布选择显著性水平和否定域计算检验统计量判定 —— 百度百科
假设检验(hypothesis test)亦称显著性检验(significant test),是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。假设检验的实质是判断观察到的“差别”是由抽样误差引起还是总体上的不同,目的是评价两种不同处理引起效应
转载
2023-10-07 22:38:46
236阅读
R语言中有关绘图的包:base、grid、lattice及ggplot21.lattice包可生成栅栏图形 [plain] view plaincopy
1. library(lattice)
2. histogram(~height|voice.part,data=singer,
3. main="Distribution of He
转载
2024-02-05 14:41:39
127阅读
在计量经济学中,经常要对时间序列数据进行回归建模。时间序列数据通常具有异方差(Heteroscedasticity)和自相关(Autocorrelation)的性质,此时使用传统的最小二乘法(OLS)估计回归参数虽然仍可得到参数的无偏估计,但是传统方法计算出来的参数方差具有偏差,会导致参数的t检验不准确,常出现虚假显著的情况。为避免这种情况,计量经济学中常对上述参数的方差进行调整,最常用的是N
转载
2023-09-14 13:09:06
445阅读