作者:黄天元本章会讲解如何对数据进行分组。首先我们要明确一点,就是为什么要分组,实际应用的场景是什么?如果我们现在有一个学校,我们想要分别得到男生和女生的平均身高,就需要分组,也就是根据性别对学生的身高分组,然后分别求平均值。这个例子我们只是分了两组,可能大家还看不到分组的力量。那么,如果我们现在要知道每一个班级数学成绩的平均分,那么我们就要对数据成绩根据班级分组,比如我们一个年级有12个班级,那
转载
2023-09-21 11:23:53
91阅读
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授:
Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
转载
2023-06-30 18:38:28
419阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载
2023-06-25 20:40:28
273阅读
R语言入门学习笔记
从2018年秋季(大二上学期)开始接触R语言,曾在2019年寒假读过一遍本书的第一版,感觉受益匪浅,之后遇到问题也曾回头来查阅这本书,前几天刚学习过Simulink,趁现在有空再来温习这本书,回顾一下代码和各种命令,简单记录。虽然感觉R的功能和用途不如MATLAB广泛,但是需要派上用场的时候如果能熟练地运用真的是很好的体验。R用方括号
转载
2023-06-25 11:56:37
312阅读
R语言使用dplyr包的groupby函数和summarise函数计算dataframe中不同分组的均值(分组为离散变量、被统计列为连续变量)目录R语言使用dplyr包的groupby函数和summarise函数计算dataframe中不同分组的均值(分组为离散变量、被统计列为连续变量)#导入包和库仿真数据1仿真数据2仿真数据3仿真数据4仿真数据5 R语言使用dplyr包的groupby
转载
2024-01-04 06:00:42
343阅读
简介R语言主要用于数据可视化与统计分析,当然现在也可以通过扩展包实现数据挖掘等算法。与Python相比,R语言相当于天生就加载了NumPy,SciPy,Pandas的大多数功能。现在来介绍一些R语言的基本知识。正文一,入门操作1, 包(1)下载包install.packages(
c("xts", "zoo"),
lib = "some/other/folder/to/install/to",
转载
2023-08-15 21:49:10
143阅读
R语言是一种利基语言,除了研究学者和数据科学家,大部分的开发者对于这种动态语言都持欣赏的态度。当然,对于一个1993年首次开发的编程语言来说,R语言用户通过三百多万其实也没有太了不起。没错儿,R的年龄确实不算太小,但是由于缺乏JIT,所以R通常会很慢。R也是内存占用者,这是因为它有较大的对象,大量分配,并且有一个不移动的垃圾收集器。此外,R具有复杂的语义,这使得本科生和研究生很难在数据科学实验室中
转载
2023-09-07 21:18:28
117阅读
R语言中有关绘图的包:base、grid、lattice及ggplot21.lattice包可生成栅栏图形 [plain] view plaincopy
1. library(lattice)
2. histogram(~height|voice.part,data=singer,
3. main="Distribution of He
转载
2024-02-05 14:41:39
127阅读
本节我们来学习如何在各个平台上安装和配置R语言开发环境。Windows安装您可以从R-3.4.1 for Windows(32/64位)下载Windows的Windows安装程序版本,并将其保存在本地目录中。打开下载页面如下所示 -因为它是Windows安装程序(.exe),下载的名称为“R-3.4.1-win.exe”。只需双击并运行接受默认设置的安装程序即可。 如果您的Windows是32位版
转载
2023-08-10 17:18:21
645阅读
openNLP是NLP中比较好的开源工具,R语言中有openNLP packages,但是呢,貌似对中文的支持并不好,笔者试了试,发现结果并不如意。但是也算认识了一番,就来介绍一下。一些内容转载于白宁超老师:OpenNLP:驾驭文本,分词那些事————————————————————————————————————————一、openNLP简介维基百科:Apache OpenNLP库是一
转载
2023-11-21 14:41:26
67阅读
玩转数据可视化之R语言ggplot2?个人主页:JoJo的数据分析历险记
?个人介绍:小编大四统计在读,目前保研到统计学top3高校继续攻读统计研究生?如果文章对你有帮助,欢迎关注、点赞、收藏、订阅专栏本系列主要介绍R语言ggplot2的使用参考资料:ggplot2: Elegant Graphics for Data Analysis文章目录玩转数据可视化之R语言ggplot2?7.ggplot
转载
2023-07-04 14:12:26
229阅读
SPecc函数用法 R语言 Spectral Clustering谱聚类Description A spectral clustering algorithm. Clustering is performed by embedding the data into the subspace of the eigenvectors of an affinity matrix.描述用法参数附加参数描述
转载
2023-09-01 23:02:55
107阅读
#第11章中级绘图(与ggplot2包进行对比)
#散点图
#图1 plot()函数
attach(mtcars)
plot(wt,mpg,
main="基本散点图",
xlab="车重",
ylab="每加仑英里数",pch=15)
abline(lm(mpg~wt),col="red",lwd=2,lty=1)
lines(lowess(wt,m
转载
2023-08-06 09:52:31
163阅读
本文主要介绍R语言中基本图形的绘制,包含以下几种图形:1.条形图 2.饼图 3.直方图 4.核密度图 5.箱线图 6.点图1.直方图的绘制 #直方图绘制
barplot(height)
#height是一个向量或者矩阵
a<-c(1,2,3,4,5,6)
#垂直直方图
barplot(a,main="Simple Bar Plot",xlab="
转载
2023-07-16 16:45:09
118阅读
参考图书:《Rcpp:R 与 C++ 的无缝整合》Rcpp 的主要目的在于使得开发 R 语言的 C++ 相关拓展变得更加容易、更少出错。我们首先从斐波那契数列问题开始探索 Rcpp。该问题是一个递归问题,首两项为 0 和 1,而后面每一项为前两项之和。C++ 实现,直接根据定义进行实现:int fibonacci(const int x) {
if (x == 0) return(0);
转载
2023-09-27 21:41:05
110阅读
R操作关系型数据库基本要求: R语言基础,懂得一定SQL语法, 懂得使用搜索引擎目标: 学会使用DBI操作SQLite数据库简介R本身不具备数据库操作能力,需要额外的扩展包--DBI(database interface)。DBI将数据库管理分为前端和后端。用户在前端使用对应的API, 经由DBI转换成相应的底层操作.DBI分为三个部分:数据库驱动, 负责与数据库进行交互,比如说与SQLite数据
转载
2024-04-26 09:20:49
91阅读
本文讲述R语言中apply家族的函数的使用方法。一、lapply
最好不要试图一开始就用apply函数,因为它比lapply函数复杂。lapply函数是apply家族的函数中逻辑最简单、版本兼容性、最user-friendly的函数。你甚至可以用lapply这一个函数打天下。其基本语法为:lapply(Vector, function(ii) { ... })。例如,有这样一个data.frame
转载
2023-06-16 19:39:15
111阅读
上一节我们对自然语言处理中词性标注的基本问题进行了描述,从本节开始我们将详细介绍HMM与词性标注的关系以及如何利用HMM进行词性标注。首先回顾一下隐马尔科夫模型(HMM)的定义和三大基本问题,并由此与词性标注的基本问题进行一个对比。 隐马尔科夫模型(HMM)是什么?说白了,就是一个数学模型,用一堆数学符号和参数表示而已,包括隐藏状态集合、观察符号集合、初始概率向量pi, 状态转移矩阵A,混
转载
2023-11-01 21:50:42
98阅读
在R语言编译器中,设置当前工作文件夹可以用setwd()函数。> setwd("e://桌面//")> setwd("e:\桌面\")> setwd("e:/桌面/")这三种结构都是可以编译通过的,但是在VS C#中却不行,只有一种能运行成功。(PS:R语言在VS中运行要先配置环境,还没配置的童鞋先要配置好,才可运行,如有问题可看我前面的随笔。)就是这种结构,engine.Eva
转载
2023-05-26 08:50:28
281阅读
说起元编程,lisp的抽象能力无疑是最强的,独特的S-expression和macro,简直是居家旅行,杀人必备之神器= =其实erlang的元编程能力也不弱。让我们一切先从smerl开始,慢慢了解erlang的meta programmingsmerl是erlyweb项目中内部使用的一个模块,它可以让我们很容易的动态创建编译模块,动态添加function等等。首先我们来热下身,先做个小
转载
2023-12-12 11:43:03
79阅读