在既往文章中,我们已经介绍了R语言计算人年及可信区间的计算。但是计算的是总的人年发病率的比较情况,假如我们想知道分层发病率的情况呢?拿既往乳腺癌的数据为例子,我们已经知道了有淋巴结肿大和没有淋巴结肿大患者总的生存率的比较,但是如果我们想了解在每个年龄段有淋巴结肿大和没有淋巴结肿大患者生存率有无区别?如下图 我们以R语言survival包演示泊松回归年龄分层发病率统计,继续使用我们的乳腺癌数据(公众
转载 2023-08-30 19:55:00
118阅读
我们在SCI论文中常常可以见到这样的表格,是根据分类来做出统计结果的,如下图,是根据患者是否存活把患者分成了两类幸存的和死亡的做分别统计,然后得出各类统计结果 那么,R语言是怎么做出这样的表格呢?首先我们要把数据进行分割,得到一个幸存的数据表和一个死亡的数据表,然后再分别统计,我们今天利用R语言自带的subset函数来演示这一功能,这是一个非常重要的功能,为今后我们对数据进一步分析做准备。 我们使
R语言是一种用于数据分析和统计计算的编程语言,广泛应用于数据科学领域。在R语言中,我们经常需要对数据进行分组和分类,其中一种常见的做法就是将数据等分为若干个类别。今天我们就来介绍一下如何在R语言中将数据等分为5类。 ### 1. 准备数据 首先,我们需要准备一组数据,以便后续进行等分分类。假设我们有一个数据框df,其中包含一列数值型数据,我们将使用这列数据进行等分分类。 ```markdown
简单介绍R的使用一,管理工作空间二,工作目录三,输入和输出四,包五,R的控制台操作六,获取帮助七,加载示例数据集 R是专门用于数据分析和统计的脚本语言,广泛应用在每一个需要统计和数据分析的领域。使用R做数据建模、数据统计和分析是一个发现未知和惊喜的旅程,前提,你必须迈出第一步,去学习R语言R是一种解释型语言,这意味着代码在运行之前不需要编译在学习R语言时,首先需要安装R,访问网站 https:
# 使用 R 语言查看数据各个等分位的值 对于许多数据分析工作者来说,分位点是非常重要的统计概念,尤其是在探索性数据分析(EDA)中。R 是一门强大的编程语言,它为统计分析提供了很多工具和功能。在这篇文章中,我们将学习如何在 R 中计算并查看数据的各个等分位的值。我们将通过以下几个步骤完成这个任务: ## 流程概述 下面是实现这个目标的步骤概述: | 步骤 | 描述
原创 21天前
20阅读
数据结构向量: 向量是用于存储数值型、字符型或逻辑型数据的一维数组。可通过函数c()可用来创建向量实例操作:矩阵:矩阵是一个二位数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)可通过函数matrix()创建矩阵实例操作:数组:数组(array)与矩阵类似,但是维度可以大于2数组可通过array函数创建实例操作:数据框由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较
每个样本的主成分得分由主成分分数系数构建的公式得到在多元统计分析中,主成分分析(Principal Component Analysis,简称PCA)是一种常用的数据降维方法。通过主成分分析,我们可以将原始数据投影到新的坐标系中,从而得到一组新的变量,这些新变量被称为主成分。在主成分分析中,每个样本的主成分得分可以由主成分分数系数构建的公式得到。下面我们使用R语言来演示如何计算每个样本的主成分得分
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载 2023-06-25 20:40:28
178阅读
参考图书:《Rcpp:R 与 C++ 的无缝整合》Rcpp 的主要目的在于使得开发 R 语言的 C++ 相关拓展变得更加容易、更少出错。我们首先从斐波那契数列问题开始探索 Rcpp。该问题是一个递归问题,首两项为 0 和 1,而后面每一项为前两项之和。C++ 实现,直接根据定义进行实现:int fibonacci(const int x) { if (x == 0) return(0);
安装R和Rstuido软件 R语言是用于统计分析,图形表示和报告的编程语言和软件环境;Rstudio是编辑、运行R语言的最为理想的工具之一。1、官网下载R安装包 下载地址为:https://cran.r-project.org 进入链接,如下图所示,在页面顶部提供了三个下载链接,分别对应三种操作系统:Windows、Mac和Linux。请选择自己操作系统对应的链接,接下来我将以windows为例给
转载 2023-08-10 13:02:35
139阅读
R中还有一个有趣的sqldf包,它可以让你用SQL来操作dataframe,这种功能能让会R的人能练习SQL,会SQL的人能练习R,不得不感叹R语言的强大技能和神奇魅力。 当然也可以将R与外部数据库连接,直接在R中操作数据库,并生成最终结果,这也是一种可行的方法。在R中连接数据库需要安装其它的扩展包,根据连接方式不同我们有两种选择:一种是ODBC方式,需要安装RODBC包并安装ODBC驱动。另一
转载 2023-08-08 17:17:47
94阅读
R语言编译器中,设置当前工作文件夹可以用setwd()函数。> setwd("e://桌面//")> setwd("e:\桌面\")> setwd("e:/桌面/")这三种结构都是可以编译通过的,但是在VS C#中却不行,只有一种能运行成功。(PS:R语言在VS中运行要先配置环境,还没配置的童鞋先要配置好,才可运行,如有问题可看我前面的随笔。)就是这种结构,engine.Eva
转载 2023-05-26 08:50:28
259阅读
R语言中有关绘图的包:base、grid、lattice及ggplot21.lattice包可生成栅栏图形 [plain] view plaincopy 1. library(lattice) 2. histogram(~height|voice.part,data=singer, 3. main="Distribution of He
本文讲述R语言中apply家族的函数的使用方法。一、lapply 最好不要试图一开始就用apply函数,因为它比lapply函数复杂。lapply函数是apply家族的函数中逻辑最简单、版本兼容性、最user-friendly的函数。你甚至可以用lapply这一个函数打天下。其基本语法为:lapply(Vector, function(ii) { ... })。例如,有这样一个data.frame
最近几年关于利用shiny做web框架的需求越来越多,出去交流也经常有爱好者咨询如何学习shiny包(个人觉得RStuido官网的shiny学习资料是最快上手的途径之一)。今天晚上刚好给学员直播完shiny包的基本知识,顺便也写一篇关于shiny的扫盲文章出来,希望能对想学习shiny包的朋友有一点点启发。Shiny是R中的一种Web开发框架,使得R的使用者不必太了解css、js只需要了解一些ht
转载 2023-08-31 20:35:25
44阅读
      在 R 里面 numeric 类型包含了很多子类型,其中最常见的就是 double 和 integer, 但因为最常用的是 double, 除非你特别标明是 integer (用 as.integer), 系统都会认为是 double。     那为什么要有 integer 这个类型呢? 一是为了
转载 2023-06-02 16:16:31
181阅读
  R语言是进行统计分析和可视化的优秀语言(其实机器学习和网页制作也可以用R,小声说~|ω`))  R语言  相信大家在利用R语言进行数据分析的时候可能会有大数据分析需求。所谓大数据,很好理解,就是大样本高维度数据,这样的数据在当今信息爆炸时代,很是常见。比如医学数据,数据量大,维度极高,因为医学的检测指标多,而且随着基因测序特别是二代测序等高通量测序(High-throughput sequen
转载 2023-05-28 15:09:11
151阅读
什么是R语言R语言简介R语言的诞生、发展、优缺点· R语言——集数据操作、分析、展示于一体的数据分析工具· 源于S语言,与S-PLUS同为S语言的实现· 2000年发布第一个二进制版本,目前最新版本4.0.0· 随着数据分析的兴起,R语言也正在变得热门——TIOBE· R语言的优点· R语言的缺点开发工具----R与RstudioR· R-project网站介绍、下载安装· R环境界面介绍RSt
Lasso的身世Lasso的思想从线性回归到Lasso认识LassoLasso相关文献 Lasso的身世Lasso全称为The Least Absolute Shrinkage and Selection Operator,是Tibshrani受到Breiman的Non-Negative Garrote(NNG)的启发在1996年提出的一种压缩估计方法,他把NNG的两步合并为一步,即L1-nor
  • 1
  • 2
  • 3
  • 4
  • 5