“ 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。前面介绍了超多DCA的实现方法,基本上常见的方法都包括了,代码和数据获取方法也给了大家。今天介绍的是如何实现其他模型的DCA,比如lasso回归、随机森林、决策树、SVM、xgboost等。这是基于dca.r/stdca.r实现
变差分解分析(Variance Partitioning Analysis)可用于确定指定环境因子对微生物(原生生物/植物/动物等等)群落结构变化的解释比例。要计算指定环境因子与群落结构的相关性,就需要约束非指定环境因子的同时,对指定环境因子做排序分析。其实就是相当于做partial排序分析。文章《R统计-PCA/PCoA/db-RDA/NMDS/CA/CCA/DCA等排序分析教程》写过如何使用v
在网上找了很久关于数据转换的,都没有找到比较好的。现在为大家整理一下。按照我自己的思路。当然也是为了自己做笔记。为了方便,大家可以统一安装一个系列的包,这个只需要安装tidyverse这个包就可以,它会安装一系列的数据处理的包,比如ggplot2,dplyr等主力的包。 #安装tidyverse包 install.packages('tidyverse') #加载这个包 library(tidy
转载 2023-10-31 22:32:10
80阅读
# R语言中的ADF检验与P值解析 在时间序列分析中,单位根检验是一个重要的步骤,它可以帮助我们确定一个序列是否是平稳的。Augmented Dickey-Fuller (ADF) 检验是最常用的单位根检验方法之一。在本文中,我们将详细介绍ADF检验以及如何在R语言中进行实现。同时,我们还将讨论检验的P值如何解读,并提供一些代码示例。 ## 什么是单位根检验? 在时间序列分析中,平稳性是一个
原创 2024-09-21 03:44:39
267阅读
基于R语言进行栅格数据统计及Raster包简介写在前面:日常数据处理中常需要对单个栅格图层进行统计,包括计算其均值、最值和总和等等。使用R语言可方面快速地实现该需求,主要借助的package为Raster包。library(raster) x = raster('data/data.tif') cellStats(x,stat='mean')x表示待计算的栅格;stat表示需要统计的内容,包括su
数据嘅可视化确实非常重要,而R语言作图能力亦都相当完美!特别喺ggplt2呢个包,学熟距简直就可以直接showoff一番,未来连续几日,我都会从网路上收集d比较好嘅教材,share俾大家啦!作者:黄宝臣总结来说有以下几点:ggplot2的核心理念是将绘图与数据分离,数据相关的绘图与数据无关的绘图分离ggplot2是按图层作图ggplot2保有命令式作图的调整函数,使其更具灵活性ggplot2将常见
1. 方差分析假定:正态性(否则建立广义线性模型),独立性(否则建立混合线性模型,定义G矩阵和R矩阵),齐次性(否则混合线性模型,定义G矩阵和R矩阵)2. 单因素方差分析(为什么高级心统老师讲“边际均值比较”更常用?)2.1 安装相关R包,并找出数据(来源“agridat,将数据命名dat)。这里使用devtools下载github上的文件,devtools后面的格式是install_github
一、独立性检验 根据频数信息判断两类因子彼此相关或相互独立的假设检验。
转载 2023-05-24 21:25:40
1151阅读
作者简介 Introduction上篇文章中提了一下如何通过ggpubr包为ggplot图添加p-value以及显著性标记,本文将详细介绍。利用数据集ToothGrowth进行演示。ggpubr安装和加载# 直接从CRAN安装 install.packages("ggpubr", repo="http://cran.us.r-project.org") #先加载包 library(ggpubr)
转载 2024-05-17 11:14:15
102阅读
@R语言相关分析与典型相关分析 #相关分析与典型相关分析 #pearson相关系数 a=c(1,3,5,7,9);b=c(1,4,6,9,10) cor(a,b) #pearson相关系数 cor.test(a,b) #检验相关系数的显著性 cor(iris[1:4]) #相关系数,参数填数据集,则计算相关系数矩阵#spearman相关系数,亦即秩相关系数 #spearman和kend
当我们说到p-value时,我们在说什么?“这个变量的p-value小于0.05,所以这个变量很重要”........你真的知道自己在说什么么???这个p-value到底是个什么鬼?为什么小于0.05就很重要?很重要是什么意思?????终于...这次,我们通俗易懂地来讲讲到底什么是p-value(p值)。在讲p-value之前,我们用掷硬币来举个例子。硬币有正反两面,在概率中我们知道,出现正反面的
在机器学习和统计分析中,线性回归是一个常见而重要的工具。它能通过一条直线来近似表示自变量与因变量之间的关系。在 Python 中实现线性回归时,通常会关注几个关键的输出指标,包括R值和p值。这些指标帮助我们评估模型的拟合优度和统计显著性。 > 线性回归是一种用来表示两个或多个变量之间关系的统计学方法。它通过最小二乘法来确定最佳拟合直线。——《统计学基础》 ### 背景定位 在机器学习的历史中
原创 6月前
111阅读
以下图所示的成绩表为例,这种每个样本的信息占据一行的记录方式就是宽数据,它看着非常直观,也是录入数据常使用的形式。 宽数据示意 长数据则是另外一种记录方式,如下图所示,姓名+班级构成了样本标识(表中有重名,仅使用姓名无法唯一确定样本),而所有科目以及总分的成绩则被折叠放置在同一栏,并使用新变量“科目”作为变量标识。这种记录方式虽然看起来不太直观,但有时在进行可视化、数学建模等处理时会很
接前文:R语言基础(一):注释、变量3.常用函数函数就是一些已经编写好的功能,我们拿过来直接使用就可以了。3.1 查看变量ls()也许你清空了控制台,看不到之前的变量。但是它一直存在于系统中。我们可以使用ls()函数查看已经定义过的变量(后续内容中:>开头的行是代码,[1]开头的行是运行结果,同学们在写代码的饿时候,不需要写每行开头的>)。> x<-10 > y&lt
转载 2023-05-22 14:25:10
286阅读
par函数概述在R绘图时,有时我们想在一个绘图区中同时绘制多幅图。在R语言中可以有多个函数来实现此要求。这里先介绍一下绘图参数par函数的使用。R中的par()函数可以将绘图区分割成规则的几个部分。多图环境用参数mfrow或参数mfcol来设定,如:par(mforw=c(3,2))则是在同一绘图区中绘制3行2列共6个图形,而且是先按行绘制,即绘制完第1行的2个图形后,再绘制第2行的2个图形,最
R语言的帮助文档里,apply函数的功能是:Retruns a vector or array or list of values obtained by applying a function to margins of an array or matrix.就是说apply把一个function作用到array或者matrix的margins(可以理解为数组的每一行或者每一列)中,返回值时v
meltmelt(data, id.vars, measure.vars, variable.name = "variable", ..., na.rm = FALSE, value.name = "value", factorsAsStrings = TRUE)id.vars 表示固定不变的列 measure.vars 控制变量,需要处理的列,将这些列名作为某一列的数值 variab
转载 2023-08-31 09:53:34
207阅读
R语言使用rnorm函数生成正太分布数据、使用qqnorm函数绘制QQ图、如果向量为正态分布则数据点基本在一条直线上目录R语言使用rnorm函数生成正太分布数据、使用qqnorm函数绘制QQ图、如果向量为正态分布则数据点基本在一条直线上R 语言特点R语言使用rnorm函数生成正太分布数据、使用qqnorm函数绘制QQ图、如果向量为正态分布则数据点基本在一条直线上R 语言特点R 语言环境软件属于 G
 R语言中diag函数用于获取矩阵的对角线元素001、dat <- matrix(1:9, nrow = 3) ## 生成矩阵(方阵,行列相等) dat diag(dat) ## 取对角线元素  002、非方阵情况dat <- matrix(1:15, nrow = 3) ## 生成3行5列矩阵
转载 2023-05-23 11:31:32
449阅读
dplyr 包提供了一系列好用的函数,用来进行数据处理和转换,掌握之后可以高效解决数据处理中的绝大多数问题,我们先来看一下 dplyr 包最核心的 5 个函数。select: 筛选字段filter: 按条件过滤arrange: 按字段排序mutate: 创建新字段summarize: 数据汇总这一章需要使用 gapminder 数据集,该数据集记录了 140 多个国家的人口、寿命、国内生产总值(g
  • 1
  • 2
  • 3
  • 4
  • 5