1.7 获取帮助有很多种资源可以帮你学习关于R更多知识,其中包括R自身一些工具,当然,还有网上资料。开发者们做了很多工作使R更加自文档化。下面我们将介绍一些R内置帮助工具,以及互联网上资源。1.7.1 help()函数想获取在线帮助,可调用help()。例如,要获取seq()函数信息,就键入下面的命令:1.7.2 example()函数每个帮助条目都附带有例子。R一个非常好用特性是
引入平常我们利用GEODatasets表达量数据进行基因表达分析时候,常常是下载表达矩阵,利用limma包进行分析,如果能找到注释包,那就把探针注释成Entrez_id或者是Symbol_id,如果找不到,那就下载对应GPL提供注释文件,但是很可能还是不好注释,比如今天拿来做例子GSE15222对应GPL2700: 我们看到这个GPL只提供了GB_ACC也就是Genebank一个号码,
转载 2023-12-18 19:01:27
29阅读
数据预处理是将 原始数据 转化成能够用于建模一致数据过程,它是分析流程中非常关键一个环节!!!! 首先,载入需要R包 caret :提供机器学习模型及拟合效果系统交互界面 e1071:各类计量经济和机器学习延伸,我们使用其中naiveBayes函数进行朴素贝叶斯判别 gridExtra:绘图辅助功能,将不同图形组合在一起成为图表 lattice:建立在核心绘图能力上格子框
转载 2023-08-11 14:05:05
191阅读
1. 从R中获取帮助查找某个函数# 打开mean函数帮助页面 ?mean help("mean") # 打开加号操作帮助页面 ?"+" help("+") # 打开if帮助页面,用于分支代码 ?"if" help("if") # 搜索所有包含"plotting"主题 ??plotting help.search("plotting") # 搜索所有与regression mo
转载 2023-11-08 21:40:19
203阅读
FROM:《Using The foreach Package》 foreach包提供了一种新循环运行R脚本循环结构,它支持并行运算。 #1 简介 require(foreach)## Loading required package: foreach#利用foreach重复运行sqrt函数 foreach(i=1:3) %do% sqrt(i)## [[1]] ## [1] 1 ## #
R语言segments函数
转载 2023-05-30 11:15:18
420阅读
1、 vector格式  vector是一维数据集合,其数据必须为同一类型,例如都是int型,都是character型。一个原本全是数字组成vector中一个元素替换为字母时,其余元素也会变为character型。> a <- 1:6 > str(a) int[1:6] 1 2 3 4 5 6 > a[1] <- 'a' > str(a) chr[1:6
转载 2023-08-17 10:48:29
436阅读
决策树(Decision Tree):是在已知各种情况发生概率基础上,通过构成决策树来求取净现值期望值大于等于零概率,评价项目风险,判断其可行性决策分析方法,是直观运用概率分析一种图解法。(即分类属性均在数据表中,不能决策出不存在属性)    2、set.seed()函数 set.seed()用于设定随机数种子,一个特定种子可以产生一个特定伪随机序列,这个函数
转载 2024-01-24 08:25:35
89阅读
# R语言for循环与if语句用法 R语言是一种广泛使用编程语言,尤其适合数据分析和统计计算。在R语言中,`for`循环和`if`语句是控制程序执行流程基本工具。本文将深入探讨这两种控制结构用法,并提供代码示例帮助理解。 ## 一、for循环 `for`循环用于遍历一个序列(例如向量、列表等),对每个元素执行指定操作。其语法格式为: ```r for (variable in
原创 2024-09-10 05:31:44
79阅读
sprintf指的是字符串格式化命令,函数声明为 int sprintf(char *string, char *format [,argument,…]);,主要功能是把格式化数据写入某个字符串中,即发送格式化输出到 string 所指向字符串。sprintf 是个变参函数。使用sprintf 对于写入buffer字符数是没有限制,这就存在了buffer溢出可能性。解决这个问题,可以考
=R是一个优秀统计计算语言,但是因为它是解释型语言, 所以在对数组元素迭代运算方面会很慢。 在R用C语言程序可以既保留R易用性又可以在必要时提高速度。 本文讲述在Windows环境下如何用BorlandC编译器来完成R和C结合。假设我们要用C编码问题是两个向量卷积问题, 当然,R中已经有convolve可以实现, 我们这里只是作为一个例子。 两个无穷向量x和y卷积定义为z[i] =
既然R语言是一种语言,那么就应该包含所有串行语言都有的基本控制语句:分支和循环。下面介绍相应语句。1.1 分支语句1.1.1  if-else分支语句         二分支语句if-else是最常见控制语句,其基本形式如下:if(<判断1>) { 处理1 } else { 处理2 } 或者: if(<判断
转载 2023-08-29 18:22:53
91阅读
A. 处理循环  - R不仅有for/while循环语句,还有更强大实现循环"一句话"函数B. 排序C. 总结数据信息1. lapply:可以循环处理列表中每一个元素,总是返回一个列表  - lapply(列表,函数/函数名,其他参数)  - sapply:简化结果    a. 结果列表元素长度均为1,返回向量    b. 结果列表元素长度相同且大于1,返回矩阵# lapply str(l
转载 2024-01-28 17:22:57
530阅读
数据基本信息获取获取数据基本情况: summary() 函数。 任何 R 对象都可作为summary() 函数参数,返回对象统计和概要信息,日常常用且实用函数。获取数据维度:dim() 函数 对于高维数据,如矩阵和数据框,dim() 函数可返回对象维度:行数,列数。获取数据长度: **length()**函数 用于计算向量、矩阵中元素个数。 对于一个数据框,length() 则返回列(
入门书籍:R语言实战进度:1-4章摘要:1)实用包forecast:用于做时间序列预测,有auto.arima函数RODBC:可以用来读取excel文件。但据说R对csv格式适应更加良好,相应导入导出均较为方便(read.table, write等)reshape:目前用到rename函数,可以方便对数据变量重命名fCalendar:在日期输入处提及,据说对日期运算有奇效,但无具体示例。同
转载 2023-07-11 22:30:31
793阅读
好在R和Python中有现成数据集分割函数,避免手动写函数导致划分比例不合理、训练集与测试集样本结构与总体不均衡问题。 R语言中caTools包中sample.split函数可以用来自动将原始数据集分割成训练集和测试集。
转载 2023-05-30 13:21:24
0阅读
printf("ni hao \n ma ?\n"); printf("ni hao \r ma ? \r"); printf("ni hao \n ma ?\n"); printf("ni hao \r ma ? \r");    打印结果为:   ni hao ma ? ma ? ni
转载 2023-09-08 20:30:39
174阅读
经过上一节介绍相信各位读者已经知道如何安装RR程序包。本节拟通过一个简单例子说明用R语言进行预测主要步骤,旨在让各位读者了解用R语言进行预测基本过程。本例使用forecast包中自带数据集wineind,它表示从1980年1月到1994年8月,由葡萄酒生产商销售容量不到1升澳大利亚酒总量。数据示意如下:从数据中可知,这是典型时间序列数据,一行表示一年,12列表示一年12个月,
这一篇文章是回答知识星球中一位星友提问,她电脑内存有限,无法直接使用所有数据,只能分析部分数据。数据来源: https://content.cruk.cam.ac.uk/jmlab/atlas_data.tar.gz 解压缩之后,得到下面数据 数据清单 其中raw_counts.mtx是以稀疏矩阵格式存放表达量数据,文件为6.5G, 用普通文本编辑器无法
缺失值处理方法——多重插补法 1 基本思想 利用蒙特卡洛模拟法(MCMC)将原始数据插补成几个完整数据集,在每个数据集中利用线性回归(lm)或广义线性规格(glm)等方法进行插补建模,再将这些完整模型整合到一起,评价插补模型优劣并返回完整数据集。该方法主要利用程辑包mice中mice( )进行。 大致步骤如下: 缺失数据集——MCMC估计插补成几个数据集——每个数据集进行插补建模(glm、
转载 2023-06-21 22:40:07
222阅读
  • 1
  • 2
  • 3
  • 4
  • 5