一、R语言的mlr packages选择最适机器学习模型install.packages("mlr")之后就可以看到R里面有哪些机器学习算法、在哪个包里面。a<-listLearners() 这个包是听CDA网络课程《R语言与机器学习实战》余文华老师所述,感觉很棒,有待以后深入探讨。以下表格是R语言里面,52个机器学习算法的来源以及一些数据要求。 classnameshort.namepac
rstudio environment 中values和data有什么区别?简单粗暴的回答就是,values是值,data通常指data frame。 Data<-ReadAffy()  affy包是R语言的bioconductor系列包的一个,就一个功能,读取affymetix的基因表达芯片数据-CEL格式数据,处理成表达矩阵。(所以data属于en
4. 因子        因子提供一种简单而又紧凑的形式来处理分类数据。因子用level来表示所有可能的取值。对于数据集中取值个数固定的分类数据,因子特别有用,图形函数和汇总函数就充分利用了因子这种优点。        R软件内部以数值编码方式来存储因子值,这
转载 2023-06-25 15:24:18
178阅读
这里总结一下,今天老师上课的内容。我觉得跟着老师,我能学到好多东西。我要消化。我突然觉得自己很卑微,因为有那么多东西需要学习的。但是 复习的侧重点在:什么是自己知道的?什么是自己不知道的?缺什么补什么?R基础知识整理(查漏补缺)S1:identicalidentical(a,i) #既检验数值又检验数据类型 i==m== 仅仅是数值的比较;identical 则同时包括数值和属性的比较;S2: s
转载 2023-09-08 23:08:28
255阅读
工作空间函数名称功能getwd()/dir.create()显示/创建当前目录setwd("dir")设置当前目录savehistory("file")/loadhistory("file")保存/读取历史命令save.image("file")/load("file")保存/读取工作空间输入输出执行脚本 source("file") 文本输出 sink("file") e.g sink("out
转载 2023-07-21 20:28:01
224阅读
R的基本运算a = c(1,2,3,4) b = c(3,4,5,6) print(a + b) print(a ^ b) # a ** b print(a %% b) # 整除取余 print(a %/% b) # 整除 v <- a # 向左赋值 b -> w # 向右赋值 ls() # 列出所有变量 print( 1 %in% v) # 相当于 in print
转载 2023-07-09 17:37:54
146阅读
聊一聊R的基本绘图参数 砍柴问樵夫 R语言除了具有优秀的数据处理能力外,对于数据的展现也具有极其灵活和强大的作用。 R语言绘图函数主要包括:低级绘图函数,高级绘图函数,扩展绘图包函数。 基本绘图参数。 我们浏览一下R语言中的基本图形参数。 pch:点的符号,指定绘制点时使用的符号。x<-rep(1:5,times=6) y<-rep(1:6,each=5) pl
转载 2023-10-25 22:02:31
342阅读
limma 包的normalizeBetweenArrays和其他数据矫正方法2.normalizeBetweenArrays只能是在同一个数据集里面用来去除样本的差异,不同数据集需要用limma 的 removeBatchEffect函数 去除批次效应数据矫正前.png可以看到,肿瘤样品的表达量整体就比正常对照样品的表达量高出一大截,这样的数据进行后续分析,就会出现大量的上调
转载 2023-09-21 10:22:37
2309阅读
mega 2560板子在3d打印机中相当于大脑,控制这所有的3d打印配件来完成复杂的打印工作,但mega2560不能直接使用,需要上传(upload)固件(firmware)才可以使用。 1、下载固件——Marlin由于Marlin固件的强大功能和简单易用,所以这里暂时只介绍Marlin固件。Marlin原版下载地址(很多参数都需要自己配置):我自己配置的Marlin固件大部分参数已经改好:htt
转载 2023-12-20 22:13:39
144阅读
作者 杜雨 今天跟大家介绍一款任坤大神写的新包——formattable。这个包的功能很简单,但是却很具创意性,它颠覆了R语言data.frame数据表的呈现方式,允许在表格内自定义视觉化元素,比如对某一列数据进行字号、颜色、背景、以及图形化处理,整体的版式仍然保留表格的样式,但是已经具有了表和图结合的意味。关于数据框的呈现方式,R语言内目前较好的自定义呈现方式是谢益辉大神的DT包,可以 将
转载 2023-12-26 16:35:14
80阅读
转载 2024-04-13 06:56:59
123阅读
前言上面一章我们已经成功爬取了链家网的数据。按照同样的方法爬取,又成功爬取了3w条上海二手房源的数据,那么这一章就写写关于上海二手房的分析。用到的软件:R,Tableau一开始还是在R中画的图,后来觉得不是很好看,所以用tableau。首先读取文件1library(ggplot2) 2house_info <- read.csv("house_inf0.csv",stringsAsFacto
apply() 函数算是R语言中很基础的一个函数,同时还有 sapply()  lapply()  tapply() 函数精简了 apply() 函数的用法。apply() 函数是一个很R语言的函数,可以起到很好的替代冗余的for循环的作用,R语言中的循环操作for和while都是基于R语言本身来实现的,而向量操作是基于底层的C语言函数实现的,所以使用apply()函数家族进行
转载 2023-06-25 15:27:34
464阅读
数据的分布特征:分布的集中趋势,反应各数据向其中心值靠拢或聚集的程度(平均数,中位数,四分位数,众数)分布的离散程度,反应各数据远离其中心值的趋势(极差,四分位差,方差,标准差,离散系数)分布的形状,反应数据分布的偏斜程度和峰度(偏态系数,峰度系数)#######################平均数(均值):一组数据相加后除以数据的个数而得到结果,称为平均数(mean)中位数:一组数据排序后处于
转载 2023-06-25 15:23:03
270阅读
R语言与统计分析之 探索性数据分析篇 一、R语言中的统计概念 1、随机实验: 可在相同 2、随机事件 均值u:这个很好理解 R函数:mean中位数:对序列排序后,排在中间的数,需要特别注意的是如果序列为偶数,中位数是中间两个数平均值.  R函数:median百分位数:也是顺序统计量,设百分数为p,n是样本个数,则p位数指:np为小数,ceiling(np)+1,np为整数,则p位数:(x
转载 2023-10-30 21:26:24
58阅读
文章目录综括==apply函数==利用apply函数实现利用循环实现定义一个结果的数据框定义for循环利用R的特性三种方法消耗时间比较==lapply函数====sapply函数==vapply函数==mapply函数====tapply函数==rapply函数eapply函数 综括apply函数 apply函数是最常用的代替for循环的函数。apply函数可以对矩阵、数据框、数组(二维、多维)
转载 2023-07-06 16:47:22
123阅读
R语言之for循环注:来源为李东风R语言教程 使用for循环的注意事项: 如果对向量每个元素遍历并保存结果, 应在循环之前先将结果变量产生等长的存储, 在循环内为已经分配好存储空间的输出向量的元素赋值。 为了产生长度为n的数值型向量,用numeric(n); 为了产生长度为n的列表,用vector(“list”, n)。 对一个向量元素遍历时如果用下标访问, 需要用seq_along(x)的做法而
转载 2023-05-23 13:40:55
539阅读
     R语言      R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R语言特点   R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个
1、console.assert()在浏览器中当console.assert()方法接受一个值为假断言时,会向控制台输出传入的内容,但并不会中断代码的执行const errorMsg = 'the # is not even'; for (let number = 2; number <= 5; number += 1) { console.log('the # is' + numb
今天的笔记内容是R语言中因子和数据框的基础介绍和使用方法。因子可以用来存储不同类别的数据类型,R 语言创建因子使用 factor() 函数,向量作为输入参数。factor() 函数语法格式:factor(x = character(), #向量 levels, #指定各水平值 labels = levels, #水平标签 exclude = NA, #剔除的
  • 1
  • 2
  • 3
  • 4
  • 5