R语言data.table速查手册介绍R中的data.table包提供了一个data.frame的高级版本,让你的程序做数据整型的运算速度大大的增加。data.table已经在金融,基因工程学等领域大放光彩。他尤其适合那些需要处理大型数据集(比如 1GB 到100GB)需要在内存中处理数据的人。不过这个包的一些符号并不是很容易掌握,因为这些操作方式在R中比较少见。这也是这篇文章的目的,为了给大家提
转载 2023-09-12 16:32:32
53阅读
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
  先介绍echart:     官网: http://echarts.baidu.com  看名字就知道是百度出品的。      ECharts,一个纯 Javascript 的图表库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器(IE8/9/10/11,Chrome,Firefox,Safari等),底层依赖轻量级的 Canvas 类库 ZRender,提供直观,生动,可交互,
原创 2021-05-13 22:55:30
305阅读
图表行为用于触发能够改变图表显示的相关动态功能,event事件用于接收action触发的行为,所以action行为要配合event事件一块学习//触发图表行为(更改变图表显示的相关动态),例如图例开关legendToggleSelect, 数据区域缩放dataZoom,显示提示框showTip等等 //通过不同的type触发不同的行为 myChart.dispatchAction({ t
转载 2023-11-20 11:22:03
231阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载 2023-06-25 20:40:28
271阅读
http://blog.sina.com.cn/s/blog_597fcb450100c3um.html  【转】R与SAS、SPSS的比较  (2009-03-05 20:29:40) 转载 标签: 教育分类: 学习R与SAS、SPSS的比较R语言 R是用于统计分析、绘图的语言和操作环境。R
一个关于 R作直方图的小例子  2010-04-27 19:31:36|  分类: R&Bioconductor|举报|字号订阅 首先是一串很简单的数据,有30个元素: 把它逐行打到一个TXT文件中去,命名为ex1.txt,保存在目录E:\Da 105 93 80 109 112 88
转载 2月前
377阅读
加载可能用到的包library(xml2) library(rvest) library(reshape2) library(ggplot2) library(dplyr)读取数据打开数据来源的链接,鼠标点击右键检查,将内容复制到文本文件中,我这里命名为new1.txtpage"new1.txt") JokicJokic[[9]] list(Jokic) df1colnames(df1)首先看一看
在既往文章中,我们已经介绍了R语言计算人年及可信区间的计算。但是计算的是总的人年发病率的比较情况,假如我们想知道分层发病率的情况呢?拿既往乳腺癌的数据为例子,我们已经知道了有淋巴结肿大和没有淋巴结肿大患者总的生存率的比较,但是如果我们想了解在每个年龄段有淋巴结肿大和没有淋巴结肿大患者生存率有无区别?如下图 我们以R语言survival包演示泊松回归年龄分层发病率统计,继续使用我们的乳腺癌数据(公众
转载 2023-08-30 19:55:00
138阅读
作者:圈圈Getting Data In and Out of R(一)读取数据读取数据所需的几种函数:read.table、 read.csv:最常用的读取列表数据函数,可返回数据框形式。readLines:逐行读取文本文件,返回一个字符向量source:读取R代码、脚本dget:读取R代码(读取的是以逆句法分析后以文本文件储存的R对象)load、 unserialize:把
转载 2023-10-12 11:04:39
144阅读
文章目录一、数据调用与预处理二、一元线性回归分析三、多元线性回归分析(一)解释变量的多重共线性检测(二)多元回归1. 多元最小二乘回归2. 逐步回归(三)回归诊断四、模型评价-常用的准则统计量 一、数据调用与预处理本文使用的数据为R语言自带数据集“iris”。iris数据集包含5个变量: 数值变量:Sepal.Length, Sepal.Width, Petal.Length, Petal.Wi
主要作用:可重现一样的结果R语言中set.seed()作用是设定生成随机数的种子,目的是为了让结果具有重复性,重现结果。不设定种子不行吗?当然可以,但是结果就不能复现。如:x<-rnorm(3) #随机生成3个随机数 结果:1.4197419 -0.7460519 0.3603622 x<-rnorm(3) #再来一遍,生成的3个随机数又不一样了 结果:1.0796213 0.55
转载 2023-06-19 16:17:51
210阅读
一.绘制基本散点图(1)使用plot()函数(2)使用ggplot()函数  heightweight是个多列数据集ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point()ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point(shape=21)二.使用点形和颜色属性
转载 2023-06-19 17:25:29
178阅读
高级数据管理数值和字符处理函数数学函数函数描述np.abs(x)绝对值np.sqrt(x)平方根np.ceil(x)大于x的最小整数np.floor(x)小于x的最大整数np.trunc(x)向0截取x中的整数部分np.round(x, decimals=2)将x舍入为指定位的小数np.cos(x)/sin(x)/tan(x)余弦/正弦/正切np.arccos(x)/arcsin(x)/acrta
转载 2024-07-12 18:50:33
46阅读
全面的回归分析包括对异常值的分析:离群点、高杠杆值点、强影响点。 离群点:模型效果不佳的观测点。 使用car包中的outlierTest()函数,可以求得最大标准化残差绝对值Bonferroni调整后的p值,若不显著,则说明数据集中没有离群点,若显著,则必须删除该离群点。 > library(car) > outlierTest(fit)可见,在这个回归模
转载 2023-08-13 20:56:44
323阅读
1 replicationrep 函数能把输入的参数重复数次。另一个相关函数replicate 则能调用表达式数次。大多数情况下它们基本相等,只有当使用随机数时才会出现不同。现在,假定生成均匀分布随机数的runif 函数不是矢量化的,那么rep 函数每次都将重复相同的随机数,而replicate 每次的结果都不相同(由于历史的原因,其参数顺序竟然是从后到前的,这有点烦人):rep(runif(1)
转载 2023-07-09 17:00:04
293阅读
目录使用R中的ggplot2进行微阵列可视化(红绿热图)1、常用的方法:biclust包1.1 biclust包的安装1.2 导入biclust包1.3 生成一些测试数据1.4 调用drawHeatmap()函数绘制热图2、ggplot2绘制红绿热图2.1 ggplot2、reshape2包的安装1.2 导入ggplot2、reshape2包1.3 生成要绘制微阵列的模拟数据1.3 对数据进行相
文章目录1. 仅知道函数的部分名称,想列出全部2. 列出全部有tab字段的函数,或者访问3. 自动补全4. 更改小数点位数5. 显示错误信息6. 升级R,但不想重装packages?7. 卸载已安装的packages8. library()的逆向操作9. 得到加载package的列表10. 读取Excel数据两种方法补充:读取pdf文件11. 在对原数据进行了删除处理,但是希望调出原数据12.
转载 2023-07-21 18:29:31
154阅读
3 数组数组类似于矩阵,其维度可以大于2.数组可以通过array函数创建,形式如下:> setarray <- array(vector,dimensions,dimnames)其中,vector包含了数组中的数据;dimensions是一个数值型向量,给出了各维度下标的最大值;而dimensions是可选的、各维度名称标签的列表。举个例子:> dim1 <- c("x1"
转载 2023-09-05 23:22:54
115阅读
Mosaic plot常常用来展示Categorical data(分类数据)(关于不同的数据类别,参照连接更严谨英文比较好的朋友可以看[1]),mosaic plot 强大的地方在于它能够很好的展示出2个或者多个分类型变量(categorical variable)的关系. 它也可以定义为用图像的方式展示分类型数据。当变量是类别变量时,且数目多于三个的时候,可使用马赛克图。马赛克图中,嵌套矩阵面
转载 2023-06-25 16:13:16
343阅读
  • 1
  • 2
  • 3
  • 4
  • 5