热门 最新 精选 话题 上榜
一定要先了解缺失机制,即为什么会产生缺失值。对于随机产生的缺失值,可以删除,删除的对象分为两类,变量的删除,以及观测值的删除。当某一变量的缺失值比例很高的时候,可以直接删除,也可以用哑变量进行标志。但缺失值的产生不是随机的,要根据它产生原因用不同的方法填补;主要介绍三个包的常用于填补缺失值的函数。思路一般是要定位缺失值以及查看缺失值的数量:is.na()sum(is.na())md.pattern
转载 25分钟前
0阅读
一、简介:      ggplot2是R语言中很受欢迎的一个画图package,使用起来非常友好。ggplot2的实现得益于Leland Wilkinson在他的著作《The Grammar of Graphics》中提出了一套图形语法,把图形元素抽象成可以自由组合的成分,Hadley Wickham把这套想法在R中实现。Hadley Wickham有本专门讲ggpl
转载 1小时前
0阅读
R语言ggrepel安装 r语言ggplot2安装
Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘)  
转载 1小时前
0阅读
r语言logistic回归调节模型变量 r logistic regression
  (1)准备数据过程中,遇到了缺失值的问题。以往都是自己手动写代码,用缺失值样本所在类别的均值或者众数替换掉,结果今天发现,DMwR2包就有处理缺失值的函数,而且思想一致【大哭】    先奉上代码:• install.packages("DMwR2"); • library(DMwR2) ; • knnImputation(YourDataFrame)&
1、查看已加载的包(.packages())注意外面的括号和前面的点不能省。包被安装后,在使用前需要加载。加载包使用命令 library(包名),比如library(codetools)。查看有哪些包是被加载的,使用命令(.packages()) ,注意小括号和点号不能省略。> (.packages()) [1] "stats" "graphics" "grDevices" "ut
转载 4小时前
0阅读
title: “使用R进行描述性统计分析” output: html_document:###单组计算描述性统计量 在对数据进行统计分析之前,一般我们需要知道当前数据的描述统计情况,如集中趋势、离散趋势、分布形状。如果数据表中有很多变量,在excel中计算这些统计量的话,要利用公式一个一个进行计算,比较麻烦,在R中可以通过一些简单的函数进行计算。以车辆路试数据集mtcars为例,这里我们只需要三列
内容目录R基本使用Rstudio控制台常见快捷键一个简单的例子如何获得帮助工作空间设置R包获取与使用包是什么包的安装与载入包的使用方法R语言编程常见错误R基本使用R语言是一种区分大小写的解释型语言。你可以在命令提示符(>)后每次输入并执行一条命令,或者一次性执行写在脚本文件中的一组命令。它的数据类型包括向量、矩阵、数据框以及列表。R内置许多功能,用户也可以通过自己编写函数实现想要的功能。R的
转载 6小时前
0阅读
新手常见报错第一类:工作路径问题未设定工作路径当前路径需要修改第二类:对象名或函数名问题未找到函数名报错函数名大小写问题未找到赋值对象对象赋值不规范第三类:符号问题中文逗号报错绝对路径的设定符号使用不规范缺少括号或引号赋值号报错必要的引号与括号第四类:中文注释乱码第五类:数据集或变量长度不同   与Python、C语言等相比,R语言可以说是比较容易的编程语言之一(更适合数据探索和科研)。尽管R
转载 20小时前
7阅读
R语言 ADF检验 r语言adf检验显示x出错
一、行列求和、平均值和频度 rowSums, colSums, rowMeans, colMeans 可以简单理解为按行或列求和或求均值,table把数字或字符当成因子统计频度,都相当简单:> a <- array(rep(1:3, each=3), dim=c(3,3)) > a [,1] [,2] [,3] [1,] 1 2 3
转载 20小时前
13阅读
一.绘制基本散点图如何绘制散点图方法 1)使用plot函数可绘制散点图,运行命令时依次传递给plot()函数一个向量x和一个向量y 2)使用ggplot函数,运行geom_point()函数,分别映射一个变量到x和yheightweight是个多列数据集ps:通过设定点形参数可以在散点图中绘制默认值以外的点形(系统默认为为2),如:二.使用点形和颜色属性,并基于某变量对数据进行
转载 20小时前
8阅读
R语言 散点图 高级 r语言中散点图怎么画
目录一、前面的啰嗦二、绘图数据说明三、基本箱线图四、分组箱线图1. 单分类变量的分组箱线图1.1 基本版1.2 美化版2. 双分类变量的分组箱线图2.1 基本版2.2 美化版五、箱线图完整版代码1. 基本箱线图的完整代码2. 单变量分组箱线图的完整代码3. 双变量分组箱线图的完整代码六、思考与优化 一、前面的啰嗦本教程对绘图所需数据和绘图过程进行了一步步的解释,稍显啰嗦,没时间细看或不想一步步看
转载 20小时前
5阅读
ggplot箱型图如何去掉背景R语言 ggplot箱线图
R语言data.table速查手册介绍R中的data.table包提供了一个data.frame的高级版本,让你的程序做数据整型的运算速度大大的增加。data.table已经在金融,基因工程学等领域大放光彩。他尤其适合那些需要处理大型数据集(比如 1GB 到100GB)需要在内存中处理数据的人。不过这个包的一些符号并不是很容易掌握,因为这些操作方式在R中比较少见。这也是这篇文章的目的,为了给大家提
转载 21小时前
9阅读
R语言 data() r语言data.table
dnorm():输入的是x轴上的数值,输出的是该点的概率密度
转载 23小时前
9阅读
 用于计算数据中行的和及列的和。001、dat <- data.frame(a = c(3, 8, 2, 1), b = c(8, 4, 2, 6), c = c(2, 7, 6, 9)) ## 测试书 dat rowSums(dat)
转载 1天前
12阅读
R语言画ROC代码 r语言rowsum
本文简要介绍如何使用R语言cpm包进行变点检测,change point detection 序列变点检测在金融气象等领域的应用十分广泛。最近我在分析表观遗传数据的时候也用到了这项功能,当然是基于R语言进行分析的。下面给出一个简单的使用示例。安装cpm包。install.packages("cpm") #初次使用需安装,以后就不需要了 library(cp
求根是数值计算的一个基本问题,一般采用的都是迭代算法求解,主要有不动点迭代法、牛顿-拉富生算法、割线法和二分法。不动点迭代法    所谓的不动点是指x=f(x)的那些点,而所谓的不懂点迭代法是指将原方程化为x=f(x)形式之后,下一步所用的x值为这一步的f(x),这样的话就可以一直逼近我们需                     要的x,即方程的根,但是这
标准正态分布函数的快速计算方法标准正态分布的分布函数Φ(x)Φ(x)可以说是统计计算中非常重要的一个函数,基本上有正态分布的地方都或多或少会用上它。在一些特定的问题中,我们需要大量多次地计算这个函数的取值,比如我经常需要算正态分布与另一个随机变量之和的分布,这时候就需要用到数值积分,而被积函数就包含Φ(x)Φ(x)。如果Z∼N(0,1),X∼f(x)Z∼N(0,1),X∼f(x),ff是XX的密度
  R语言是进行统计分析和可视化的优秀语言(其实机器学习和网页制作也可以用R,小声说~|ω`))  R语言  相信大家在利用R语言进行数据分析的时候可能会有大数据分析需求。所谓大数据,很好理解,就是大样本高维度数据,这样的数据在当今信息爆炸时代,很是常见。比如医学数据,数据量大,维度极高,因为医学的检测指标多,而且随着基因测序特别是二代测序等高通量测序(High-throughput sequen
转载 1天前
0阅读
虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。
转载 1天前
6阅读
r语言执行plot函数没反应 r语言plot函数用法
转载 1天前
11阅读
r语言执行plot函数没反应 r语言plot函数用法
自定义函数之位置参数
一、grep函数 1、提取特定开头项
转载 1天前
8阅读
这个函数提取字符串的一部分。 语法 substring()函数的基本语法是
转载 1天前
12阅读
1.控制输出数字的精度 format(123.123,digits=4) 输出4位数字123.1,如果整数超过4位,小数部分就全被略去。
转载 1天前
3阅读
r语言 fromjson R语言grep函数
转载 1天前
6阅读
r语言 fromjson R语言grep函数
1、循环语句  for语句  while语句2、R脚本  source()函数  print()函数         
步骤:1、Ctrl+Alt+T 或者 空白处右键—>选择open terminal ,打开终端;2、输入命令:dpkg --list 浏览并找到已安装的程序名字,baidunetdisk3、输入命令:不完全卸载:sudo apt-get remove baidunetdisk完全卸载:sudo apt-get --purge remove baidunetdisk ubuntu卸载
在R语言中, 绘图边框一共有3个区域
转载 2天前
3阅读
tidyverse学习与总结目录tidyverse学习与总结引言broomclicrayondplyrdbplyrforcatsggplot2havenhmshttrjsonlitelubridatemagrittrmodelrpurrrreadrreadxlreprexrlangrstudioapirveststringrtibbletidyrxml2引言tidyverse 对于R语言的数据科学
转载 2天前
0阅读
r语言包的安装方法 r语言安装包怎么安装