R包介绍R包是函数、数据与编译代码以一种定义完善的格式组成的集合,计算机上存储包的目录称为库library,==函数.libPaths()==可以显示库所在的位置library() 可以显示库中有哪些软件包 如果要使用R包,可以使用library()函数,首先载入包,也可使用require函数来加载包,这时候就不需要使用引号了,因为R包已经安装好了,系统中已经包含这个关键字了R软件本身也是有几个独
R中的data.table包提供了一个data.frame的高级版本,让你的程序做数据整型的运算速度大大的增加。data.table已经在金融,基因工程学等领域大放光彩。他尤其适合那些需要处理大型数据集(比如 1GB 到100GB)需要在内存中处理数据的人。不过这个包的一些符号并不是很容易掌握,因为这些操作方式在R中比较少见。这也是这篇文章的目的,为了给大家提供一个速查的手册。data.table
转载 2023-06-20 16:56:44
104阅读
dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。dplyr、tidyr包安装及载入 install.packages("dplyr") install.package
作者简介Introduction 数据分析过程中我们常常需要从数据集中抽取部分数据,本文将介绍如何提取子数据集,主要利用R自带的函数,以后会专门介绍data manipulation包dplyr。 提取子数据集主要分为select以及exclude,这里主要介绍两种方法,一是利用操作符[]进行选取,二是利用subset()进行抽取。利用[]进行提取#use the iris datase
转载 2023-06-20 15:50:47
161阅读
向量 euro #欧元汇率,长度为11,每个元素都有命名 landmasses #48个陆地的面积,每个都有命名 precip #长度为70的命名向量 rivers #北美141条河流长度 state.abb #美国50个州的双字母缩写 state.area #美国50个州的面积 state.name #美国50个州的全称因子 state.division #美国50个州的分类,9
今天在调试Graph Convolution over Pruned Dependency Trees Improves Relation Extraction代
原创 2022-08-12 08:00:42
19阅读
一、简介  在实际工作中,遇到数据中带有缺失值是非常常见的现象,简单粗暴的做法如直接删除包含缺失值的记录、删除缺失值比例过大的变量、用0填充缺失值等,但这些做法会很大程度上影响原始数据的分布或者浪费来之不易的数据信息,因此怎样妥当地处理缺失值是一个持续活跃的领域,贡献出众多巧妙的方法,在不浪费信息和不破坏原始数据分布上试图寻得一个平衡点,在R中用于处理缺失值的包有很多,本文将对最为广泛被使用的mi
R语言如何查看在datasets包中包含的数据集的列表?目录R语言如何查看在datasets包中包含的数据集的列表?R语言是解决什么问题的?R语言如何查看在datasets包中包含的数据集的列表?R语言是解决什么问题的?R 是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的Ross Ihaka 和 Robert Gentleman 共同创立。由于R 受Becker, Cham
DataSet可以通过Scala的序列获取到DataSet,也可以通过RDD转换得到DataSet,也可以通过DataFrame转换得到DataSet.说明:在实际使用
原创 2022-07-04 17:01:15
150阅读
文章目录一、逻辑回归是什么二、逻辑回归的代价函数1. 公式:2. 公式推导过程:2.1. 寻找预测函数2.2. 构造代价函数三、梯度下降法求J(θ)的最小值四、代码展示 一、逻辑回归是什么简单来说, 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载 2023-06-25 20:40:28
178阅读
温故而知新6.函数6.5 自定义函数基本使用> ce2fa <- function(ce){ + fa <- 1.8 * ce + 32 + return(fa) + } > ce2fa(0) [1] 32 > ce2fa(0:10) [1] 32.0 33.8 35.6 37.4 39.2 41.0 42.8 44.6 46.4 48.2 50.0 &gt
转载 2023-08-23 14:20:17
0阅读
作者:丁点helper 前面的文章提到,R语言是一门针对『对象』的语言,这里说的对象,最主要的就是数据。R可以创建、读取、处理多种类型的数据。今天先讲一些基本概念。R语言中的数据类型稍微接触过统计的同学应该很熟悉下图所示的变量类型,R中的多种数据类型可以满足各类变量的表达,我们逐一讲解: 1. 数值型(numeric):数据的内容为数字。上图中,定量变量和定性变量都可以用数值
文章目录1. 仅知道函数的部分名称,想列出全部2. 列出全部有tab字段的函数,或者访问3. 自动补全4. 更改小数点位数5. 显示错误信息6. 升级R,但不想重装packages?7. 卸载已安装的packages8. library()的逆向操作9. 得到加载package的列表10. 读取Excel数据两种方法补充:读取pdf文件11. 在对原数据进行了删除处理,但是希望调出原数据12.
转载 2023-07-21 18:29:31
122阅读
R语言是为数学工作者设计的一种数学编程语言,主要用于统计分析。绘图、数据挖掘。R语言是一种解释型的面向数学理论工作者的语言,与C语言同样是出自贝尔实验室之手,但是C语言是面向计算机软件工程师设计的。R 语言的特点R语言属于GNU开源软件,兼容性好,使用免费语法十分有利于复杂的数学运算数据类型丰富,包括向量、矩阵、因子、数据集等常用数据结构代码风格好,可读性强R环境安装R语言的开发环境本身具备了图形
回归分析是科学研究中十分重要的数据分析工具。随着现代统计技术发展,回归分析方法得到了极大改进。混合效应模型(Mixed effect model),或称多水平模型(Multilevel model)/分层模型(Hierarchical Model)/嵌套模型(Nested Model),无疑是现代回归分析中应用最为广泛的统计模型,代表了现代回归分析主流发展方向。混合效应模型形式灵活可以应对现代科学
高级数据管理数值和字符处理函数数学函数函数描述np.abs(x)绝对值np.sqrt(x)平方根np.ceil(x)大于x的最小整数np.floor(x)小于x的最大整数np.trunc(x)向0截取x中的整数部分np.round(x, decimals=2)将x舍入为指定位的小数np.cos(x)/sin(x)/tan(x)余弦/正弦/正切np.arccos(x)/arcsin(x)/acrta
 下载和安装Windows环境的R1.进入主页,点击 蓝色加粗的 download R 2.随便点击一个镜像,这里点击的是http://mirror.fcaglp.unlp.edu.ar/CRAN/ 3.点击Download R for Windows  4.点击install R for the first time. 5.点击 Dow
转载 9月前
258阅读
R语言和集算器吸引人的地方之一在于,它们的代码风格都比较敏捷,用简短的代码就可以实现丰富的功能。比如都可以写出”Vector Computing”表达式,对判断语句都进行了简化,都可以把基础函数扩展成高级函数,都支持泛型。其中向量化计算的特点是用函数和运算符处理批量数据,避免循环语句。这将带来2个优点:使程序员可以轻松掌握,降低学习成本;方便实现计算,提高性能。下面用几个例子来比较一下R和集算器在
转载 2023-08-18 13:01:45
111阅读
  • 1
  • 2
  • 3
  • 4
  • 5