R语言：第一部分入门

原创

zdb呀 2022-12-06 06:00:23 博主文章分类：R ©著作权

文章标签 R 数据数组数据集 文章分类 后端开发

©著作权归作者所有：来自51CTO博客作者zdb呀的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

第一章 R语言介绍

1.1 工作空间：workspcae
1.2 输入和输出

1.2.1 输入
1.2.2 文本输出
1.2.3 图形输出

1.3 包

第二章创建数据集

2.1 数据集的概念
2.2 数据结构

2.2.1 向量：c()
2.2.2 矩阵：matrix()
2.2.3 数组：array()
2.2.4 数据框：data.frame()

1. attach()函数
2. detach()函数

2.2.5 因子：factor()
2.2.6 列表：list()

2.3 数据的输入

2.3.1 使用键盘输入数据：edit()

第一章 R语言介绍

1.1 工作空间：workspcae

工作空间（workspace）就是当前R的工作环境，它存储着所有用户定义的对象（向量、矩阵、函数、数据库、数据框、列表）。在一个R会话结束时，你可以在当前工作空间保存到一个镜像中，并在下次启动R时自动载入它。

R语言：第一部分入门_R

例1：

R语言：第一部分入门_数据_02

1.2 输入和输出

1.2.1 输入

函数source(“filename”)可在当前会话中执行一个脚本。如果文件名中不包含路径，R将假设此脚本在当前工作目录中。
例：

source("myscript.R")  # 执行包含在文件myscript.R中的R语句集合

1.2.2 文本输出

函数sink(“filename”)可在当前会话中执行一个脚本。默认情况下，如果文件已经存在，则它的内容将被覆盖。

使用参数append=TRUE可以将文本追加到文件后，而不是覆盖它。
参数split=TRUE可将输出同事发送到屏幕和输出文件中。
不加参数调用命令sink()仅向屏幕返回输出结果。

1.2.3 图形输出

虽然sink()可以重定向文本输出，但它对图形输出没有影响。要重定向图形输出，使用一下函数。最后使用**dev.off()**将输出返回到终端

R语言：第一部分入门_数组_03

1.3 包

1.安装包

install.packages("需要安装的包名")

2.更新包

update.packages("需要更新的包名")

3.查看已安装包的描述

installed.packages("包名")

4.包的载入

要使用安装的包，需要先载入。

library(包名)   # 这里不需要引号，安装需要

第二章创建数据集

2.1 数据集的概念

数据集通常是有数据构成的一个矩形数组，行表示观测，列表示变量。如下：

R语言：第一部分入门_数据集_04

R中有许多用于存储数据的结构，包括标量、向量、数组、数据框和列表。
R可以处理的数据类型包括数值型、字符型、逻辑型（FALSE/TRUE）、复数型、和原生型（字节）。

2.2 数据结构

2.2.1 向量：c()

向量是用于存储数值型、字符型或逻辑型数据的一维数组。
执行组合功能的函数c()可用来创建向量。

例1：创建向量

> a <- c(1,2,3,4,5,-1)               # 数值类型
> b <- c("one", "two", "three")      # 字符型向量
> c <- c(TRUE, FALSE, TRUE, FALSE)   # 逻辑型向量

注意：单个向量只能是一种数据类型

例2：访问向量中的元素

> a <- c(1,2,3,4,5,-1)
> a[3]          # 第三个，索引从1开始，而不是0
[1] 3  
> a[c(1,3,6)]   # 第1,3，6个
[1]  1  3 -1
> a[2:6]        # 第2到6个
[1]  2  3  4  5 -1

2.2.2 矩阵：matrix()

矩阵是一个二维数组，只是每一个元素都拥有相同的模式（数值型、字符型或逻辑型）。
可通过函数matrix创建矩阵

格式：

mymatrix <- matrix(vector, nrow=a, ncol=b, byrow=TRUE/FALSE, dimnames=list(r_name,c_name))

1.vector：包含了矩阵的元素
2.nrow：指定行数
3.ncol：指定列数
4.byrow：TRUE则按行填充；FALSE则按列填充；默认按列
5.dimnames：以字符向量表示行名和列名

R语言：第一部分入门_数据集_05

R语言：第一部分入门_R_06

2.2.3 数组：array()

数组和矩阵类似，但是维度可以大于2。
数组通过array()函数创建

形式：

myarray <- array(vector, dimensions, dimnames)

1.vector：包含了数组中的数据
2.dimensions：是一个数值型向量，给出了各个维度下标的最大值。（可选）

例：创建234的三维数组

R语言：第一部分入门_数据_07

2.2.4 数据框：data.frame()

可包含不同模式（数值型、字符型）的数据
可通过data.frame()创建

格式：

mydata <- data.frame(col1, col2, col3, ...)

1.列向量col1，col2，col3可为任何类型（如字符型、数值型或逻辑型）

R语言：第一部分入门_R_08

注意：每一列的模式必须唯一

R语言：第一部分入门_数据_09

注意：这里的$相当于python中的.

1. attach()函数

可将数据框添加到R的搜索路径中

R语言：第一部分入门_R_10

2. detach()函数

将数据框从搜索路径中移除
detach并不会对数据框本身做任何处理，这句是可以省略的，写上是一个好的编程习惯

R语言：第一部分入门_R_11

2.2.5 因子：factor()

变量可以归结为名义型、有序型、连续型变量。
名义型变量：没有顺序之分的类别变量
有序型变量：表示一种顺序关系，而非数量关系
连续型变量：可以呈现为某个范围内的任意值，并同时表示了顺序和数量
类别（名义型）变量和有序类别（有序型）变量在R中称为因子（factor）
函数factor()以一个整数向量的形式存储类别值，同时一个由字符串组成的内部向量将映射到这些整数上

R语言：第一部分入门_数组_12

R语言：第一部分入门_数组_13

R语言：第一部分入门_数组_14

2.2.6 列表：list()

一些对象的有序集合
对象可以是任何结构

格式：

mylist <- list(object1, object2)
# 你还可以对列表中的对象命名
mylist <- list(name1=object1, name2=object2)

R语言：第一部分入门_数据集_15

R语言：第一部分入门_R_16

2.3 数据的输入

R语言：第一部分入门_数组_17

2.3.1 使用键盘输入数据：edit()

R语言：第一部分入门_数据_18

R语言：第一部分入门_数组_19

上一篇：黑马程序员3天玩转Python深度学习TensorFlow（第3天）

下一篇：【李沐：动手学深度学习pytorch版】第2章：预备知识

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯