文章目录

  • ​​第一章 R语言介绍​​
  • ​​1.1 工作空间:workspcae​​
  • ​​1.2 输入和输出​​
  • ​​1.2.1 输入​​
  • ​​1.2.2 文本输出​​
  • ​​1.2.3 图形输出​​
  • ​​1.3 包​​
  • ​​第二章 创建数据集​​
  • ​​2.1 数据集的概念​​
  • ​​2.2 数据结构​​
  • ​​2.2.1 向量:c()​​
  • ​​2.2.2 矩阵:matrix()​​
  • ​​2.2.3 数组:array()​​
  • ​​2.2.4 数据框:data.frame()​​
  • ​​1. attach()函数​​
  • ​​2. detach()函数​​
  • ​​2.2.5 因子:factor()​​
  • ​​2.2.6 列表:list()​​
  • ​​2.3 数据的输入​​
  • ​​2.3.1 使用键盘输入数据:edit()​​

第一章 R语言介绍

1.1 工作空间:workspcae

工作空间(workspace)就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据库、数据框、列表)。在一个R会话结束时,你可以在当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。

R语言:第一部分 入门_R


例1:

R语言:第一部分 入门_数据_02

1.2 输入和输出

1.2.1 输入

函数source(“filename”)可在当前会话中执行一个脚本。如果文件名中不包含路径,R将假设此脚本在当前工作目录中。
例:

source("myscript.R")  # 执行包含在文件myscript.R中的R语句集合

1.2.2 文本输出

函数sink(“filename”)可在当前会话中执行一个脚本。默认情况下,如果文件已经存在,则它的内容将被覆盖。

  • 使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。
  • 参数split=TRUE可将输出同事发送到屏幕和输出文件中。
  • 不加参数调用命令sink()仅向屏幕返回输出结果。

1.2.3 图形输出

虽然sink()可以重定向文本输出,但它对图形输出没有影响。要重定向图形输出,使用一下函数。最后使用**dev.off()**将输出返回到终端

R语言:第一部分 入门_数组_03

1.3 包

1.安装包

install.packages("需要安装的包名")

2.更新包

update.packages("需要更新的包名")

3.查看已安装包的描述

installed.packages("包名")

4.包的载入

要使用安装的包,需要先载入。

library(包名)   # 这里不需要引号,安装需要

第二章 创建数据集

2.1 数据集的概念

数据集通常是有数据构成的一个矩形数组,行表示观测,列表示变量。如下:

R语言:第一部分 入门_数据集_04

  • R中有许多用于存储数据的结构,包括标量、向量、数组、数据框和列表。
  • R可以处理的数据类型包括数值型、字符型、逻辑型(FALSE/TRUE)、复数型、和原生型(字节)。

2.2 数据结构

2.2.1 向量:c()

  • 向量是用于存储数值型、字符型或逻辑型数据的一维数组。
  • 执行组合功能的函数c()可用来创建向量。

例1:创建向量

> a <- c(1,2,3,4,5,-1)               # 数值类型
> b <- c("one", "two", "three") # 字符型向量
> c <- c(TRUE, FALSE, TRUE, FALSE) # 逻辑型向量

注意:单个向量只能是一种数据类型

例2:访问向量中的元素

> a <- c(1,2,3,4,5,-1)
> a[3] # 第三个,索引从1开始,而不是0
[1] 3
> a[c(1,3,6)] # 第1,3,6个
[1] 1 3 -1
> a[2:6] # 第2到6个
[1] 2 3 4 5 -1

2.2.2 矩阵:matrix()

  • 矩阵是一个二维数组,只是每一个元素都拥有相同的模式(数值型、字符型或逻辑型)。
  • 可通过函数matrix创建矩阵

格式:

mymatrix <- matrix(vector, nrow=a, ncol=b, byrow=TRUE/FALSE, dimnames=list(r_name,c_name))

1.vector:包含了矩阵的元素
2.nrow:指定行数
3.ncol:指定列数
4.byrow:TRUE则按行填充;FALSE则按列填充;默认按列
5.dimnames:以字符向量表示行名和列名

R语言:第一部分 入门_数据集_05


R语言:第一部分 入门_R_06

2.2.3 数组:array()

  • 数组和矩阵类似,但是维度可以大于2。
  • 数组通过array()函数创建

形式:

myarray <- array(vector, dimensions, dimnames)

1.vector:包含了数组中的数据
2.dimensions:是一个数值型向量,给出了各个维度下标的最大值。(可选)

例:创建234的三维数组

R语言:第一部分 入门_数据_07

2.2.4 数据框:data.frame()

  • 可包含不同模式(数值型、字符型)的数据
  • 可通过data.frame()创建

格式:

mydata <- data.frame(col1, col2, col3, ...)

1.列向量col1,col2,col3可为任何类型(如字符型、数值型或逻辑型)

R语言:第一部分 入门_R_08


注意:每一列的模式必须唯一

R语言:第一部分 入门_数据_09


注意:这里的$相当于python中的.

1. attach()函数

  • 可将数据框添加到R的搜索路径中

R语言:第一部分 入门_R_10

2. detach()函数

  • 将数据框从搜索路径中移除
  • detach并不会对数据框本身做任何处理,这句是可以省略的,写上是一个好的编程习惯

R语言:第一部分 入门_R_11

2.2.5 因子:factor()

  • 变量可以归结为名义型、有序型、连续型变量。
  • 名义型变量:没有顺序之分的类别变量
  • 有序型变量:表示一种顺序关系,而非数量关系
  • 连续型变量:可以呈现为某个范围内的任意值,并同时表示了顺序和数量
  • 类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)
  • 函数factor()以一个整数向量的形式存储类别值,同时一个由字符串组成的内部向量将映射到这些整数上

R语言:第一部分 入门_数组_12


R语言:第一部分 入门_数组_13


R语言:第一部分 入门_数组_14

2.2.6 列表:list()

  • 一些对象的有序集合
  • 对象可以是任何结构

格式:

mylist <- list(object1, object2)
# 你还可以对列表中的对象命名
mylist <- list(name1=object1, name2=object2)

R语言:第一部分 入门_数据集_15


R语言:第一部分 入门_R_16

2.3 数据的输入

R语言:第一部分 入门_数组_17

2.3.1 使用键盘输入数据:edit()

R语言:第一部分 入门_数据_18


R语言:第一部分 入门_数组_19