R语言

R语言是动态语言

环境搭建

先安装R再安装Rstudio,注意要保证:

R语言安装指定为64位;

R语言和Rstudio的安装路径不要有汉字;

R语言和Rstudio的安装父目录要为同一个。

R对象和函数

R对象可以看作是具有关联名称的存储空间。R中的一切都存储在对象中。所有的变量、数据、函数都以命名对象的形式存储在计算机的内存中。

对象赋值运算符:

>x 
>x
[1] 945

就是把945赋值给x,数值前的“[1]”可以读作“此行是从对象的第一个元素开始显示的值”。

R语言赋值操作支持数值表达式,此种情况下,对象存储表达式的计算结果:

> z 
> w 
>w
[1] 25

值得注意的是:创建的每个对象都存储在计算机内存中,直到删除它。可通过命令ls()或objects()列举出当前内存中的对象。

R中最基本的对象,有模式和长度两种属性。模式指的是存储类型,长度是包含的元素数量。

R的基本数据类型有:字符型character、逻辑型logical、数值型numeric、复数型complex。注意:R的字符型事实上是一组字符,而非单个字符,类似其它语言的字符串类型。逻辑值只能是T(TRUE)和F(FALSE),True或False等不是有效的逻辑值,因为R中的名称是大小写敏感的。

在R中显式的运行循环( for in,while等)效率是很低的,所以尽可能通过其他方式来避免显式循环,可选的方式有:

逻辑索引向量替代,如y[x%%2==0]

R连接mysql

options(download.file.method="libcurl")
install.packages("RMySQL")
library(RMySQL)
con 
host=‘47.93.114.198‘,
user=‘backup‘,
password=‘wkwAN6sBDU‘,
dbname=‘medicalrecord‘)
adminrole
print (adminrole)
dbDisconnect(con)

R连接Oracle

方法一:

library(RODBC)

方法二:

较为复杂,和java的jdbc连接数据库操作类似

R连接 Sql sever

创建数据源RODBC

.连接

library(RODBC);
dbhandle 
res 
sqlSave(dbhandle,res,"A",append=FALSE);
odbcClose(dbhandle);

R连接 db2

library(RJDBC)

R操作excel(依赖java环境)

1.首先安装xlsx包,并进行加载包

install.packages("xlsx")
library("xlsx")

实现数据的输出

input.xlsx.data 
print (input.xlsx.data)

这样既可得到excel表里的数据

R操作csv

data2 = read.table("writetest.csv",header=F, sep=",")
print (data2)

R语言数据类型

矢量

列表

矩阵

数组

因子

数据帧

这些对象中最简单的是向量对象,并且这些原子向量有六种数据类型,也称为六类向量。 其他R对象建立在原子向量之上。 Logical(逻辑型),Numeric(数字),Integer(整型),Complex(复合型),Character(字符),Raw(原型)

使用

1. Vectors 向量

当你想用多个元素创建向量时,你应该使用c()函数,这意味着将元素组合成一个向量。

apple

print(apple)

2.Lists 列表

列表是一个R对象,它可以在其中包含许多不同类型的元素,如向量,函数甚至其中的另一个列表。

list1

3. Matrices 矩阵

M = matrix( c(‘a‘,‘a‘,‘b‘,‘c‘,‘b‘,‘a‘), nrow = 2, ncol = 3, byrow = TRUE)
print(M)

4.Arrays 数组

虽然矩阵被限制为二维,但阵列可以具有任何数量的维度。 数组函数使用一个dim属性创建所需的维数。 在下面的例子中,我们创建了一个包含两个元素的数组,每个元素为3x3个矩阵。

a 
print(a)

输出:

, , 1
[,1] [,2] [,3]
[1,] "green" "yellow" "green"
[2,] "yellow" "green" "yellow"
[3,] "green" "yellow" "green"
, , 2
[,1] [,2] [,3]
[1,] "yellow" "green" "yellow"
[2,] "green" "yellow" "green"
[3,] "yellow" "green" "yellow"

dim中的2代表维数

5.Factors 因子

因子是使用向量创建的r对象。 它将向量与向量中元素的不同值一起存储为标签。 标签总是字符,不管它在输入向量中是数字还是字符或布尔等。 它们在统计建模中非常有用。

使用factor()函数创建因子。nlevels函数给出级别计数。

6.Data Frames 数据帧

数据帧是表格数据对象。 与数据帧中的矩阵不同,每列可以包含不同的数据模式。 第一列可以是数字,而第二列可以是字符,第三列可以是逻辑的。 它是等长度的向量的列表。

使用data.frame()函数创建数据帧。