相关系数,协方差

Cov(x)指令

Cov质量判断

对单个变量数据进行简单的探索和统计


例如画个时序图,求个均值、最大值、最小值等,(15条消息) 用R语言进行数据探索

summary(操作,回的是最小值、最大值、平均值、中位数、四分之一中位数、四分之三中位数。

计算频数的操作

table(iris$Species)

多变量

举例说明,下同。cov(iris[,1:4])

多个变量求解他的相关系数

cor(iris[,1:4],

协方差的操作

  1. with(iris, plot(Sepal.Length, Sepal.Width))

绘制多变量的散点图

  1. pairs(iris)

散点图矩阵

  1. scatterplot3d包

3D散布图、等级图、等高图、交互图和平行坐标。

可视化处理

饼图,柱形图,曲线图等

根据相关的数据进行展示

以自己找到的wine数据集为试验基础,进行数据预处理,数据探索,数据分析的试验。

其中数据预处理找打缺失值,进行QQ图计算,z-sorce的变化,直方图绘制以及异常值的判断。

数据探索进行探索变量之间的关系图绘制,COR数据展示以及相关系数矩阵的研究,探索之间的一些关系。

可以从上图看出,质量高的某些变量的取值范围的取值大小。

R语言关联基因 r语言关系网_开发语言

R语言关联基因 r语言关系网_R语言关联基因_02

R语言关联基因 r语言关系网_数据分析_03

R语言关联基因 r语言关系网_r语言_04

R语言关联基因 r语言关系网_r语言_05

R语言关联基因 r语言关系网_开发语言_06

R语言关联基因 r语言关系网_开发语言_07

R语言关联基因 r语言关系网_开发语言_08

图7-10 探索了变量之间的相互关系和可视化结果

上述的图画出了等高线图,箱图,小提琴图等,探索了之间存在什么关系,可以看出不同的颜色之间的相关系数是不同的,可以得到不同的数据结果。

R语言关联基因 r语言关系网_数据分析_09

R语言关联基因 r语言关系网_r语言_10

图7-5 Z-SORECE前后ph数据QQ图

R语言关联基因 r语言关系网_数据_11

R语言关联基因 r语言关系网_开发语言_12

图7-6  Z-SORECE前后PH数直方图和概率密度图

[6] R语言信用评分卡:数据分箱(binning) - 知乎 (zhihu.com)

[10] Error: could not find function "corrplot" - Scripting - KNIME Community Forum

[11] R语言教程|带你搞清楚主成分分析(PCA)并完成分析 - 知乎 (zhihu.com)

【13】【R语言】--- 散点图 - 简书 (jianshu.com)