相关系数,协方差 | Cov(x)指令 | Cov质量判断 |
对单个变量数据进行简单的探索和统计 | 例如画个时序图,求个均值、最大值、最小值等,(15条消息) 用R语言进行数据探索 | summary(操作,回的是最小值、最大值、平均值、中位数、四分之一中位数、四分之三中位数。 |
计算频数的操作 | table(iris$Species) | |
多变量 | 举例说明,下同。cov(iris[,1:4]) | 多个变量求解他的相关系数 |
cor(iris[,1:4], | 协方差的操作 | |
| 绘制多变量的散点图 | |
| 散点图矩阵 | |
| 3D散布图、等级图、等高图、交互图和平行坐标。 | |
可视化处理 | 饼图,柱形图,曲线图等 | 根据相关的数据进行展示 |
以自己找到的wine数据集为试验基础,进行数据预处理,数据探索,数据分析的试验。
其中数据预处理找打缺失值,进行QQ图计算,z-sorce的变化,直方图绘制以及异常值的判断。
数据探索进行探索变量之间的关系图绘制,COR数据展示以及相关系数矩阵的研究,探索之间的一些关系。
可以从上图看出,质量高的某些变量的取值范围的取值大小。
图7-10 探索了变量之间的相互关系和可视化结果
上述的图画出了等高线图,箱图,小提琴图等,探索了之间存在什么关系,可以看出不同的颜色之间的相关系数是不同的,可以得到不同的数据结果。
图7-5 Z-SORECE前后ph数据QQ图
图7-6 Z-SORECE前后PH数直方图和概率密度图
[6] R语言信用评分卡:数据分箱(binning) - 知乎 (zhihu.com)
[10] Error: could not find function "corrplot" - Scripting - KNIME Community Forum
[11] R语言教程|带你搞清楚主成分分析(PCA)并完成分析 - 知乎 (zhihu.com)
【13】【R语言】--- 散点图 - 简书 (jianshu.com)