1: 《R语言数据分析:基础、算法与实战》内容简介
本书基于主流统计分析编程语言 R
,介绍了常用的数据分析方法及其实战应用,内容涵盖了 R语言
的使用、基于 ggplot2包
及其拓展包的数据可视化、数据的清洗与探索、数据分析、数据挖掘以及统计分析方法等。本书在讲解数据分析时,主要基于 tidyverse系列包
进行数据整理、 作与可视化,基于 tidymodels系列包
进行数据分析、统计分析、机器学习等算法的应用,其它的 R包
用于数据分析的辅助。使用 R语言
时,遵循更新更简洁的编程方式。
tidyverse系列与tidymodels系列包
本书内容循序渐进,讲解通俗易懂,同时配套源程序和数据文件,读者可以边学边实践。
本书可供从事数据分析、数据可视化、机器学习的科研及技术人员阅读使用,也可作为高等院校中统计学、计算机科学等相关专业的教材。
书籍封面
2: 书籍主要内容
R语言
是一套完整的数据准备、处理、分析与可视化的科学系统,对数据科学、机器学习及深度学习,均有一套完备的解决方案。本书是 R语言
在数据分析方面从入门到提升的教程,将 R语言
编程与数据分析实战案例紧密结合,帮助读者快速掌握 R语言
进行数据分析。
本书一共有8章。各章的内容设置如下。
第1 章:R语言与数据分析。该章主要介绍 R语言
与 Rstudio
的安装与使用,数据分析的简要内容,以及 R语言
在数据分析上的优势等。帮助读者快速建立起对 R语言
数据分析的全面认知,为后面的学习做准备。本书涉及到的数据分析方法主要有下面这些:
本书涉及到的数据分析方法
第2章:R语言快速入门。R语言
快速入门。该章主要是对R语言的使用进行快速入门,详细介绍 向量
、矩阵
、数组
、数据框
、列表
、判断与循环语句
,以及如何编写R函数
等内容。
第3章:R语言数据管理与操作。该章主要介绍R语言中如何对数据进行读取与保存、缺失值处理,数据并行计算,数据选择、分组计算,数据融合以及数据长宽变换,时间数据与文本数据的操作等内容。
第4章:R语言数据可视化。该章主要介绍 R语言
中流行的数据可视化方式的使用,主要包括基础数据可视化包graphics
的使用,ggplot2
绘图系统的使用,以及R语言中其它常用的第三方数据可视化的使用。
部分可视化图像展示
第5 章:R语言数据分析。该章主要介绍常用数据分析方法,如相关性分析
、方差分析
、数据降维算法
、数据回归分析
、数据分类算法
、数据聚类算法
以及时间序列预测
相关的算法等,并使用 R语言
结合实际的数据集进行数据分析实战。
部分可视化图像展示
第6章:综合案例1:中药材鉴别。该章从数据分析实战应用出发,结合真实的中药材红外特征数据集,介绍了如何利用R 语言将数据可视化、数据分析,以及机器学习算法相结合,对中药材鉴别中的相关问题进行解决。在应用无监督学习时,主要使用聚类算法对数据进行聚类分析,使用数据降维算法对数据进行降维分析;在使用有监督学习时,主要以特征选择、数据降维与分类算法相结合的方式,对数据进行分类。
部分分析结果可视化图像展示
第7章:综合案例2:抗乳腺癌候选药物分析。该章使用R语言分析了一个抗乳腺癌候选药物数据分析案例,主要介绍数据可视化探索分析、数据重要特征选择、数据回归分析算法、数据降维算法,以及数据分类等算法的应用。
部分分析结果可视化图像展示
第8章:综合案例3:文本内容数据分析。该章以R语言对新闻文本数据、《三国演义》文本数据进行分析为例,主要介绍在文本分析中常用的数据准备与清洗、特征提取、文本数据可视化、数据聚类、数据分类等相关方法的应用。
部分分析结果可视化图像展示
书籍实拍展示
学习交流群
本书在编写时使用相关资源的最新版本库,但是由于 R语言
以及相关包的迅速发展,以及作者水平有限,且编写时间仓促,书中难免存在疏漏,敬请读者不吝赐教。
今天的分享就到这里了,敬请期待下一篇! |
最后欢迎大家分享转发,您的点赞是对我的鼓励和肯定!