用《R数据科学》学习一套数据处理语法

关注图灵教育

用《R数据科学》学习一套数据处理语法

转载

图灵教育 2023-06-27 19:35:29

文章标签 编程语言 python html 数据可视化人工智能 文章分类 Html/CSS 前端开发

用《R数据科学》学习一套数据处理语法_编程语言

这套语法就叫 tidyverse，先用一套小抄 Cheat Sheet 来镇贴。

抛开社区讲语言都是耍流氓，比如说 Python 可以克隆 ggplot2 包，语法几乎一样，用起来不会有太大的差别，但克隆不了 ggplot2 的整个社区以及由社区所衍生出来的各种扩展包，比如我写的 ggtree，所以你在 Python 里用 ggplot2 还是会觉得少了点什么，差了那么点意思。

而做生信的我们是避免不了 R 的，因为有 Bioconductor 社区，在基因组学，特别是单细胞数据分析上，已经是独步江湖了。

要学 R，有基于 S 语言的上古资料（可怜我当年就看了不过这样的资料），有各种统计的史前资料（也被这种资料虐得死去活来），当然也有面向数据科学项目的现代资料，而这个分水岭离不开一个大神 Hadley Wickham。

《R语言数据科学》就是 Hadley 大神的作品，正如中文版的《R数据科学》的副标题写的：

摒弃其他 R 语言工具书从头到尾讲统计的陋习
从实用的 R 包出发，带你重新认识 R 和数据科学

这本书介绍了 tidyverse 语法，也就是一套解决各种数据科学难题的动词，全书分为五个部分：

探索
处理数据
编程
模型
沟通

让你通过搭积木的方法对数据进行探索、处理、分析和呈现等。这是一本为现代人写的数据科学入门书，入手快，不需要太多时间去学习，为像你一样的懒人量身定制。

插播个话外音，在书中第9页说到：

ggplot2 只能同时使用六种形状，默认情况下，当使用这种图形属性时，多出的变量值将不会出现图中。

这个问题已经被我们团队解决，请移步《ggsymbol让点图样式更加丰富的R包》

用《R数据科学》学习一套数据处理语法_html_02

R语言社区领军人物著作

本书的目标是教会读者使用最重要的数据科学工具，从而为实施数据科学奠定坚实的基础。读完本书后，你将掌握R语言的精华，并能够熟练使用多种工具来解决各种数据科学难题。

每一章都按照这样的顺序组织内容：先给出一些引人入胜的示例，以便你可以整体了解这一章的内容，然后再深入细节。本书的每一节都配有习题，以帮助你实践所学到的知识。

用《R数据科学》学习一套数据处理语法_python_03

赞
收藏
评论
分享
举报

上一篇：科普大V河森堡：用科学的方法回答哲学问题

下一篇：Go语言简史

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册