1. 科普、入门
《大数据智能》,刘知远、崔安顺等著; 特色:系统,宏观和全面;
2. R 语言站点
http://langdawei.com/:R 语言数据采集与可视化;
转载
2017-01-02 18:51:00
148阅读
2评论
1. 科普、入门
《大数据智能》,刘知远、崔安顺等著; 特色:系统,宏观和全面;
2. R 语言站点
http://langdawei.com/:R 语言数据采集与可视化;
转载
2017-01-02 18:51:00
85阅读
2评论
今天给大家推荐一下C语言的书单,以下推荐仅从,实用、篇幅以及学习曲线角度推荐,还有一些常见的书籍没有列出。
原创
2022-03-07 17:11:57
1028阅读
一个人如果抱着义务的意识去读书,便不了解读书的艺术。——林语堂《生活的艺术》 ...
转载
2021-09-27 09:41:00
149阅读
2评论
一个人如果抱着义务的意识去读书,便不了解读书的艺术。——林语堂《生活的艺术》 整理了下这两年的书目并列举出来,此举主要的目的是督促自己,同时与诸君分享。
原创
2020-09-13 09:50:00
243阅读
这里是一些非开放书籍的列表,每本都会给出豆瓣的链接。语言相关Android
原创
2023-01-09 11:48:47
52阅读
9月:人性的弱点、18岁以后要懂点经济学 11月:深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)、Java多线程编程核心技术
1.决战大数据(升级版):大数据的关键思考 车品觉2.数据即未来 大数据的王者之道 美thon数据分析与挖掘实战9.解析pyth...
原创
2023-06-07 09:45:45
65阅读
https://www.zhihu.com/question/22794831/answer/584132368
原创
2021-07-25 10:36:55
155阅读
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授:
Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
转载
2023-06-30 18:38:28
305阅读
CC程序设计语言丢掉老谭的那本书吧书来用。C和指针可以说,选择了C语言就选择了指针,C语言和其它语言不同的一点
原创
2023-07-14 18:10:43
46阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载
2023-06-25 20:40:28
178阅读
温故而知新6.函数6.5 自定义函数基本使用> ce2fa <- function(ce){
+ fa <- 1.8 * ce + 32
+ return(fa)
+ }
> ce2fa(0)
[1] 32
> ce2fa(0:10)
[1] 32.0 33.8 35.6 37.4 39.2 41.0 42.8 44.6 46.4 48.2 50.0
>
转载
2023-08-23 14:20:17
0阅读
文本分词,就是对文本进行合理的分割,从而可以比较快捷地获取关键信息。例如,电商平台要想了解更多消费者的心声,就需要对消费者的文本评论数据进行内在信息的数据挖掘分析,而文本分词是文本挖掘的重要步骤。R语言中,对中文分词支持较好的包有RWordseg包和jiebaR包,这里学习jiebaR包。一、jiebaR包简介jiebaR 是中文分词的R语言版本,支持最大概率法(Maximum Probabili
原创
2022-05-21 11:46:00
401阅读
1 replicationrep 函数能把输入的参数重复数次。另一个相关函数replicate 则能调用表达式数次。大多数情况下它们基本相等,只有当使用随机数时才会出现不同。现在,假定生成均匀分布随机数的runif 函数不是矢量化的,那么rep 函数每次都将重复相同的随机数,而replicate 每次的结果都不相同(由于历史的原因,其参数顺序竟然是从后到前的,这有点烦人):rep(runif(1)
转载
2023-07-09 17:00:04
208阅读
在既往文章中,我们已经介绍了R语言计算人年及可信区间的计算。但是计算的是总的人年发病率的比较情况,假如我们想知道分层发病率的情况呢?拿既往乳腺癌的数据为例子,我们已经知道了有淋巴结肿大和没有淋巴结肿大患者总的生存率的比较,但是如果我们想了解在每个年龄段有淋巴结肿大和没有淋巴结肿大患者生存率有无区别?如下图 我们以R语言survival包演示泊松回归年龄分层发病率统计,继续使用我们的乳腺癌数据(公众
转载
2023-08-30 19:55:00
118阅读
回归分析是科学研究中十分重要的数据分析工具。随着现代统计技术发展,回归分析方法得到了极大改进。混合效应模型(Mixed effect model),或称多水平模型(Multilevel model)/分层模型(Hierarchical Model)/嵌套模型(Nested Model),无疑是现代回归分析中应用最为广泛的统计模型,代表了现代回归分析主流发展方向。混合效应模型形式灵活可以应对现代科学
转载
2023-07-11 09:45:08
145阅读
全面的回归分析包括对异常值的分析:离群点、高杠杆值点、强影响点。 离群点:模型效果不佳的观测点。 使用car包中的outlierTest()函数,可以求得最大标准化残差绝对值Bonferroni调整后的p值,若不显著,则说明数据集中没有离群点,若显著,则必须删除该离群点。 > library(car)
> outlierTest(fit)可见,在这个回归模
转载
2023-08-13 20:56:44
191阅读