一、 统计学习概述 统计学习是指一组用于理解数据和建模的工具集。这些工具可分为有监督或无监督。1、监督学习:用于根据一个或多个输入预测或估计输出。常用于商业、医学、天体物理学和公共政策等领域。2、无监督学习:有输入变量,但没有输出变量,可以从这些数据中学习潜在关系和数据结构。以下简单的用3个数据集来说明。1、工资数据 我们希望了解雇员的年龄、教育和年份
转载
2023-10-25 10:22:36
14阅读
R语言中统计分布和模拟前言 很多应用都需要随机数。像interlink connection,密码系统、视频游戏、人工智能、优化、问题的初始条件,金融等都需要生成随机数。但实际上目前我们并没有“真正”的随机数生成器,尽管有一些伪随机数生成器也是非常有效的。目录 1. 概率统计分布概述 2. 随机函数模拟介绍 3. 密度函数模拟介绍 4. 分布函数模拟介绍 5. 分位数函数模拟介绍 6. 函数模拟
转载
2023-06-21 16:27:26
177阅读
文章目录基本统计分析1基本方法summary()函数apply()函数lapply()函数sapply()函数2.常见的描述指标标准误binom.test (二项分布精确检验)变异系数极差偏度系数(skewness)3分组计算描述性统计量aggregate()函数by()函数频数表和列联表列联表生成频数表一维列联表二维列联表3多维列联表非参数检验假设检验(Hypothesis Testing)符
转载
2023-09-18 21:54:12
392阅读
1.为何使用R与起源于贝尔实验室的S语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。但是,市面上也有许多其他流行的统计和制图软件,如Microsoft Excel、SAS、IBM SPSS、Stata以及Minitab。为何偏偏要选择R? R有着非常多值得推荐的特性。 多数商业统计软件价格不菲,投入成千上万美元都是可
转载
2023-08-17 16:48:23
95阅读
目的: 1.描述性统计分析 2.频数表和;列连表 3.相关系数和协方差 4.t检验 5.非参数统计在上一节中使用了图形来探索数据,下一步就是给出具体的数据来描述每个变量的分布和关系1.描述性统计分析 探究案例:各类车型的油耗如何?对车型的调查中,每加仑汽油行驶的英里数分布是什么形式(均值,标准差,中位数,值域等) 1.1使用内置的summary函数来获取最小值,最大值,四分位数和数值
转载
2023-08-22 11:29:50
60阅读
在数据挖掘中,统计学习方法常常用到R语言,因此,我们后面将对R语言在统计学习中的应用进行专题介绍,方便从理论上对统计学习有进一步深入的认识。1初始步骤开始运营R很简单,一种可以从系统菜单启动,双击图标或在系统命令行中输入命令”R“。这将产生一个控制台窗口,或在当前终端窗口启动一个交互式程序。在这两种情况下,R都是通过问答模式工作,即输入命令行并按下Enter键,然后程序运行,输出相关结果,继续要求
转载
2023-08-30 20:53:51
136阅读
Chapter 2 Data Collection本篇是第二章,内容是数据收集。1.数据来源做科学研究离不开数据,而数据的来源有哪些呢? 这里比较简单地将数据来源分为两类:直接(一手)数据和间接(二手)数据。 直接数据的数据获取来源包括:观测、调查、实验。 间接数据的数据获取来源包括:出版物、互联网等。 接下来分别谈谈这几个来源。 观测——自然科学里有观测,如气象气候、植物生长期等,社会科学同
转载
2024-07-25 12:50:43
15阅读
【R语言数据科学】(十四):随机变量和基本统计量✨本文收录于【R语言数据科学】本系列主要介绍R语言在数据科学领域的应用包括: R语言编程基础、R语言可视化、R语言进行数据操作、R语言建模、R语言机器学习算法实现、R语言统计理论方法实现。文章目录【R语言数据科学】(十四):随机变量和基本统计量前言1.随机变量2.抽样模型3 随机变量的概率分布4.基本统计量5.总体方差和样本方差前言在数据科学中,我们
转载
2023-06-07 12:47:26
207阅读
基础操作 #获取当前脚本所在位置
getwd()
#更改脚本位置
setwd(dir = "C:/Users/LG/Desktop/R") #注意斜杠是正斜线
#查看当前目录下存在的文件
dir()x<-5 #赋值给局部变量
y<<-3 #赋值给全局变量x <- sum(1,2,3,4,5)
y <- 5
rm(x,y)
转载
2023-10-25 20:59:02
122阅读
“ 本章节是数据预处理的第一步:了解数据(集)。只有充分了解了数据,我们才能对数据做进一步的预处理和后续深入的分析。”目录1 数据结构str()dim()head()2 描述性统计分析summary()psych::describe()分组计算doBy::summaryBy分组计算psych::describeBy3 频数和列联表table 一维计数xtabs 多维(交叉)计数gmo
转载
2023-06-21 18:32:19
380阅读
R是一门著名的可用于数据和统计分析的程序语言,本文翻译自R软件官方文档教程《An Introduction to R》,仅供学习和参考。11 R中的统计模型本节假定读者对统计方法有一定的了解,特别是回归分析和方差分析。后面我们还会假定读者对广义线性模型和非线性模型也有所了解。拟合统计模型的基本要求在R中已经得到了充分的定义,从而使得我们可以轻松构建适用于广泛问题的通用工具。R 提供了一系列紧密联系
转载
2024-06-16 12:15:20
65阅读
在数据分析和统计建模中,R语言作为一种强大的编程工具,得到了广泛的应用。R语言的模拟能力使得我们能够利用随机数生成技术,对复杂系统进行仿真,从而帮助我们理解数据的内在规律。本篇博文将详细记录利用R语言进行模拟的过程,涵盖技术原理、架构解析、源码分析等多个方面。
### 背景描述
在数据驱动的决策中,模拟技术逐渐成为一种重要的方法。通过对随机事件的模拟,我们能够进行预测、评估风险并优化决策。例如,
#Chapter 5 Estimation 本篇是第五章,内容是参数估计。1.参数估计的一般问题正如前面介绍的,统计学的两大分支,分别是描述统计和推断统计。所以今天来谈谈推断统计的第一大问题——参数估计。当然一般叫统计推断的会更多些,二者是一样的。 统计推断(Statistical Inference)——主要包括参数估计和假设检验,实质就是通过样本的均值、标准差、方差等去估计总体的均值、标准差
转载
2023-09-28 13:09:31
72阅读
目录1、R简介1.1 R: 用于统计分析的语言1.2 R的下载与安装2、数据的载入与存储3、R的数据结构3.1 R基本数据类型3.2 R的数据处理对象3.3 常用运算符4、统计分析实例——数据载入与初步处理5、R的控制流1、R简介1.1 R: 用于统计分析的语言什么是R: 不同于JAVA等编程语言,R是一门用于统计分析、数据挖掘的语言 为什么学R: • 高质量、丰富的统计工具 • 免费的开源软件
转载
2023-05-24 10:27:33
142阅读
一、 统计学习概述 统计学习是指一组用于理解数据和建模的工具集。这些工具可分为有监督或无监督。1、监督学习:用于根据一个或多个输入预测或估计输出。常用于商业、医学、天体物理学和公共政策等领域。2、无监督学习:有输入变量,但没有输出变量,可以从这些数据中学习潜在关系和数据结构。以下简单的用3个数据集来说明。1、工资数据 我们希望了解雇员的年龄、教育和年份
转载
2023-06-07 15:12:09
9154阅读
开篇先感谢 1.个人主页、博客、社区、论坛北大李东风[3]
中科大张伟平[4]
谢益辉(人称谢大大)[5]:统计之都论坛[6]创始人(与之有关的统计之都[7])
统计学资源链接大全[8]:知名 统计系、统计学会、统计组织、统计软件、统计期刊的官网(该老师的主页[9])
斯坦福大学统计系:Trevor Hastie[10]、Jerome H. Friedman[11]、Rob Tibshi
一、实验介绍--订单流模型拟合1.1 实验知识点指数核 hawkes 过程拟合正反馈强度分析订单量影响分析1.2 实验环境R 3.4.1Rstudio二、订单流模型拟合在上节中我们对订单流数据做了一些统计分析 , 对交易的一些特征有了一些粗浅的理解 , 在本节中 我们要做的是利用实际数据来拟合 hawkes 过程 ,看一看真实数据的订单流动力学中有什么特征。首先我们仍是选出交易时间内的数据:lib
转载
2023-06-16 20:12:15
28阅读
Python网络爬虫与文本数据分析本章内容导入停用词读数据,分词剔除停用词导入停用词表library(dplyr)stopwords<-readtext::readtext("data/stopwords.txt")%>%as.character()%>%stringr::str_split('\n')%>%unlist()#显示前50个停用词head(stopwords,
原创
2020-12-30 22:28:03
2668阅读
R语言是一种强大的统计分析工具,可以用于数据处理、可视化和模型建立。统计量是对样本或总体数据的一种度量,可以用来描述数据的中心趋势、离散程度等重要特征。本文将介绍一些常见的统计量计算方法,并用R语言进行代码示例。
1. 平均值(Mean)
平均值是最常见的统计量之一,它表示一组数据的中心位置。在R语言中,可以使用mean()函数来计算平均值。
```R
# 计算一组数据的平均值
data
原创
2023-09-14 19:06:17
273阅读
**医学统计 R语言实现流程:**
```mermaid
flowchart TD
Start --> 数据导入
数据导入 --> 数据清洗
数据清洗 --> 数据分析
数据分析 --> 结果呈现
结果呈现 --> End
```
**1. 数据导入:**
首先,我们需要导入医学统计所需的数据集。可以使用以下代码:
```R
# 读取csv文件
da
原创
2024-06-06 04:58:20
36阅读