一个很大的矩阵, 320127 行, 8189列,假如用一个全为0的普通矩阵来存储,需要用到9.8Gbcols 8189
rows 320127
mat matrix(data = 0, nrow=320127, ncol = 8189)
print(object.size(mat), unit="GB")
# 19.5 Gb
mat matrix(data = 0L, nrow=320127,
转载
2024-01-26 20:38:49
102阅读
# 实现arima.sim r语言
## 介绍
在时间序列分析中,ARIMA模型(自回归滑动平均模型)是一种常用的模型,用于对时间序列数据进行建模和预测。在R语言中,我们可以使用`arima.sim`函数来生成符合ARIMA模型的人工时间序列数据。本篇文章将向你介绍如何使用R语言实现`arima.sim`函数。
## 整体流程
下面是使用R语言实现`arima.sim`函数的整体流程:
|
原创
2023-09-04 13:03:11
792阅读
# 使用R语言进行Sim分位数分析的基础知识
## 引言
在数据科学和统计分析中,分位数是一种非常重要的统计指标,能够帮助我们对数据进行更深入的理解。而R语言作为一种强大的统计分析工具,提供了多种方法来计算和可视化分位数。本文将通过一个示例,介绍如何使用R语言中的`sim`包进行分位数分析,并阐述相关的概念和可视化技巧。
## 什么是分位数?
分位数是将一组数据分成若干部分的切割点。最常见
原创
2024-08-09 10:33:42
89阅读
1、R脚本和批处理启动R默认运行一个交互式的R会话,从键盘接受输入,并从屏幕输出。当然R也接受脚本执行,使用命令source("script.R")来执行R脚本。使用sink("outputfile")将文本输出重定向到outputfile;如果文件没有写明具体路径,则表示在当前工作空间下默认情况下,如果文件outputfile存在则内容将会被覆盖;使用参数append=TRUE指明将文本追加到o
转载
2023-10-17 12:02:38
259阅读
2014年刚到, 就在 Feedly 订阅里看到 RStudio Blog 介绍 dplyr 包已发布 (Introducing dplyr), 此包将原本 plyr 包中的 ddply() 等函数进一步分离强化, 专注接受dataframe对象, 大幅提高了速度, 并且提供了更稳健的与
# 实现ARIMA.SIM FILTER函数的R语言
## 概述
本文将介绍如何在R语言中使用arima.sim函数和filter函数来实现ARIMA.SIM FILTER函数的功能。ARIMA.SIM FILTER函数主要用于生成符合ARIMA模型的时间序列数据,然后对生成的数据进行滤波。
## 流程
以下是使用arima.sim函数和filter函数实现ARIMA.SIM FILTER函数
原创
2023-09-08 12:32:35
282阅读
Arima预测模型(R语言)ARIMA(p,d,q) 模型全称为 差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA), AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。 所谓ARIMA模型,是指
转载
2023-07-19 21:59:04
436阅读
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授:
Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
转载
2023-06-30 18:38:28
419阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载
2023-06-25 20:40:28
271阅读
http://blog.sina.com.cn/s/blog_597fcb450100c3um.html 【转】R与SAS、SPSS的比较 (2009-03-05 20:29:40)
转载 标签: 教育分类: 学习R与SAS、SPSS的比较R语言 R是用于统计分析、绘图的语言和操作环境。R是
下载和安装Windows环境的R1.进入主页,点击 蓝色加粗的 download R 2.随便点击一个镜像,这里点击的是http://mirror.fcaglp.unlp.edu.ar/CRAN/ 3.点击Download R for Windows 4.点击install R for the first time. 5.点击 Dow
转载
2023-11-03 09:07:58
380阅读
一、预备知识1.使用图形 #绑定数据框mtcarsattach(mtcars)#打开一个图形窗口并生成散点图plot(wt,mpg)#添加一条最优拟合曲线abline(lm(mpg~wt))#图形名称title("aaa")#数据框解除绑定detach(mtcars)2.图形的保存 pdf() 、 win.metafile()、png()、jpeg()、bmp()、tiff()、xfig()等其他
转载
2023-08-10 11:15:26
164阅读
R语言和集算器吸引人的地方之一在于,它们的代码风格都比较敏捷,用简短的代码就可以实现丰富的功能。比如都可以写出”Vector Computing”表达式,对判断语句都进行了简化,都可以把基础函数扩展成高级函数,都支持泛型。其中向量化计算的特点是用函数和运算符处理批量数据,避免循环语句。这将带来2个优点:使程序员可以轻松掌握,降低学习成本;方便实现计算,提高性能。下面用几个例子来比较一下R和集算器在
转载
2023-08-18 13:01:45
159阅读
R 语言实战(第二版)## part 3 中级方法-------------第8章 回归------------------#概念:用一个或多个自变量(预测变量)来预测因变量(响应变量)的方法
#最常用:OLS——普通最小二乘回归法,包括简单线性回归、多项式回归、多元线性回归
#过程:拟合OLS回归模型——>评价拟合优度——>假设检验——>选择模型
#OLS回归
#目标:减少因
转载
2023-08-11 13:56:29
310阅读
在既往文章中,我们已经介绍了R语言计算人年及可信区间的计算。但是计算的是总的人年发病率的比较情况,假如我们想知道分层发病率的情况呢?拿既往乳腺癌的数据为例子,我们已经知道了有淋巴结肿大和没有淋巴结肿大患者总的生存率的比较,但是如果我们想了解在每个年龄段有淋巴结肿大和没有淋巴结肿大患者生存率有无区别?如下图 我们以R语言survival包演示泊松回归年龄分层发病率统计,继续使用我们的乳腺癌数据(公众
转载
2023-08-30 19:55:00
138阅读
作者:圈圈Getting Data In and Out of R(一)读取数据读取数据所需的几种函数:read.table、 read.csv:最常用的读取列表数据函数,可返回数据框形式。readLines:逐行读取文本文件,返回一个字符向量source:读取R代码、脚本dget:读取R代码(读取的是以逆句法分析后以文本文件储存的R对象)load、 unserialize:把
转载
2023-10-12 11:04:39
144阅读
R语言︱情感分析—基于监督算法R语言实现笔记。可以与博客 R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)对着看。 词典型情感分析大致有以下几个步骤:训练数据集、neg/pos情感词典、分词+数据清洗清洗(一、二、三级清洗步骤)、计算情感得分、模型评价 ———————————————————————————————————————————— 
全面的回归分析包括对异常值的分析:离群点、高杠杆值点、强影响点。 离群点:模型效果不佳的观测点。 使用car包中的outlierTest()函数,可以求得最大标准化残差绝对值Bonferroni调整后的p值,若不显著,则说明数据集中没有离群点,若显著,则必须删除该离群点。 > library(car)
> outlierTest(fit)可见,在这个回归模
转载
2023-08-13 20:56:44
323阅读
温故而知新6.函数6.5 自定义函数基本使用> ce2fa <- function(ce){
+ fa <- 1.8 * ce + 32
+ return(fa)
+ }
> ce2fa(0)
[1] 32
> ce2fa(0:10)
[1] 32.0 33.8 35.6 37.4 39.2 41.0 42.8 44.6 46.4 48.2 50.0
>
转载
2023-08-23 14:20:17
7阅读
加载可能用到的包library(xml2)
library(rvest)
library(reshape2)
library(ggplot2)
library(dplyr)读取数据打开数据来源的链接,鼠标点击右键检查,将内容复制到文本文件中,我这里命名为new1.txtpage"new1.txt")
JokicJokic[[9]]
list(Jokic)
df1colnames(df1)首先看一看
转载
2023-11-03 12:30:17
96阅读