1. dplyr简介dplyr是R语言的数据分析包,类似于python中的pandas,能对dataframe类型的数据做很方便的数据处理和分析操作。最初我也很奇怪dplyr这个奇怪的名字,我查到其中一种解释 - d代表dataframe - plyr是英文钳子plier的谐音dplyr如同R的大多数包,都是函数式编程,这点跟Python面向对象编程区别很大。优点是初学者比较容易接受这种函数式思维
# R语言中 'No such file or directory' 错误解析与处理方法 ## 引言 在使用R语言进行数据分析或编程时,有时会遇到 'No such file or directory' 的错误提示。这个错误通常出现在尝试读取文件或访问文件路径时,说明R无法找到指定的文件或目录。本文将解析这个错误的原因,并提供一些常见的处理方法,帮助读者在遇到这个错误时能够快速定位和解决问题。
原创 2023-08-29 07:18:53
3624阅读
1点赞
错误原因:这主要是因为node后面多了\r这个字符的原因。在linux终端下,输出\r会什么都不显示,只是把光标移到行首。于是终端虽然输出了/usr/bin/env bash,但是碰到\r后,光标会被移到行首,接着输出了:No such file or directory把前面的覆盖掉了。于是出现了那个莫名其妙的出错信息了 解决方法:使用vim打开要运行的脚本文件:set ff=unix
转载 2023-07-11 19:22:06
0阅读
目录1、小组分工2、数据采集与预处理 2.1、数据采集与校正2.2、数据异常值检验与处理 2.2.1缺失值检测与处理2.2.2离群点检测与处理3、相关性分析与相关性检验 3.1、相关性分析 3.2、相关性检验4、拟合回归方程 4.1、使用主成分分析拟合一元线性回归方程 4.2、使用最小二乘法拟合多元线性回归方程5、模型评估与回归诊断6、结果分析1、小组分工A:编写代码、数据采集、整
  〇、序Python是一种面向对象的解释型计算机程序设计语言,其使用,具有跨平台的特点,可以在Linux、macOS以及Windows系统中搭建环境并使用,其编写的代码在不同平台上运行时,几乎不需要做较大的改动,使用者无不受益于它的便捷性。此外,Python的强大之处在于它的应用领域范围之广,遍及人工智能、科学计算、Web开发、系统运维、大数据及云计算、金融、游戏开发等。实现
# 如何解决R语言does not exist in current working directory 作为一名经验丰富的开发者,你经常会遇到一些新手的问题,比如他们遇到了R语言中的"does not exist in current working directory"这样的错误。这个问题其实很容易解决,下面我将详细告诉你解决这个问题的步骤和方法。 ## 解决步骤 首先,我们来看一下整个
原创 3月前
135阅读
在本节课程中,我们学习​​R​​中有关工作空间的内容,并探索工作空间和计算机文件系统之间的关系。 由于不同的操作系统在诸如文件路径之类的东西上有不同的约定,因此某些命令的输出可能会在不同系统之间有所不同。但是,​​R​​​提供了用于与文件交互的通用​​API​​(一组通用命令),这样我们的代码即可在不同类型的计算机上工作。
转载 2023-06-17 10:53:22
422阅读
  现实的情况是,我们大部分遇到的都是表格数据,在R语言里面叫数据框,数据来源一般不可能我们自己在程序开始前手动录入,正常的逻辑是从外面读取现成的数据,再预处理、建模什么的。根据经验,现在的数据来源主要是Excel,数据库,文本文档(csv)和剪贴板。今天就先把数据的导入解决一下,后面再来研究一下怎么处理这些数据。【Excel读取】  这个最常用,但是在R里面第一次用的时候稍微
If you are working on a Unix / Mac, then this error is because you have the incorrect line endings.here are some steps to correct. Set your line endings correctly, and have git manage how it handles them. $ git config --global core.autocrlf input
原创 2021-06-04 17:41:44
1801阅读
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载 2023-06-25 20:40:28
178阅读
SAS数据分析系统与R语言分析,这2者之间的争论从未停止,他们就像是Windows系统和MacOS,iOS和安卓,只要一拿出来,就会引来各自拥护者不同的声音。SASSAS已成为商业分析领域无可争议的市场领导者。它提供非常丰富的统计功能, 具有良好的图形用户界面(Enterprise Guide&Miner),便于人们快速学习,并提供出色的技术支持。然而,最终它成为最昂贵的选择,还不具备丰富
测试数据
转载 2020-08-04 10:39:25
109阅读
文章目录dplyr介绍安装数据集:starwars针对单个数据集的操作filter()根据条件筛选行arrange()进行排序slice()根据位置选择行select()选择列mutate()新建列relocate()重排列的位置summarise()汇总grouped datagroup_by()查看分组信息增加或改变用于聚合的变量移除聚合的变量联合使用summarise()`select()
广义可加模型(generalized additive models,GAMs)是广义线性模型和可加模型的结合,由 Hastie T 和 Tibshirani R于1986 年首先提出,其不要求应变量与自变量满足线性关系,适用于非线性数据的研究。既往我们已经介绍了使用VGAM包进行广义可加模型,今天我们继续来介绍使用mgcv包进行广义可加模型,这里我们使用我们原来的臭氧的数据(公众号回复:臭氧可以
转载 2023-07-26 12:25:34
276阅读
 001、test <- "xx aa yy zz" ## 测试字符串 strsplit(test, split = " ") ## split = 用于指定分割的依据, 此处设定为空格 strsplit(test, split = "") ## 指定分割依据为空白 strsplit(test, NULL) ## NULL参数指定分割依据
转载 2023-05-28 15:26:17
0阅读
作者 | 二缺叶枫最近在做一些特征提取的工作,过程中因为要展现一些决策树的逻辑规则,所以就简单的绘制了生成的树。BUT!plot画出来的风格简直不能忍,于是乎就去查找了各种美化方法,今天要说的就是我是怎么美化一颗树的。先来看看最初画出来的图!要画的数据集大概是这个样子的。head(kyphosis) Kyphosis Age Number Start 1 absent 71 3
转载 2023-08-16 13:06:16
104阅读
R的维护工作由一个国际化的开发者团队负责。R软件的官方下载页面叫作The Comprehensive R Archive Network,即CRAN。一、官网下载R安装包:https://cran.r-project.org   进入链接,如下图所示,在页面顶部提供了三个下载链接,分别对应三种操作系统:Windows、Mac和Linux。请选择自己操作系统对应的链接,接下来我将
转载 2023-07-28 13:27:45
115阅读
  量化投资中经常提到的alpha(收益)和beta(收益)是从资本资产定价模型(CAPM)中衍生出来的概念。CAPM是一个给风险定价的基本模型,它认为只有系统风险(Systematic risk)才能带来收益。这是因为非系统风险(Nonsystematic risk)可以通过投资组合的方式消除掉,如果非系统风险也可以带来收益,就意味着人们可以通过构建投资组合的方式不承担风险而白得收益,这种情况下
转载 2023-07-04 20:49:17
7阅读
第一章,R语言介绍一、为何要使用R 1、R是一种为统计计算和绘图而生的语言和环境(R是用于统计分析、绘图的语言和操作环境)2、R拥有顶尖水准的制图功能3、R是一个可进行交互式数据分析和探索的强大平台4、R可以运行于多种平台上,win、UNIX、Mac5、R的功能可以被整合进其他语言编写的应用程序,C++、Java、Python、PHP、、、 二、R的使用 1、R是一种
  • 1
  • 2
  • 3
  • 4
  • 5