统计参考书:《统计建模与R软件》用于管理R工作空间的函数: 常用R对象:向量c() 矩阵matrix() 数组array() 数据框dataframe() 列表list() 因子factor() 创建向量和矩阵 产生向量 Seq()函数 ——以指定的规律产生向量 产生字母序列letters which()函数——直接用返回的都是下标 rev()函数 ——向量颠倒 so
转载 2023-05-18 11:21:02
172阅读
适用于初学者。内容包括CSV文件的读取,整理合并表格,按需求分组并筛选所需数据并可视化。使用到的数据:链接:https://pan.baidu.com/s/1yhzQSdquizLayXamM0wygg  提取码:3b7i案例简介用到的数据共4张表(cvs格式),为2003-2019年美国纽约市房地产交易数据。        NYC_HISTORI
下面介绍四个案列,来讲解基本的统计学知识和剖面指数和期望值 第一个是分析男女对不同饮料的倾向 #设置工作路径 setwd("D:\\数据分析\\R语言基础") Lst<-scan("drink.data",what=list("sex","type")) #table统计频数 a<-table(Lst) margin.table(a,1) prop.table(a,1) table函数
1、关键点#典型相关分析##典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系#例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性#将研究两组变量的相关性问题转化为研究两个变量的相关性问题 此类相关为典型相关##总体典型相关#样本典型相关#典型相关计算 cancor(x,y,xcenter=TRUE,ycenter=TRU
转载 2023-05-24 21:44:06
631阅读
作者简介 Introduction聚类分析是一种机器学习领域最常用的分类方法,它在在客户分类,文本分类,基因识别,空间数据处理,卫星图片处理,医疗图像自动检测等领域有着广泛应用。聚类就是将相同,相似的对象划分到同一个组中,聚类分析事前不需要参考任何分类信息,可以通过判断数据表特征的相似性来完成对数据的归类。在聚类分析中,观测值的类别一般情况下是未知的。我们希望将观测值聚类为合适的几个分
转载 2024-06-17 21:37:01
35阅读
我们在这里讨论所谓的“分段线性回归模型”,因为它们利用包含虚拟变量的交互项读取数据data=read.csv("artificial-cover.csv")查看部分数据head(data) ## tree.cover shurb.grass.cover ## 1 13.2 16.8 ## 2 17.2 21.8 ##
在本节中我们将着眼于类别型变量的频数表和列联表,以及相应的独立性检验,相关性度量。 在本节中我们除了使用基础安装中的函数,还将连带使用vcd包和gmodels包中的函数。 本节使用的数据时来自包vcd中的Arthritis数据集,这是一个关于风湿性关节炎新疗法的双盲实验结果> library(vcd) 载入需要的程辑包:grid Warning message: 程辑包‘vcd’是用R版本3
转载 2023-06-20 14:13:58
557阅读
目录1. LDA原理2. 瑞利商与广义瑞利商3. LDA二分类4. LDA多分类5. LDA降维算法流程6. LDA优缺点LDA与PCA的区别 1. LDA原理一种经典的降维方法线性判别分析(Linear Discriminant Analysis, 以下简称LDA)。LDA是一种监督学习的降维技术,PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括,就是“投影后类内方差最
转载 2024-05-29 16:18:36
323阅读
一、数据整合的对象# Loading necessary libraries library(readxl) library(dplyr) # Reading the data from Excel files data_1 <- read_excel("yunnanbaiyao.xlsx") data_2 <- read_excel("冰山.xlsx")二、数据整合的代码数据集和代
 题目           MASS 库中包含 Boston (波士顿房价)数据集,它记录了波士顿周围 506 个街区的 medv (房价中位数)。我们将设法用 13 个预测变量如 rm (每栋住宅的平均房间数), age (平均房 龄), lstat (社会经济地位低的家庭所占比例)等来
利用R语言进行数据分析1 前言2 问题及解决思路和代码2.1 问题1:逻辑判断生成新变量2.1.1 问题描述2.1.2 规则2.1.3 对应的R语言基础2.1.4 伪代码2.1.5 真正的实现2.1.6 分组计算得结果2.2 问题2:正则提取特征+绘制对比箱线图2.2.1 问题描述2.2.2 正则提取12.2.3 正则提取22.2.4 绘图参考 1 前言最近无论是实习还是做项目,更多的都是使用P
本节书摘来自华章社区《R语言机器学习:实用案例分析》一书中的第1章,第1.3节使用函数,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sarkar),更多章1.3 使用函数接下来,我们将介绍函数。函数是一种有助于简单地结构化和模块化代码的技术或者方法,它是一组完成特定任务的具体代码行,当你需要执行该任务时可以直接执行该函数,而不需要再次编写它们。在R中,函
一、聚类分析的概念聚类分析时一种原理简单、应用广泛的数据挖掘技术。聚类分析即是把若干事务按照某种标准归为几个类别,其中较为相近的聚为一类,不那么相近的聚于不同类聚类分析研究对样本或变量的聚类,在进行聚类时,可使用的方法有很多,而这些方法的选择往往与变量的类型有关,由于数据的来源及测量方法的不同,变量大致可以分为两类:定量变量;定性变量二、聚类算法聚类算法种类繁多,其中绝大多数可以用R实现,下面将
文章目录前言一、多因素logistic回归分析1. 数据准备2. 回归分析 前言logistic回归分析是医学统计分析过程中常用的一种影响因素分析的方法,最常用的是二元logistic回归分析,即以二分类数据为因变量的logistic回归分析。上次已经和大家分享了批量进行logistic回归分析的代码,接下来将分享多因素logistic回归分析的代码。一、多因素logistic回归分析多因素lo
# R语言文本案例分析入门指南 在数据分析领域,文本数据的处理和分析越来越重要。R语言作为一种强大的数据分析工具,提供了许多处理文本数据的函数和包。本文将带领你通过一个简单的案例,了解如何使用R语言进行文本案例分析。我们将按照以下流程进行: | 步骤 | 描述 | |----------|-----
# R语言文本分析案例 ## 简介 文本分析是指通过对文本数据进行处理和分析,从中提取有用的信息和知识的过程。R语言是一种功能强大的统计分析工具,也被广泛应用于文本分析领域。本文将介绍一个简单的文本分析案例,并使用R语言进行实现。 ## 案例背景 假设你是一家电商公司的数据分析师,公司希望了解用户对于他们的产品的评价和意见。为了实现这一目标,你需要对用户的评论进行文本分析,以获取有关产品的信息
原创 2023-07-22 03:59:02
180阅读
什么是检验对?检验对的形式(x1,x2)(X1,X2)出现在两种情况中:对同一实体执行两次测量。例如,一项评估新型胰岛素疗效的临床研究将为每位患者测量两次血糖水平:之前(X1X1)服药后(X2X2)。 对不同的实体进行测量。但是,实体根据其特征进行匹配。例如,为了测试药物的功效,您可能希望根据体重,年龄或其他特征配对研究参...
原创 2021-05-12 14:14:14
332阅读
什么是检验对?检验对的形式(x1,x2)(X1,X2)出现在两种情况中:对同一实体执行两次测量。例如,一项评估新型胰岛素疗效的临床研究将为每位患者测量两次血糖水平:之前(X1X1)服药后(X2X2)。 对不同的实体进行测量。但是,实体根据其特征进行匹配。例如,为了测试药物的功效,您可能希望根据体重,年龄或其他特征配对研究参...
原创 2021-05-12 14:23:05
670阅读
R语言中,数据分析是一个广泛且多样的领域,涵盖了数据清洗、探索性数据分析、可视化、统计建模和预测等各个方面。案例一,该案例涉及读取数据、数据清洗、探索性数据分析(EDA)和数据可视化。1. 数据准备假设我们有一个关于汽车数据集(例如mtcars数据集,它是R语言内置的一个小型数据集),我们将使用它来进行数据分析。2. 数据读取与加载对于mtcars数据集,我们不需要额外读取,因为它已经内置在R
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 看书标记——关于R语言chapter 1 【R语言 商务数据分析实战1】 chapter 1R语言数据分析概述常用数据操作packages dplyr:快速数据操作和数据查询 data.table:使用短小灵活的语法操作数据 reshape2:灵活的数据排列与聚合处理 tidyr:方便对数据进行整理、传播和收集 lubridate
  • 1
  • 2
  • 3
  • 4
  • 5