--------仅用于个人学习知识整理和sas/R语言/python代码整理--------文章使用数据都为脱敏模拟数据简介radiant是r的包,基于r shiny开发,可以对数据进行简单的分析,进阶可以进行统计建模分析,并支持报表输出radiant的开发者文档地址:radiant-rstats/docs2 数据导入及启动2.1 导入方法1(推荐使用这个)radiant本质是r语言包,所以可以先
转载
2024-08-30 16:45:10
143阅读
前言 最近想试一下捣腾一个 R 包出来,故参考了一些教程。现在看到的最好的就是谢益辉大大之前写过的开发R程序包之忍者篇,以及 Hadley 大神(ggplot2 devtools 等一系列包的作者)的 教程。但是前者有一些过时,后者是全英文的,所以我这里记录一下比较简单的过程,给读者们一个参考思路。如果你有一些 R 程序,想塞到去一个自创的 R 包中,那么这篇文章就可能是你想要的。为了方
转载
2023-09-02 15:12:54
589阅读
KNN 算法是 Cover 和 Hart 于1968 年提出一种基于统计的学习方法。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。等于就是把先数据通过特征空间属性,主要就是计算欧式距离,分为K个相近类别,后面的数据根据自己的属性划分到和自己属性最相似的类别上。我们通过R语言来演示一下近邻分析(KNN),先导入我们的R包和数据,library(class)
转载
2023-11-24 21:21:11
126阅读
目录 在 R 中估计 GARCH 参数存在的问题(续)rugarch简单实验rugarch 参数估计的行为极端大样本结论 在 R 中估计 GARCH 参数存在的问题(续)本文承接《在 R 中估计 GARCH 参数存在的问题》在之前的博客《在 R 中估计 GARCH 参数存在的问题》中,Curtis Miller 讨论了 fGarch 包和 tseries 包估计 GARCH(1, 1) 模型
转载
2024-07-25 14:27:45
176阅读
一、一些函数包大汇总时间上有点过期,下面的资料供大家参考基本的R包已经实现了传统多元统计的很多功能,然而CRNA的许多其它包提供了更深入的多元统计方法,下面要综述的包主要分为以下几个部分: 1) 多元数据可视化(Visualising multivariate data): 绘图方法: 基本画图函数(如:pairs()、coplot())和lattice包里的画图函数
转载
2023-11-22 15:34:57
369阅读
R包介绍及开发(初学者基础详解)一、R包概述1.1 R包简介1.2 R包下载1.3 R包安装1.4 R包使用二、创建R包2.1 R包架构及内容2.2 R包开发的环境配置2.2.1 R包开发准备2.2.2 R包构建工具准备2.2.2.1 R包开发工具包 | devtools包2.2.2.2 工具集 | RTools2.3 R包创建流程2.3.1 命名 | 创建R包2.3.1.1 R包命名规则2.3
ggplot2的优点 ggplot2可以让作图者根据ggplot2的作图语法来控制一下作图中的重要的因素,用起来可以说神通广大 ggplot2的主要元素: 1.data:数据 2,Aesthetic mapping:颜色、形状、点的大小与线的粗细 3,Statistical transformations:将数据做统计转换,比如概率密度,计数等等 4,Coordinate system:坐标轴的调
转载
2024-04-14 21:04:35
56阅读
tidyr包
类似于上图成行成列的表数据是干净数据(tidy data),一般每一行表示一条观测记录,每一列表示一个字段(变量) tidyr包是用来操作tidy data的包,主要的功能有数据变形(Reshape Data)分割数据(Split Cells)处理缺失值数据(Handle Missing Values)数据变形(Reshape Data)数据变形(Reshape Data)可以重构数
转载
2023-08-22 11:37:51
252阅读
R语言数据处理学习记录–使用linkET包完成mental test注:本文仅作为自己的学习记录以备复习查阅一 简单介绍一下这个包依旧是来自于GitHub上,作者给出的介绍:linkET的目标是简单而直接地可视化基于’ ggplot2 '的矩阵热图。其实作者已经给出了非常详细的包的使用方法,从Data processing到后面各种图形的绘制都有详细的代码和图片展示,所以这里just给一些无法很方
转载
2023-11-16 19:33:58
530阅读
gbm包wiki中对GBRT的定义gbm包在R中的使用基本建模函数参数选择最适的回归树个数例子 gbm包gbm包是梯度提升回归树(GBRT)在R 中的实现。GBRT,全称为Gradient Boosting Regression Tree, 有时也称为GBDT。wiki中对GBRT的定义Gradient boosting is a machine learning technique for r
转载
2023-07-11 15:17:22
236阅读
无经验尝试安装Hmisc的目录1. 探索中,想办法2. 更新R的版本3. 将新版R链接到Rstudio4.大功告成5. 总结 1. 探索中,想办法既然要安装Hmisc,我先看一下电脑里有没有这个包啊> library(Hmisc)
载入需要的程辑包:lattice
载入需要的程辑包:survival
载入需要的程辑包:Formula
Error: 找不到‘Hmisc’所需要的程辑包‘ggp
转载
2023-08-16 20:07:50
1155阅读
点赞
介绍Glmnet是一个通过惩罚最大似然来拟合广义线性模型的包。正则化路径是针对正则化参数λ的值网格处的套索或弹性网络罚值计算的。该算法速度极快,可以利用输入矩阵中的稀疏性x。它符合线性,逻辑和多项式,泊松和Cox回归模型。可以从拟合模型中做出各种预测。它也可以适合多响应线性回归。glmnet算法采用循环坐标下降法,它连续优化每个参数上的目标函数并与其他参数固定,并反复循环直至收敛。该软件包还利用强
转载
2024-04-22 23:11:00
92阅读
rpart包可实现回归树。通常分为两步建立回归树:1.生成一棵较大的树 2.通过统计估计删除一些结点来对树进行修剪。
转载
2017-11-26 21:56:00
193阅读
线性优化简介优化是一种为所有可能的解决方案找到给定问题的最佳解决方案的技术。优化使用严格的数学模型来找出给定问题的最有效解决方案。要从优化问题开始,首先确定目标非常重要。目标是绩效的量化衡量。例如:最大化利润,最小化时间,最小化成本,最大化销售。优化问题可分为两组线性规划(LP):它也被称为线性优化,在这个问题中,目标是在数学模型中获得最佳结果,其中目标和所有约束是决策变量的线性函数。二次规划(Q
转载
2023-08-08 10:55:31
172阅读
导读本文整理了R语言绘图中使用频率较高的程序包,每个程序包都附载相应的参考来源链接(链接里有实现绘图的脚本)和下载链接。另:茗创科技为大家提供免会员极速下载服务,需要相应程序包的小伙伴可以私信茗创科技周翊工程师,微信号MCKJ-zhouyi或17373158786。gganimate:在R中绘制动态图gganimate在CRAN上可通过install.packages('gganimate')来安
转载
2023-11-05 19:59:46
368阅读
另外再推荐一个在线绘制venn图的网站(除了广告较多都挺好的):https://www.meta-chart.com/venn具体包括下面三个包: limma、venneuler、VennDiagram。总的来说,三个包都有着各自的不足。下面会一一进行说明,这里先放上结论:综合方便程度以及函数的多样性而言,VennDiagram > venneuler > limma。limma首先针
转载
2024-01-25 16:49:11
567阅读
2.3.6 导入 SPSS 数据
IBM SPSS数据集可以通过foreign包中的函数read.spss()导入到R中,也可以使用Hmisc
包中的spss.get()函数。函数spss.get()是对read.spss()的一个封装,它可以为你自动设
置后者的许多参数,让整个转换过程更加简单一致,最后得到数据分析人员所期望的结果。
首先,下载并安装Hmisc包(foreign包已被默认安装
转载
2024-02-28 10:47:41
514阅读
转录组edgeR分析差异基因edgeR是一个研究重复计数数据差异表达的Bioconductor软件包。一个过度离散的泊松模型被用于说明生物学可变性和技术可变性。经验贝叶斯方法被用于减轻跨转录本的过度离散程度,改进了推断的可靠性。该方法甚至能够用最小重复水平使用,只要至少一个表型或实验条件是重复的。该软件可能具有测序数据之外的其他应用,例如蛋白质组多肽计数数据。可用性:程序包在遵循LGPL许可证下可
转载
2023-11-03 09:45:11
327阅读
1. vim 删除一列先使用ctrl + v,移动方向键,选择矩形区域,然后按 d 进行删除如果要在每一列前面加一个“{ ”------>修改列为特殊字符(ctrl + v选好后使用r替换成特殊字符),然后使用:%s替换命令如果要在每一列后面加一个“},” ------> 1. 修改最后一个字符为特殊;2. 使用命令“:%s /,\r/
转载
2024-08-20 20:02:48
68阅读
数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。R语言博大精深,吸纳了来自各方的挖掘算法包,这些包都是由统计学家或是算法研究人员提供,我们可以站在这些伟人的肩膀上实现算法的应用。下面对常用的数据挖掘包做一个汇总:连续因变量的预测:stats包stats包stats包rpart包RWeka包adabag包adabag包randomForest包e1071包kernl
转载
2023-06-21 18:36:04
222阅读