翻译:张珮珮,台湾清华大学工业工程学士,美国普渡大学工业工程硕士,目前就职于有赞数据分析团队
知乎专栏:中国R语言社区、R语言中文社区 |27,000+关注、200万+阅读
2022年1月,202个R新包收录于CRAN(2021年12月份收录134个),累计收录约20,550个R包!此次选摘了40个R包(13个类别),分布结构如下:
一. 可视化
1. fisheye:提供转换基本地图的功能,使用方位角对数距离转换聚焦于特定位置。
2. forestplotter:提供函数来创建具有可对数据分组的置信区间的多列森林图。
3.geomtextpath:为 ggplot2 的扩展使用,可使文本沿弯曲路径展示。弯曲文本可以更容易直接地标记路径或在极坐标中整齐地做注释。
4. ggESDA : 为 ggplot2 的扩展使用,实现了符号数据的可视化,并提供了一个通过聚类算法和自定义方法将经典数据转换为符号数据的函数。
5. toastui : 实现TOAST UI库的接口,用于创建可集成到 Shiny 的交互式表格和图表。
6. tornado : 使用 caret 包的框架来实现线性模型、广义线性模型、生存回归模型和机器学习模型,并绘制龙卷风图来可视化各种输入的预期输出范围,或者输出对输入范围的敏感性。
二. 工具应用
1. gittargets : 通过获取数据存储的版本控制(Version control)快照,提供在 targets 工作流中保存历史输出版本的功能。每个快照都链接到源代码的提交,让用户在回滚到之前的提交时能恢复同期数据。
2. httptest2 : 这个包能在不需要访问远程服务的情况下测试API的R端所有逻辑,还能记录真实的API响应以用作测试装置。
3. maybe : 实现一个 maybe 的类型,它表示某个值或什么都没有的可能性。这可以用来代替抛出错误或返回 NULL。maybe 具有可组合的优点,并要求开发人员明确承认潜在的缺失值。
4. nanonext:为NNG (Nanomsg Next Gen)实现R绑定,NNG是一个套接字库,用于实现消息和通信的高性能跨平台协议标准。它作为并发框架,可用于构建分布式应用程序。
5. powerjoin : 提供dplyr和fuzzyjoin函数的扩展来预处理数据、应用各种数据检查和处理冲突列。
6. quickcheck : 建立在一个由hedgehogto提供的框架上,在R中实现基于属性的测试。它受到QuickCheck的启发,旨在与testthat无缝集成。
三. 数据
1. chessR : 使用户能够从Lichess和Chess.com等流行的国际象棋网站提取国际象棋游戏数据,然后对游戏数据进行分析。
2. dictionaRy : 提供Free Dictionary API的接口,允许用户检索英语单词的词典定义,以及其他信息,包括语音、词性、来源、音频发音、示例用法、同义词和反义词。这些信息能以整齐的格式返回,以方便使用。
3. flightsbr : 提供从巴西民航局(ANAC)下载航班和机场数据的功能,包括在ANAC登记的所有飞机、机场、机场和机场运动的详细信息,以及每一个往返巴西的国际航班,以及该国国内航班。
4. rGhanaCensus : 包含从 2021 年加纳(Ghana)人口和住房普查中废弃的扫盲和教育数据集。
四. 农业
1. ALUES : 根据联合国粮食及农业组织和国际水稻研究所建立的方法,提供模糊建模功能,以评估不同作物生产的土地适宜性。
五. 计算方法
1. CGNM : 利用聚类Gauss-Newton方法找到非线性最小二乘问题的多个解。
2. simpr : 为仿真研究、设计分析和功耗分析实现了一个 tidyverse 友好的框架。能够在单个管道中生成数据、拟合模型和整理模型结果。
六.工程领域
1. TesiproV : 提供函数来计算土木工程问题的失效概率与一级到三级的方法。
七. 金融
1. PDtoolkit : 提供用于开发违约评级模型概率的功能,包括用于估算、数值和分类风险因素、证据权重、信息值计算和风险因素聚类的功能,以及用于测试同质性、异质性、区分性和预测能力的验证功能。
2. ufRisk : 提供函数,通过各种参数和半参数garch类型模型计算风险值(VaR)和预期不足(ES)。
八. 基因组学
1. aphylo : 实现了一个简洁的进化模型来分析和预测系统发育树中的基因功能注释,如 Vega Yon 等人(2021)所述。
2. edlibR : 实现 Edlib C/C++ 库的接口,以使用 Levenshtein 距离进行精确的序列对齐。
3. freqpcr : 根据 Osakabe等人(2017)所述的限制性酶消化 (RED)-DeltaDeltaCq 方法,从 qPCR 分析中实现群体等位基因频率的区间估计函数。
九. 机器学习
1. longmixr : 利用flexmix flexible mixture模型将ConsensusClusterPlus 的共识聚类方法用于纵向数据。
2. reclin2 : 提供帮助执行概率记录链接和重复数据删除的功能:生成对,比较记录,估计m-和u-概率的em-algorithm。
3. rego : 实现用于预测和估算时间序列的机器学习算法以及用于模型选择的贝叶斯随机搜索方法。作者声称,该程序包是用C++编写的,适用于包含成百上千个因变量的问题,以及因变量的数量大于观测值的问题。
十. 数学
1. tesselation : 计算Delaunay和Voronoï镶嵌,并提供函数来绘制二维和三维镶嵌。Delaunay镶嵌是在Qhull的帮助下用C语言计算的。
2. weyl : 提供用于处理外尔代数(Weyl Algebras)的函数。
十一. 医药学
1. biodosetools : 实现用 Shiny 来执行生物剂量学实验室所需的各种统计测试和计算
2. rccola : 为输入和处理API键和直接将数据拉入内存提供安全方便的函数。默认情况下,它将从REDCap实例中加载,但其他源是可以通过控制反转进行注入的。
十二. 科学
1. datelife : 实现 DateLife Web 服务的基础功能,使研究人员和普通观众能够获得他们感兴趣的生物体年龄的开放科学数据。年龄数据是从已发表并与索引期刊中的科学文章相关的同行评审的过时的系统发育树(chronogram,纪年铭)中提取的。
2. dynamAdes : 建立了一个模型来研究入侵伊蚊的种群动态。模型原理见Da Re 等人(2021),模型框架见Da Re 等人(2021)。
十三. 统计学
1. autoReg : 提供为描述性统计创建汇总表并为各种回归模型(包括线性模型、广义线性模型和 cox比例风险模型)自动选择解释变量的功能。
2. conformalInference.multi : 当响应变量是多元的(即维度大于一)时,提供计算完全保形、分裂保形和多分裂保形预测区域的函数。
3. gamselBayes : 根据 He & Wand (2021) 中描述的方法,提供函数以通过近似贝叶斯推理来拟合和选择广义加法模型。
4. interpretCI : 提供用于估计各种统计数据的置信区间并绘制结果的函数。
5. lmls : 使用 Girolami & Calderhead (2011) 中描述的算法实现高斯位置尺度回归模型(具有响应变量的均值(位置)和标准差(尺度)的解释变量的多预测模型)的函数。
6. sandwichr : 实现了Wang等人(2013)描述的空间分层异构(Spatial Stratified Heterogeneity,SSH)空间插值算法。
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~
https://rviews.rstudio.com/2022/02/28/january-2022-top-40-new-cran-packages/