ROC曲线在介绍ROC曲线之前,我们首先需要介绍混淆矩阵(Confusion Matrix)。在统计分类模型的评估过程中分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来的表格就是混淆矩阵。混淆矩阵的示意图如下: 在混淆矩阵中:TP代表的是真实值是positive,模型分类为positive的样本数量。
FP代表的是真实值是negative,模型分类为posit
转载
2023-07-04 09:39:27
175阅读
文章目录1 目的2 数据来源3 案例演示3.1 数据读取及预处理1. 读取数据并查看数据类型2 .查看数据基本特征3.2 工具函数编写1.标准化函数编写2.工具函数性能测试3.3 原始数据标准化4 模型建立及优化4.1 训练集测试集划分4.2 基于数据训练模型4.3 改进模型,提高模型性能1. 利用Z-分数标准化数据2.测试其他k值 1 目的 利用机器学习根据样本特征自动识别癌细胞,提高检测过
转载
2023-08-14 14:17:13
117阅读
目标检测之AP AR mAP ROC AUC(Evaluation metrics)混淆矩阵中 TP、TN、FP、FNPrecision查准率和Recall召回率P-R曲线AP mAPAR总结ROCAUC代码 禁止转载! 在做目标检测任务的时候,通常会制定规则来评估性能,就如下图所示,后面会慢慢道来其中的原理。混淆矩阵中 TP、TN、FP、FN在目标检测中,通常以IoU阈值作为正负样本的划分标准。
转载
2024-04-26 14:31:06
113阅读
程序改变现实,软件统治世界。程序员需要有精益求精的工匠精神,追求逻辑的极简、时间的最少和存储的最省,并且懂得其中的平衡。数据表示需要优先考虑,对于许多问题,找到表示该问题的数据结构,问题自然就解决了。CCF计算机职业资格认证的每一道试题都十分经典,覆盖现实世界中方方面面的问题。这个历年试题解主要使用C/C++语言编写,程序中附有注释,力求解题思路清晰简洁,值得珍藏与模仿。希望获得100分,仅仅使用
转载
2023-11-16 13:51:32
67阅读
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授:
Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
转载
2023-06-30 18:38:28
419阅读
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载
2023-06-25 20:40:28
273阅读
目录使用R中的ggplot2进行微阵列可视化(红绿热图)1、常用的方法:biclust包1.1 biclust包的安装1.2 导入biclust包1.3 生成一些测试数据1.4 调用drawHeatmap()函数绘制热图2、ggplot2绘制红绿热图2.1 ggplot2、reshape2包的安装1.2 导入ggplot2、reshape2包1.3 生成要绘制微阵列的模拟数据1.3 对数据进行相
转载
2023-07-18 16:36:05
161阅读
文章目录一、数据调用与预处理二、一元线性回归分析三、多元线性回归分析(一)解释变量的多重共线性检测(二)多元回归1. 多元最小二乘回归2. 逐步回归(三)回归诊断四、模型评价-常用的准则统计量 一、数据调用与预处理本文使用的数据为R语言自带数据集“iris”。iris数据集包含5个变量: 数值变量:Sepal.Length, Sepal.Width, Petal.Length, Petal.Wi
转载
2023-07-18 11:44:04
52阅读
主要作用:可重现一样的结果R语言中set.seed()作用是设定生成随机数的种子,目的是为了让结果具有重复性,重现结果。不设定种子不行吗?当然可以,但是结果就不能复现。如:x<-rnorm(3) #随机生成3个随机数
结果:1.4197419 -0.7460519 0.3603622
x<-rnorm(3) #再来一遍,生成的3个随机数又不一样了
结果:1.0796213 0.55
转载
2023-06-19 16:17:51
210阅读
一.绘制基本散点图(1)使用plot()函数(2)使用ggplot()函数 heightweight是个多列数据集ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point()ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point(shape=21)二.使用点形和颜色属性
转载
2023-06-19 17:25:29
178阅读
R语言︱情感分析—基于监督算法R语言实现笔记。可以与博客 R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)对着看。 词典型情感分析大致有以下几个步骤:训练数据集、neg/pos情感词典、分词+数据清洗清洗(一、二、三级清洗步骤)、计算情感得分、模型评价 ———————————————————————————————————————————— 
高级数据管理数值和字符处理函数数学函数函数描述np.abs(x)绝对值np.sqrt(x)平方根np.ceil(x)大于x的最小整数np.floor(x)小于x的最大整数np.trunc(x)向0截取x中的整数部分np.round(x, decimals=2)将x舍入为指定位的小数np.cos(x)/sin(x)/tan(x)余弦/正弦/正切np.arccos(x)/arcsin(x)/acrta
转载
2024-07-12 18:50:33
46阅读
http://blog.sina.com.cn/s/blog_597fcb450100c3um.html 【转】R与SAS、SPSS的比较 (2009-03-05 20:29:40)
转载 标签: 教育分类: 学习R与SAS、SPSS的比较R语言 R是用于统计分析、绘图的语言和操作环境。R是
在R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2,3,4.....还有统计量的水平的时候用到的高、中、低,也是因子,因为他是一个点。与之区别的向量,是一个连续性的值,例如,数值中有1,1.1,1.2......可以作为数值来计算,而因子则不可以。如果用我自己的理解,简单通俗来讲:因子是一个点,向
转载
2023-06-21 22:48:48
223阅读
有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,我该迫使我的所有开发人员和数据科学家非要用哪种语言?)这个问题不会推迟太久,迟早要定夺。下面简要
转载
2024-05-15 10:49:15
34阅读
for循环与函数式编程for 循环在 R 中不像在其他语言中那么重要,因为 R 是一门函数式编程语言。这意味着可以先将 for 循环包装在函数中,然后再调用这个函数,而不是直接使用 for 循环 library(tidyverse)
df <- tibble(
a = rnorm(10),
b = rnorm(10),
c = rnorm(10),
d = r
转载
2023-07-18 16:10:39
349阅读
下载和安装Windows环境的R1.进入主页,点击 蓝色加粗的 download R 2.随便点击一个镜像,这里点击的是http://mirror.fcaglp.unlp.edu.ar/CRAN/ 3.点击Download R for Windows 4.点击install R for the first time. 5.点击 Dow
转载
2023-11-03 09:07:58
380阅读
一、预备知识1.使用图形 #绑定数据框mtcarsattach(mtcars)#打开一个图形窗口并生成散点图plot(wt,mpg)#添加一条最优拟合曲线abline(lm(mpg~wt))#图形名称title("aaa")#数据框解除绑定detach(mtcars)2.图形的保存 pdf() 、 win.metafile()、png()、jpeg()、bmp()、tiff()、xfig()等其他
转载
2023-08-10 11:15:26
164阅读
plot(x, y, ...)
ylab, xlab: x轴与y轴名称设置参数子标题设置参数ylim, xlim: x轴与y轴数值界限设置参数
type:划线类型
col:划线颜色
lwd:线粗举个栗子:
plot(AvTemp,type="b",col=2,xlab="月份",ylab="平均温度",main="森林地区月平均温度时序折线图",sub = "子标题",lwd=2
转载
2023-08-31 13:52:51
159阅读
函数 par()中的参数可以分为三大类: (
1
) 只可以查询而不可以修改的参数
,
即
readonly
参数:
"cin", "cra", "csi", "cxy", "din" 和
"page"
。( 2
)只能通过
par
函数进行设置的参数
: "ask", "fig", "fin", "lheight", "mai", "mar", "mex"
转载
2023-07-06 16:50:29
274阅读