一 模块介绍1、什么是模块?#常见的场景:一个模块就是一个包含了一组功能的python文件,比如spam.py,模块名为spam,可以通过import spam使用。 #在python中,模块的使用方式都是一样的,但其实细说的话,模块可以分为四个通用类别:    1 使用python编写的.py文件   2 已被编译为共享库或DLL的C或C++扩展   3 把一系列模块组织到一
转载 2024-02-13 12:41:30
33阅读
1.背景Dice 系数是常用的分割的评价标准之一 后面还会介绍其他的评价标准。 而且我发现大家的东西都是互相抄来抄去没有意思2.Dice系数原理及定义公式1 假设 X 是 Output【也就是我们输出结果】 维度为(3,3) Y 为lable【标签】 维度为(3,3)单一分类 首先我们需要明白Dice系数使用判断两个图片(这里我就指的是X Y)的相似度的,但是在我们的分割任务当中我们通常将0 代表
轮廓系数(Silhouette Coefficient)是聚类分析中用来评估聚类效果的一个重要指标,能够帮助我们理解数据的分布特征。在 Python 中,计算和分析轮廓系数提供了丰富的工具和函数,使得数据分析师和机器学习工程师能够更有效地评估其算法性能和数据划分结果。 ### 协议背景 轮廓系数的计算是基于数据点间距离的一个度量,其值范围在 -1 到 1 之间。数值越高,代表数据点被正确地聚类,
原创 5月前
40阅读
数据画像中,根据算法定性计算了很多标签,而最后展示出来的,是定量的标签,如星级标签,这就需要进行定性的评价。一、离差法    离差法,是依据正态分布的原理,以大数量横剖面调查资料的平均数为基准值,以标准差为离散距,对某一体质指标进行分等评价的方法。离差法只适用于测试数据呈正态分布时。   (一)离差法划分评价等级的标准 &n
转载 2024-01-31 15:46:24
67阅读
1. 变差函数定义1.1 二阶平稳假设:由于统计推断一般都要进行重复采样,但储层属性参数有其特殊性,每个位置不可能有多个样本,所以对随机函数Z(u)提出了本征假设,试图采用随机函数理论来接近空间插值。 二阶平稳性是指同时满足下面两个条件:1.2 变差函数定义通常将地质变量在空间两位置处取值之差的方差之半定义为变差函数,记为:从公式可以看出,变差函数揭示了距离h的空间两位置,其地质变量取值的相似度。
Cronbach’a 信度系数分析Cronbach’s Alpha是一种衡量测量工具内部一致性的常用方法。在实际研究中,我们经常需要使用多个测量工具来收集数据,为了保证数据的可靠性和有效性,我们需要评估每个测量工具的信度。Cronbach’s Alpha可以帮助我们评估测量工具的信度,从而判断其是否适合用于数据分析和统计。Cronbach’s Alpha的定义Cronbach’s Alpha是一种
转载 2023-10-19 15:26:28
322阅读
1简介 皮尔森相关系数 皮尔森相关系数(Pearson correlation coefficient)也称 皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两
兰德指数(Rand index, RI)RI取值范围为[0,1],值越大意味着聚类结果与真实情况越吻合:如果有了类别标签,那么聚类结果也可以像分类那样计算准确率和召回率。假设U是外部评价标准,即true_label, 而V是聚类结果,设定4个统计量符号解释更直白的解释决策正确与否TP / a在U中为同一类,且在V中也为同一类别的数据点对数将相似的样本归为同一个簇(同–同)正确的决策TN / d在U
# 实现系数矩阵 Python的步骤 ## 介绍 在统计学和机器学习中,系数矩阵是一个重要的概念。它用于表示不同变量之间的相关性和影响程度。在Python中,我们可以使用numpy和pandas库来实现系数矩阵。 本文将介绍实现系数矩阵的步骤,并提供相应的代码示例,以帮助你理解和应用。 ## 流程图 ```mermaid flowchart TD A[收集数据] --> B[导入库]
原创 2023-12-04 13:08:51
96阅读
# Python Gini系数科普 ## 1. 什么是Gini系数? Gini系数是衡量一个数据集合中的不平等程度的指标。它常被应用于经济学领域,用来衡量一个国家或地区的财富分配不平等程度。在机器学习中,Gini系数也被用来评估分类算法的性能,特别是决策树。 Gini系数的取值范围在0到1之间,其中0表示完全平等,1表示完全不平等。在计算Gini系数时,需要先将数据集按照某个特征进行分组,然
原创 2024-01-31 07:50:45
285阅读
# 轮廓系数的计算方法 ## 背景介绍 轮廓系数是一种衡量聚类效果的指标,旨在衡量聚类结果中样本的紧密度和分离度。该指标可以帮助我们判断聚类结果的好坏,进而优化聚类算法。在本文中,我们将介绍如何使用Python计算轮廓系数。 ## 操作步骤 首先,让我们来整理一下计算轮廓系数的流程。你可以按照以下步骤进行操作: | 步骤 | 操作 | |---|---| | 1 | 导入所需库 | |
原创 2023-07-31 05:52:27
369阅读
# 皮尔森系数Python应用 ## 1. 介绍 皮尔森系数(Pearson correlation coefficient),也称为皮尔逊相关系数,是衡量两个变量之间线性相关程度的统计量。它是由卡尔·皮尔逊在1895年提出的,常用于统计学领域和数据分析中。皮尔森系数的取值范围在-1到1之间,其中-1表示完全负相关,1表示完全正相关,0表示无线性相关。 在数据分析和机器学习中,我们经常需要
原创 2023-12-29 11:15:19
103阅读
http://poj.org/problem?id=2115题意:给出A,B,C和k(k表示变量是在k位机下的无符号整数),判断循环次数,不能终止输出"FOREVER".即转化成 c*x = b-a mod (2^k), 解这个模线性方程的最小正整数解。模板题,代码很短,但是很难理解的样子。。。转载了一些有关的资料。。。1 #include <stdio.h> 2 #define L
基于物品的CF(协同过滤)推荐算法1.1算法简介CF(协同过滤)简单来形容就是利用兴趣相投的原理进行推荐,协同过滤主要分两类,一类是基于物品的协同过滤算法,另一种是基于用户的协同过滤算法,这里主要介绍基于物品的协同过滤算法。给定一批用户,及一批物品,记Vi表示不同用户对物品的评分向量,那么物品i与物品j的相关性为: 上述公式是利用余弦公式计算相关系数,相关系数的计算还有:杰卡德相关系数、皮尔逊相关
# Kappa系数及其在Python中的应用 ## 引言 在数据科学和统计学中,Kappa系数是一种用于评估两个或多个观察者/分类者之间一致性的方法。特别是在分类问题中,Kappa系数为我们提供了一种对分类一致性的量化分析方法。本文将介绍Kappa系数的定义、计算方式,并通过Python代码来进行演示。 ## Kappa系数简介 Kappa系数(κ)是一种度量观察者之间一致性的统计量。其值
原创 9月前
342阅读
 上周写完了《《三体》读后思考-泰勒展开/维度打击/黑暗森林》后收到一些邮件,进一步思考了关于泰勒展开的意义。也许我掌握的那些网络技术比如Linux Netfilter,NAT之类,太过底层太过小众,所以大家几乎都是没有感兴趣的,倒是这种科普性质的文章和那些吐槽类的文章,会引发一系列的互动,这对我来讲是好事,因为我喜欢跟人交流技术和思想。声明本来这篇文章应该添加在《三体》读后感
在光纤安装中,对光纤链路进行准确的测量和计算是验证网络完整性和确保网络性能非常重要的步骤,光纤内会因光吸收和散射等造成明显的信号损失(即光纤损耗),从而影响光传输网络的可靠性,那么光纤损耗如何计算的呢?一、光纤损耗的标准电信工业联盟(TIA)和电子工业联盟(EIA)携手制定了EIA/TIA标准,该标准规定了光缆、连接器的性能和传输要求,如今在光纤行业中被广泛接受和使用。EIA/TIA标准明确了最大
机器学习练习 2 - 逻辑回归逻辑回归在训练的初始阶段,我们将要构建一个逻辑回归模型来预测,某个学生是否被大学录取。设想你是大学相关部分的管理者,想通过申请学生两次测试的评分,来决定他们是否被录取。现在你拥有之前申请学生的可以用于训练逻辑回归的训练样本集。对于每一个训练样本,你有他们两次测试的评分和最后是被录取的结果。为了完成这个预测任务,我们准备构建一个可以基于两次测试评分来评估录取可能性的分类
转载 4月前
16阅读
作者:火锅侠   如果有了类别标签,那么聚类结果也可以像分类那样计算准确率和召回率。但是不应该将分类标签作为聚类结果的评价指标,除非你有相关的先验知识或某种假设,知道这种分类类内差距更小。但是它还是给出了几种评价标准。7.9.1 调整兰德系数 (Adjusted Rand index)1. 数学原理兰德系数(Rand index)需要给定实际类别信息C,假设K是聚类结
转载 2023-09-15 21:06:43
849阅读
1、调整兰德系数数学公式Rand index(兰德系数):RI=a+bCnsamples2 R I = a + b
  • 1
  • 2
  • 3
  • 4
  • 5