1、什么是异常检测异常检测(Outlier Detection),顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据。识别如信用卡欺诈,工业生产异常,网络流里的异常(网络侵入)等问题,针对的是少数的事件。1.1 异常的类别点异常:指的是少数个体实例是异常的,大多数个体实例是正常的,例如正常人与病人的健康指标;上下文异常:又称上下文异常,指的是在特定情境下个体实例是异常的,在其他情境下都是            
                
         
            
            
            
            作者 |  郑童、鲍慧雯单位 | 东北大学自然语言处理实验室引言扩散模型(Diffusion Models, DM)在文本到图像生成领域备受瞩目,目前已完全超过了上一代主流生成范式生成对抗网络 (Generative Adversarial Network, GAN)。相比于GAN,扩散模型可以具有以下如下几个特点:1)完备的理论基础;2)灵活的架构设计;3            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-04 15:41:54
                            
                                239阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录自由现金流模型介绍简介及计算估值其他数据计算方法折现率编程实现编程求取折现率NI、NCC、WC_Inv、FC_Inv以及NB的编程计算FCFE的编程计算主函数(估值)总结   本文主要介绍自由现金流折现的意义、计算方法,以及基于python与Tushare数据接口的编程实现。参考资料主要为CFA二级Equity Evaluation的Free Cash Flow Evaluation部分。自            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-22 09:21:45
                            
                                0阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文通过分类问题讲解判别式和生成式模型,会用到Logistics Regression 和 几率模型首先介绍一下,判别式模型是完全根据数据得出结果,而生成式模型会有人为设定的条件建立模型,再通过利用假设建立的模型得出结果。Generative (生成式模型)例: 利用iris数据进行分类
本文仅仅才用了target0和target1,且仅仅利用了前两种属性(便于可视化)数据可视化利用生成式建立模型            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-13 10:32:09
                            
                                164阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            论文:Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey面部识别(FR)模型易受到不同类型的攻击:1、物理攻击,在图像被捕获前修改面部的物理外观,如presentation attacks(又称spoofing attacks); 2、数字攻击,对捕获的面部图像实现修改,如对抗性攻击和变形攻击。对抗性攻            
                
         
            
            
            
            简介fid是一个非常常用的评估图像生成质量的指标图像生成的论文中经常会用到。fid是一种度量两个图片数据集相似度的方法,我们生成的图片与真实图片越相似越好。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-08-19 14:56:32
                            
                                10000+阅读
                            
                                                        
                                点赞
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            什么是生成模型生成模型可以描述一个生成数据的模型,属于一种概率模型。通过这个模型我们可生成不包含在训练数据集中的新的数据。每次生成模型要输出不同的内容。如果说某些特定的图片服从某些概率分布,生成模型就是尽可能的去模仿这个概率分布产生新的图像。生成模型和判别模型的区别判别模型可以简单的理解为分类生成模型的数据集是没有和判别模型类似的lable的(即标记信息,生成模型也是可以有标签的,生成模型可以根据            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-28 11:32:33
                            
                                67阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录分类模型评价指标说明混淆矩阵例子混淆矩阵定义混淆矩阵代码正确率真阳率和假阳率真阳率假阳率真阳率和假阳率的公式比较ROC/AUC例子阈值对TPR和FPR的影响ROC曲线ROC曲线的用处AUC精准率和召回率精准率召回率两者公式比较精准率和召回率的关系阈值对精准率和召回率的影响P-R曲线P-R曲线的用处AP原始计算方式其他计算方式F1分数Matthews相关系数分类模型评价指标说明分类涉及到的指标特            
                
         
            
            
            
            # 如何在 Python 中实现 FID 计算
在机器学习和图像生成行业中,生成对抗网络(GANs)等模型的评估通常需要用到 Fréchet Inception Distance(FID)指标。如果你是一位刚入行的小白,面对 FID 计算的代码实现可能会感到困惑。在这篇文章中,我将一步一步地教你如何用 Python 计算 FID 值。
## FID 计算流程
下面是 FID 计算的整体流程:            
                
         
            
            
            
            tf–idf算法解释tf–idf, 是term frequency–inverse document frequency的缩写,它通常用来衡量一个词对在一个语料库中对它所在的文档有多重要,常用在信息检索和文本挖掘中。一个很自然的想法是在一篇文档中词频越高的词对这篇文档越重要,但同时如果这个词又在非常多的文档中出现的话可能就是很普通的词,没有多少信息,对所在文档贡献不大,例如‘的’这种停用词。所以要            
                
         
            
            
            
            一、数据流图 ( DFD )   
 文章目录一、数据流图 ( DFD ) 简介二、数据流图 ( DFD ) 概念符号1、数据流2、加工 ( 核心 )3、数据存储4、外部实体三、数据流图 ( DFD ) 分层1、分层说明2、顶层数据流图3、中层数据流图4、底层数据流图 一、数据流图 ( DFD ) 简介数据流图 ( Data Flow Diagram ) :在 需求分析 阶段 , 使用的工具 ,             
                
         
            
            
            
            requires_gradrequires_grad=True 要求计算梯度;requires_grad=False 不要求计算梯度; 在pytorch中,tensor有一个 requires_grad参数,如果设置为True,则反向传播时,该tensor就会自动求导。 tensor的requires_grad的属性默认为False,若一个节点(叶子变量:自己创建的tensor            
                
         
            
            
            
            机器学习系列问题(二):生成模型和判别模型 文章目录机器学习系列问题(二):生成模型和判别模型一、简单理解二、两者分别(个人理解) 一、简单理解维基百科上Generative条目里面有个经典的案例:假设有四个samples: 判别式模型的世界是这个样子: 生成式模型的世界是这个样子:二、两者分别(个人理解)生成模型是对条件概率分布P(y|x)进行建模; 判别模型是对联合概率分布P(x,y)进行建模            
                
         
            
            
            
            # 使用 PyTorch 计算 FID 的完整指南
在计算机视觉中,Fréchet Inception Distance (FID) 是用于评估生成模型(如 GAN)质量的重要指标。通过计算生成的图像与真实图像之间的距离,FID 可以量化生成模型的性能。本文将详细介绍如何使用 PyTorch 实现 FID 的计算,并提供完整的代码示例和解释。
## 1. FID 计算流程
### FID 计            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-09-06 06:23:43
                            
                                646阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在使用 PyTorch 进行生成对抗网络(GAN)的训练时,经常需要计算 Fréchet Inception Distance(FID)来评估生成图像的质量。下面我们将详细记录如何在 PyTorch 环境中计算 FID,并列出完整的流程涉及的备份策略、恢复流程和相关工具链集成。
### 备份策略
为了确保我们在计算 FID 过程中的所有配置和数据安全,我们需制定一个有效的备份策略。备份作业按照            
                
         
            
            
            
              Tensorflow是一个通过计算图的形式来表述计算的编程系统,计算图也叫数据流图,可以把计算图看做是一种有向图,Tensorflow中的每一个计算都是计算图上的一个节点,而节点之间的边描述了计算之间的依赖关系。计算图的使用  在tensorflow程序中,系统会维护一个默认的计算图,通过tf.get_default_graph()函数可以获取当前默认的计算图,为了向默认的计算图中添加一个操作            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-10-09 19:52:43
                            
                                23阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            计算机图形学复习0计算机图形学复习1 接着上次的内容更,本次内容讲述基本图形的生成算法。包括直线的生成算法,圆弧的生成算法。直线生成算法首先你要考虑这么一个问题,显示图形是由像素点构成的,点是离散的点,如果线是刚好完全经过像素点,比如你画个x,y轴,那多简单是吧,那你画的不完全经过像素点,就涉及到了像素点的取舍问题,如何让你的直线在离散点的构成中更像一条直线,成像质量和你的离散点的分布有关,就是直            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-16 20:51:07
                            
                                56阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录1. 懒惰2. 抽象和结构3. 自定义函数3.1 给函数编写文档3.2 不是函数的函数4. 参数魔法4.1 值从哪里来4.2 能修改参数吗4.3 关键字参数和默认值4.4 收集参数4.5 分配参数5. 作用域6. 递归1. 懒惰斐波那契数 (一种数列,其中每个数都是前两个数的和)fibs = [0, 1]
for i in range(8):
    fibs.append(fibs            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-23 10:46:15
                            
                                258阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Woe公式如下:woe反映的是在自变量每个分组下违约用户对正常用户占比和总体中违约用户对正常用户占比之间的差异。 IV公式如下:IV衡量的是某一个变量的信息量,相当于是自变量woe值的一个加权求和,其值的大小决定了自变量对于目标变量的影响程度;从另一个角度来看的话,IV公式与信息熵的公式极其相似。 Gini的计算公式:   Gini指数最早应用在经            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-13 10:07:31
                            
                                300阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. 从“国民经济核算季度数据.npz”文件中读取2000年第一季度到2017年第一季度的所有数据并存储在ndarray对象中。(1) 创建一个DataFrame对象,其数值数组不包含原ndarray对象的第0列和最后一行数据(即不包含“序号”那一列数据和“2017年第一季度”那一行数据);其列索引为:['时间', 'GDP', '一产', '二产', '三产', '农业', '工业', '建筑'            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-06 18:00:37
                            
                                103阅读