模型效果主要从两个方面衡量:    1.模型本身的效果,主要评价指标包括区分度、准确度等。    2.模型稳定性,主要评价指标包括PSI和CSI等。    之前阐述了模型本身的评价指标:混淆矩阵、F1值、KS曲线、count_table和ROC曲线AUC面积,本文介绍模型稳定性指标PSI。 文章目录一、详细介绍PSI1 什么是PSI2 PSI计算公式3 PSI阈值衡量标准二、用Python如何计算
python的优缺点来说一下吧:python语言的优点⑴作为初学python的科班出身的小白,python非常简单,非常适合人类阅读。阅读一个良好的Python程序就感觉像是在读英语一样,尽管这个英语的要求非常严格!Python的这种伪代码本质是它最大的优点之一。它使你能够专注于解决问题而不是去搞明白语言本身。⑵易学。python虽然是用c语言写的,但是它摈弃了c中非常复杂的指针,简化了pyth
基础:  时间序列学习笔记(2)平稳性 许多预测模型都要求时间序列具有一定的一致性,即“平稳性”。平常的转换,即整数阶差分(譬如,在金融学中表现为建模收益而不是绝对价格),消除了数据中的记忆,从而影响了建模的预测能力。本文概述了分数微积分如何保留更多的信息,以及如何更好地在平稳性和有意义的记忆之间做出权衡。一般而言,我们会把一个给定的时间序列理解为一个随机过程产生的样本,并试图
目录1.什么是特征工程2.基本预处理:缺失值处理2.1缺失值的处理2.2小练习2数值型特征2.1对数变换2.2幅度缩放2.3统计数值:描述统计分析2.4高次特征与交叉特征2.4.1高次特征3.字符型特征3.1哑变量3.2标签编码1.什么是特征工程         特征是用于描述数据中的各种属性、变量或维度的信息,它们是
2021-03-15因为模型是以特定期间的样本所开发的,此模型是否实用于开发样本之外的族群,必须通过稳定性测试能力得悉。稳定度指标(population stability index ,PSI)可掂量测试样本及模型开发样本评分的的散布差别,为最常见的模型稳定度评估指针。其实PSI示意的就是按分数分档后,针对不同样本,或者不同工夫的样本,population散布是否有变动,就是看各个分数区间内人
作者:泛音/Fainke混淆矩阵:也称为误差矩阵,是一种特定的表格布局,允许可视化算法的性能,通常是监督学习的算法(在无监督学习通常称为匹配矩阵)。矩阵的每一行代表预测类中的实例,而每列代表实际类中的实例(反之亦然)。从字面理解:看出系统是否混淆了两个类(即通常将一个类错误标记为另一个类)(多类可以合并为二分类)。一级评价指标:由四个基础指标构成:TP、FN、FP、TN① 真实值是positive
转载 10月前
85阅读
对系统稳定性的一些理解 在数字信号处理中,系统的稳定性是一个很重要的问题,比如说在滤波器的设计中,都要求系统必须稳定,否则是无法使用的。那么,如何判断系统是否稳定呢? 从定义上说,如果输入有界,则输出必定有界的系统是稳定的。从数学上可以推导出,因果系统冲击响应Z变换的收敛域包含单位圆的系统是稳定的。从零点极点的角度,则是系统函数的所有极点都在单位圆内的系统是稳定的。如何来理解呢? 我们先以一个简单
在数据科学和机器学习中,衡量模型的稳定性是一个非常重要的任务。尤其是在进行数据分析和预测时,使用 PSI(Population Stability Index) 模型稳定性分值来检测模型的可靠性和有效性是必要的。本文将详细讨论如何在 Python计算 PSI 模型的稳定性分值,并探索该过程的多个方面。 ### 背景描述 PSI 是用来衡量模型训练期间数据特征分布和测试期间数据特征分布之间差
原创 6月前
71阅读
        在风控领域的业务中,稳定性压倒一切,一套风控模型正式上线运行后往往需要很久(通常一年以上)才会被替换下线。如果模型不稳定,意味着模型不可控,对于业务本身而言就是一种不确定性风险,直接影响决策的合理性,这是不可接受的。在机器学习构建风控模型时,我们基于假设“历史样本分布等于未来样本分布”。因此,我们通常认为:   
由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,
转载 2019-09-12 15:23:00
956阅读
2评论
外部标准:     1.  给客户带来的损失 。比如数据错误,系统宕机。把损失换成金钱,除以此系统本来可以赚的利润,达到一个百分比: 标准1: 客户损失金额/利润            说明:得到这个数据可能比较困难,现实有很多情形,我们可以灵活处理
关键词:CPCT、精细化运营思维、客户、产品、渠道、时机、运营电信运营商市场饱和,用户新增主要靠弃卡后重新入网以及异网用户策反。用户新增已如此艰难,所以更加关注存量用户经营。运营商营销资源不断收缩,广撒网的粗放式传统模式不再适用,精细化运营,科学投放资源,不断提高资源投放效益是运营必须坚持的运营策略。运用数据的CPCT策略(Customer、Product、Channel、Time),对合适的客户
转载 2024-01-26 12:02:17
67阅读
一:selenium元素定位之稳定:1.本身selenium就有智能等待,implicitly_wait(),这个是智能等待,多多使用。可以等待元素加载出来在进行click事件。2.定位元素经常失效,有可能原因是:动态标签或者动态元素,或者是你点击的元素一出现你就操作,那么后面的其他加载出来的元素有可能会覆盖掉你要操作的元素或者标签。可以使用遍历方法,去遍历查找这个元素,或者先查找最后加载出来的元
转载 2023-05-31 13:39:40
456阅读
本文写于资格考试前前夕,权以浅浅谈当整理复习稳定性讨论主要基于 Finite Difference Methods for Ordinary and Partial Differential Equations (LeVeque, 2007)首先大致梳理一下本文打算简单整理的稳定性:Zero Stability/Absolute Stability/A-Stability/L-Stability
转载 2024-04-30 20:56:58
162阅读
(一)ORB特征点提取算法的简介 Oriented FAST and Rotated BRIEF,简称ORB,该特征检测算子是在著名的FAST特征检测和BRIEF特征描述子的基础上提出来的,其运行时间远远优于SIFT和SURF,可应用于实时性特征检测。ORB特征检测具有尺度和旋转不变性,对于噪声及其透视变换也具有不变性,良好的性能是的利用ORB在进行特征描述时的应用场景十分广泛。ORB特
转载 2024-01-18 14:08:51
118阅读
PSi-Population Stability Index (PSI)模型分稳定性评估指标
PSi-Population Stability Index (PSI)模型分稳定性评估指标
你不懂python算法 也可以写好它~
原创 2022-08-26 14:25:37
1295阅读
模型稳定性指的是模型性能的稳定程度,只有稳定性足够好的模型才能通过上线前的评估,而且上线后,我们也要对模型稳定性进行观测,判
原创 4月前
96阅读
一段时间前,自己制作了一个库 “sui-math”。这其实是math的翻版。做完后,python既然可以轻易的完成任何的数学计算,何不用python开发一个小程序专门用以计算呢?现在我们越来越依赖于计算器,很多复杂的计算都离不开它。我们使用过各式各样的计算器,无论是电脑自带的,还是网也上的计算器,却都没有自己动手编写属于自己计算器。今天就让我们走进计算器的世界,用python来编写一个可以用的计算
  • 1
  • 2
  • 3
  • 4
  • 5