Python 号称是最接近人工智能的语言,因为它的动态便捷性和灵活的三方扩展,成就了它在人工智能领域的丰碑走进Python,靠近人工智能一.编程语言Python的基础 之 "浅入浅出"不是不给你讲,而是重点在人工智能应用1.变量声明变量:1 name = "DragonFire" # 声明一个变量name 用来存储一个字符串"DragonFire"
2 age = 20 # 声明一个变量age
目录Part 1. 生成样本Part 2. 计算AUC、KS、GINIPart 3. PSIPart 4. 分数分布Part 5. 完整工程代码正文在我们开发完信用分模型后,经常需要计算如下的一些指标: ○ 坏用户比例一、生成样本注意数据是构造的,而非真实的数据import nump
转载
2023-12-28 11:08:34
260阅读
作者:桔了个仔,南洋理工大学,Datawhale成员想起刚入门风控时,天天对变量进行WOE变换,很多书籍和文章都讲得很详细,公式和例子都有,但他们很少直接回答:为啥要用WOE?不用WOE不行吗?WOE有啥神奇功效?本文试图根据自己理解回答。在风控用到的数据里,我们会用到两种变量:Numerical Variable,数值变量。例如逾期金额,天数。Categorical Variable,类别变量。
SQL计算KS、AUC、IV、PSI指标
原创
精选
2022-03-01 09:32:34
4511阅读
点赞
比赛概览拍拍贷“魔镜风控系统”从平均400个数据维度评估用户当前的信用状态,给每个借款人打出当前状态的信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据,促进健康高效的互联网金融。拍拍贷首次开放丰富而真实的历史数据,邀你PK“魔镜风控系统”,通过机器学习技术,你能设计出更具预测准确率和计算性能的违约预测算法吗?比赛规则参赛团队需要基于训练集数
转载
2023-12-10 12:36:22
149阅读
Ch1 互联网金融的申请过程,通常由用户从移动端发起,首次贷款用户会经理申请、四要素验证、授信与额度利率定价、多层审批、用户提款等多个环节;对于还款后再次贷款的复贷客户,平台通常会基于更好的信用评估结果,并根据历史还款表现对其进行额度管理。流程如图所示。 首次贷款用户需要依次通过反欺诈引擎、信用评估引擎、人工审核的审批。信用评估引擎主要包括政策规则筛选、信用规则筛选、申请评分卡
转载
2023-08-05 21:08:00
273阅读
# 机器学习算法在金融风控领域的应用
## 引言
随着金融科技的迅速发展,金融风险管理已成为金融领域至关重要的一部分。传统的风控手段往往更依赖于人工判断和经验,但随着数据规模的扩大和计算能力的提升,机器学习算法在金融风控中的应用逐渐增多,并显示出其在预测和识别风险方面的巨大潜力。
## 什么是金融风控?
金融风控是指金融机构在开展各类金融业务活动中,对潜在风险进行识别、评估、监测和控制的过
原创
2024-08-04 04:21:25
122阅读
参考:1. The Clean Architecture in Python (Brandon Rhodes)2. Python Best Practice Patterns (Vladimir Keleshev)3. Transforming Code into Beautiful, Idiomatic Python (Raymond Hettinger)4. Ho
# 如何计算PSI
## 导言
在风险模型开发中,我们通常需要评估模型在不同样本上的稳定性。而PSI(Population Stability Index)是一种常用的评估模型稳定性的指标之一。计算PSI可以帮助我们了解模型在不同时间段或不同样本上的预测能力是否稳定。本文将介绍如何使用Python计算PSI。
## 流程步骤
首先,让我们来了解计算PSI的整个流程,并使用表格展示出来。
|
原创
2023-07-23 20:50:32
671阅读
本发明涉及风控规则的导出技术,尤其涉及一种基于决策树的风控智能规则导出方法及系统。背景技术:风控规则在当今社会的大多数互联网和金融公司有广泛的应用价值。多数情况下,风控规则大多数是由相关的业务人员和安全专家根据以往的经验、业务等条件来制定的。这种规则制定周期比较长,无法完全适用于不同的业务系统,即当遇到另一个业务场景时,需要专家再次进行业务分析、决策。这样会给企业带来更大的经济损失和开销成本。传统
转载
2023-10-09 10:33:24
173阅读
随着互联网和科技的不断发展,无论是人们处理工作的方式还是生活的方式,都更加智能化,这都极大地提升了工作的效率,也带来了一定的便利性。对于投资领域来讲,“量化交易”正在被各类资管机构和普通用户所接受。而“量化交易”既是一个高效管理投资的方式,也是一个更加科学、理性管理投资的方式。风变Python智能交易课程就是针对“量化交易”需求设计的。Python智能交易课程对于投资相关的内容有更严格的步骤管理,
转载
2023-11-29 16:11:42
136阅读
场景为根据用户手机短信的风控建模,以此为例总结一套数据处理,特征工程,实验及结果分析的全流程珍贵的代码,并把常用的工具包函数记录清楚,免得每次用都要百度。如下是一套完整的流程,引自《智能风控》一书,我们按照这样的流程整理博客内容。 系列文章包括以下部分:数据预处理特征工程数据存储模型实验结果分析 一. 数据预处理1. 关于数据读取原始数据可能以各种格式的文件和各种逻辑
转载
2023-06-07 11:27:17
212阅读
最近开始学习Python自动化运维,特记下笔记。学习中使用的系统是Kali Linux2017.2,Python版本为2.7.14+因为在KALI里面没有自带psutil模块,需要使用pip进行安装安装完成后进入python交互模式查看psutil 的帮助信息,可以发现psutil支持跨平台的环境,同时也支持python3获取CPU信息使用cpu_times获取CPU信息,用户/系统/空闲时间也可
转载
2023-10-09 08:10:11
252阅读
变量中心如果说数据是原料,策略是产品的话,那么变量就是当中的零部件了。一个完整的风控策略依赖的关键变量可能有几百上千个,底层的变量池子就远远大于这个数了。变量中心在风控平台中是最重要但是同时也最容易被人忽视的一部分,一方面不像审批系统、决策引擎那样是完整的产品平台,也不像底层数据平台那么有完整的技术方案。变量在不同公司体系里面,形态有很多,可以是一个接口,也可以是一段SQL。由于变量
转载
2022-12-21 19:01:02
274阅读
信贷风控是数据挖掘算法最成功的应用之一,这在于金融信贷行业的数据量很充足,需求场景清晰及丰富。信贷风控简单来说就是判断一个人借了钱后面(如下个月的还款日)会不会按期还钱。更专业来说,信贷风控是还款能力及还款意愿的综合考量,根据这预先的判断为信任依据进行放贷,以此大大提高了金融业务效率。本文内容较长,喜欢记得收藏、点赞。与其他机器学习的工业场景不同,金融是极其厌恶风险的领域,其特殊性在于非常侧重模型
转载
2023-10-20 10:42:45
129阅读
作为一个财务人,每当做各种报表和数据分析时,我都在想自己为什么不是一个机器人,这样做起来就不会这么头秃了。有时辛辛苦苦做出来的数据莫名其妙地出现不符合逻辑的错误,有时excel里的公式出现引用错误……为什么像财务这种重复性多、数据处理量大的工作没有人开发个程序来替代呢?后来我才知道,不是没有人开发出程序,是我一直没有发现还有这么好用的工具——Python。我偶然刷到了一个视频,上面列举了几个工作中
转载
2024-01-16 23:00:42
34阅读
# Python计算PSI代码
在数据分析和预测中,PSI(Population Stability Index)是一个常用的指标,用于衡量两个不同时间段或者不同群体之间的分布变化。在Python中,我们可以使用一些库来计算PSI指标,帮助我们更好地理解数据的稳定性和变化情况。
## 什么是PSI指标
PSI指标是用来衡量两个概率分布之间的相似性的指标。通常情况下,我们会将一个基准群体(比如
原创
2024-05-31 06:32:03
185阅读
# PSI (Population Stability Index) 计算与 Python 实现
## 引言
在数据分析和机器学习中,了解模型的稳定性和数据的分布变化至关重要。Population Stability Index(PSI)就是一种衡量变量分布变化的方法。它通常用于信用评分、反欺诈、营销活动及其他领域,以监控模型的性能是否随着时间的推移而发生变化。
本文将介绍什么是PSI,如何
原创
2024-09-05 06:02:07
158阅读
# 使用Python计算PSI(Population Stability Index)
在数据科学中,PSI(Population Stability Index)是一个重要指标,用于监测模型预测数据的稳定性。特别是在金融行业,PSI能帮助我们审视模型在不同时间段内的性能表现。本文将深入探讨如何使用Python代码计算PSI,帮助新手开发者加深理解。
## 计算PSI的流程
以下是计算PSI
原创
2024-08-18 07:49:59
236阅读
# PSI(Population Stability Index)计算的Python实现
在数据科学与机器学习领域,Population Stability Index(PSI)是一种用于衡量特征分布在不同时间段的稳定性的方法。通过计算PSI值,数据科学家可以监控模型的有效性,并及时发现模型失效的趋势。
## PSI的定义
PSI用于比较特征在某一时间段内的分布(一般为当前模型的训练集)与基