比赛概览拍拍贷“魔镜风控系统”从平均400个数据维度评估用户当前的信用状态,给每个借款人打出当前状态的信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据,促进健康高效的互联网金融。拍拍贷首次开放丰富而真实的历史数据,邀你PK“魔镜风控系统”,通过机器学习技术,你能设计出更具预测准确率和计算性能的违约预测算法吗?比赛规则参赛团队需要基于训练集数
转载
2023-12-10 12:36:22
149阅读
本发明涉及风控规则的导出技术,尤其涉及一种基于决策树的风控智能规则导出方法及系统。背景技术:风控规则在当今社会的大多数互联网和金融公司有广泛的应用价值。多数情况下,风控规则大多数是由相关的业务人员和安全专家根据以往的经验、业务等条件来制定的。这种规则制定周期比较长,无法完全适用于不同的业务系统,即当遇到另一个业务场景时,需要专家再次进行业务分析、决策。这样会给企业带来更大的经济损失和开销成本。传统
转载
2023-10-09 10:33:24
173阅读
作者:桔了个仔,南洋理工大学,Datawhale成员想起刚入门风控时,天天对变量进行WOE变换,很多书籍和文章都讲得很详细,公式和例子都有,但他们很少直接回答:为啥要用WOE?不用WOE不行吗?WOE有啥神奇功效?本文试图根据自己理解回答。在风控用到的数据里,我们会用到两种变量:Numerical Variable,数值变量。例如逾期金额,天数。Categorical Variable,类别变量。
一、关联规则概述1993年,Agrawal等人在首先提出关联规则概念,迄今已经差不多30年了,在各种算法层出不穷的今天,这算得上是老古董了,比很多人的年纪还大,往往是数据挖掘的入门算法,但深入研究的不多,尤其在风控领域,有着极其重要的应用潜力,是一个被低估的算法,很少见到公开的文章提及,我尝试一一剖析,希望给你带来一定的启示。我自己进行了深刻、全面的思考,并进行了大量的实验,这个话题感觉可以聊三天
《Python金融大数据风控建模实战》 第4章 数据清洗与预处理本章引言Python代码实现及注释 《Python金融大数据风控建模实战》 第4章 数据清洗与预处理 本章引言数据清洗与预处理是整个评分卡模型开发乃至整个机器学习模型开发中非常重要的部分,通常包括数据集成、数据清洗、探索性数据分析和数据预处理。数据集成:将多个数据源的数据构成一个统一的数据结构或数据表的过程。如果不同数据源有结构化
转载
2023-12-09 20:27:46
65阅读
Ch1 互联网金融的申请过程,通常由用户从移动端发起,首次贷款用户会经理申请、四要素验证、授信与额度利率定价、多层审批、用户提款等多个环节;对于还款后再次贷款的复贷客户,平台通常会基于更好的信用评估结果,并根据历史还款表现对其进行额度管理。流程如图所示。 首次贷款用户需要依次通过反欺诈引擎、信用评估引擎、人工审核的审批。信用评估引擎主要包括政策规则筛选、信用规则筛选、申请评分卡
转载
2023-08-05 21:08:00
273阅读
Python 号称是最接近人工智能的语言,因为它的动态便捷性和灵活的三方扩展,成就了它在人工智能领域的丰碑走进Python,靠近人工智能一.编程语言Python的基础 之 "浅入浅出"不是不给你讲,而是重点在人工智能应用1.变量声明变量:1 name = "DragonFire" # 声明一个变量name 用来存储一个字符串"DragonFire"
2 age = 20 # 声明一个变量age
一、基算法1、决策树(Decision Tree)(1)原理:决策树根据样本数据集的数据特征对数据集进行划分,直到针对所有特征都划分过,或者划分的数据子集的所有数据的类别标签相同。(2)代码实现:#1、调用包和方法
from sklearn.datasets import load_iris
from sklearn import tree #调用树算法模型
import graphviz #调用
转载
2023-09-23 08:34:53
361阅读
跟ROC类似,Lift(提升)和Gain(增益)也一样能简单地从以前的Confusion Matrix以及Sensitivity、Specificity等信息中推导而来,也有跟一个baseline model的比较,然后也是很容易画出来,很容易解释。以下先修知识,包括所需的数据集:
分类模型的性能评估——混淆矩阵
分类模型的性能评估——ROC和AUC 一些准备 说,混淆矩阵(Confusion
转载
2024-01-25 21:26:16
492阅读
# 实现 xgboost 风控预测 Python 代码教程
## 1. 整体流程
下面是整个实现 xgboost 风控预测的流程表格:
```mermaid
pie
title xgboost 风控预测流程
"数据准备" : 20
"模型训练" : 30
"模型调参" : 20
"模型评估" : 20
"预测" : 10
```
```mer
原创
2024-06-19 07:22:04
221阅读
群体稳定性指标是衡量样本变化所产生的偏移量的一种重要指标,通常用来衡量样本的稳定程度,比如样本在两个月份之间的变化是否稳定。也可以用来衡量模型稳定度。通常用作模型效果监测。由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的样本,可以用稳定性测试。PSI可以衡量测试样本及模型开发样本评分的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同
转载
2024-07-15 12:52:47
35阅读
一、用神经网络Sequential(序贯模型)搭建import pandas as pd
import numpy as np
#导入划分数据集函数
from sklearn.model_selection import train_test_split
#读取数据
datafile = 'E:\\桌面\\作业\py\\bankloan.xls'#文件路径
data = pd.read_excel
转载
2023-05-28 20:29:25
300阅读
每家公司的风控流程肯定存在着多多少少的差异,本文我们介绍最经典的策略流程,大家可以根据自己公司的业务情况进行调整。介绍信贷风控流程,首先要了解信贷政策。在风控中,信贷政策信贷政策主要分:信贷审批,信贷额度授予和利率定价两个主要步骤 我们逐一来聊: 一、信贷审批 信贷客户申请授信主要从以下几个维度进行审批判别: 基本信息价校验,高风险区域判别,用户三方数据高风险判定,用户人行征信判定,用户多头信息
转载
2024-02-29 10:22:47
34阅读
# Python计算Lift
在数据分析领域,我们经常会使用Lift来评估一个模型的预测能力。Lift是一种用于比较模型预测结果与基准情况的指标,它能够告诉我们模型相对于随机预测的效果如何。在Python中,我们可以使用一些库来计算Lift值,比如`scikit-learn`和`mlxtend`。
## 什么是Lift?
Lift是指应用一个模型相对于随机预测模型的效果提升。它通常用于分类模
原创
2024-06-17 05:46:05
125阅读
随着互联网和科技的不断发展,无论是人们处理工作的方式还是生活的方式,都更加智能化,这都极大地提升了工作的效率,也带来了一定的便利性。对于投资领域来讲,“量化交易”正在被各类资管机构和普通用户所接受。而“量化交易”既是一个高效管理投资的方式,也是一个更加科学、理性管理投资的方式。风变Python智能交易课程就是针对“量化交易”需求设计的。Python智能交易课程对于投资相关的内容有更严格的步骤管理,
转载
2023-11-29 16:11:42
136阅读
场景为根据用户手机短信的风控建模,以此为例总结一套数据处理,特征工程,实验及结果分析的全流程珍贵的代码,并把常用的工具包函数记录清楚,免得每次用都要百度。如下是一套完整的流程,引自《智能风控》一书,我们按照这样的流程整理博客内容。 系列文章包括以下部分:数据预处理特征工程数据存储模型实验结果分析 一. 数据预处理1. 关于数据读取原始数据可能以各种格式的文件和各种逻辑
转载
2023-06-07 11:27:17
212阅读
信用管理基础概念、基础指标、风险指标、信贷风控架构等内容
基础概念信贷业务:
就是评估信用然后贷款的业务,是金融机构最重要业务和赢利手段。信用管理:
信用表示先买后付,用信用值来预支;管理就是评估用户的信用值,根据信用情况来制定不同的风险规避策略。风险控制:
就是对用户风险进行管理和规避的过程。
对于预测信用较差的人,贷款机构一般是不会向其放款的,即便放
转载
2023-09-16 00:34:57
80阅读
# 风控中需要的 Python 代码
在金融行业,风险控制(Risk Control)是确保机构安全和盈利的重要手段。有效的风险控制可以帮助机构识别、评估和优先处理潜在的风险。在本文中,我们将探讨在风控中可能需要的一些 Python 代码示例,并通过一些图示帮助读者理解风险管理的流程。
## 风险识别
风险识别是风控的第一步,主要集中在识别公司或投资组合可能面临的风险。这通常涉及市场风险、信
原创
2024-10-08 05:53:39
182阅读
# 数字化风控:借助Python构建智能风控体系
在现代金融环境中,风险控制(风控)显得尤为重要。随着数字化的推进,传统的风控方法逐渐被智能化、自动化的手段所取代。本文将探讨如何利用Python进行数字化风控,并展示相应的代码示例。同时,我们将用到甘特图来阐明数字化风控实施过程中的各个阶段。
## 数字化风控的定义
数字化风控是指通过数据的收集、分析和处理,利用先进的算法和技术,来识别、评估
# 如何实现Java系统中的风控功能
在现代复杂的系统中,风控(风险控制)是确保事务安全、有效的重要环节。特别是金融、交易类系统中,合适的风控策略能够防止损失,维护用户的信任。
在这篇文章中,我们将指导你如何在Java系统中实现基本的风控功能。整件事情的流程如下:
| 步骤 | 描述 |
|------|------------------|
| 1 | 定