在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化?相关视频有25个变量:1. ID: 每个客户的ID2. LIMIT_BAL: 金额3. SEX: 性别(1 =男,2 =女)4.教育程度:(1 =研究生,2 =本科,3 =高中,4 =其他,5 =未知)5.婚姻: 婚姻状况(
转载
2024-10-26 12:51:49
33阅读
金融风控数据建模-冠军方案分享写在前面2019厦门国际银行“数创金融杯”数据建模大赛-冠军团队:三位靓仔成员介绍:团队成员由当下国内赛圈著名选手组成,一月三冠选手宁缺,赛圈网红林有夕,以及最具潜力选手孙中宇组成。赛事地址:https://www.dcjingsai.com/v2/cmptDetail.html?id=319首先还是非常感谢他们提供的冠军方案分享,下面就一起来看看是如何大比分遥遥领先
转载
2023-12-26 15:27:08
123阅读
任务介绍 整体学习内容 本次组队学习的内容为:数据挖掘实践(金融风控),该内容来自 Datawhale与天池联合发起的 零基础入门数据挖掘 - 贷款违约预测 学习赛的第一场。 整体赛题要求 比赛要求参赛选手根据给定的数据集,建立模型,预测金融风险。 赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为
转载
2024-01-26 12:59:39
57阅读
文章目录前言一、金融科技介绍1.技术创新推动金融创新的巨大力量2.智能风控和评分卡二、机器学习介绍1.概念2.分类三、评分卡模型介绍1.申请评分卡2.行为评分卡3.催收评分卡4.反欺诈模型总结 前言提示:这里可以添加本文要记录的大概内容: 例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可
转载
2024-01-08 19:44:30
19阅读
场景为根据用户手机短信的风控建模,以此为例总结一套数据处理,特征工程,实验及结果分析的全流程珍贵的代码,并把常用的工具包函数记录清楚,免得每次用都要百度。如下是一套完整的流程,引自《智能风控》一书,我们按照这样的流程整理博客内容。 系列文章包括以下部分:数据预处理特征工程数据存储模型实验结果分析 一. 数据预处理1. 关于数据读取原始数据可能以各种格式的文件和各种逻辑
转载
2023-06-07 11:27:17
212阅读
①导入库并初始化数据import pandas as pd
from keras.models import Sequential
from keras.layers.core import Dense, Activation
import numpy as np
# 参数初始化
inputfile = 'D:/xianmu/pywajue/data/bankloan.xls'
data = pd
转载
2023-07-13 20:20:43
466阅读
以P2P网贷为例互联网金融产品如何利用大数据做风控?
销售环节 了解客户申请意愿和申请信息的真实性;适用于信贷员模式。 风控关键点 亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位。 审批环节 进行基本信贷政策的核查,主要是核实申请信息、证件资料、是否伪冒申请。系统会审核剔除不符合基本信贷政策要
下面开始正文:风控策略同学在挖掘有效的风控规则的时候,经常需要基于业务经验,将那几个特征进行组合形成风控策略,会导致在特征组合的时候浪费大量的时间,我们有没有什么方法,替代人工的分析,直接得出策略组合呢,决策树就是其中的一个选择,可以实现自动化的挖掘大批量的策略组合。在众多的算法中,决策树整体分类准确率不高,但是部分叶子节点的准确率却可以很高,因此我们可以提取决策树的叶子规则,并筛选准
转载
2024-01-10 13:14:16
138阅读
信贷风控是数据挖掘算法最成功的应用之一,这在于金融信贷行业的数据量很充足,需求场景清晰及丰富。信贷风控简单来说就是判断一个人借了钱后面(如下个月的还款日)会不会按期还钱。更专业来说,信贷风控是还款能力及还款意愿的综合考量,根据这预先的判断为信任依据进行放贷,以此大大提高了金融业务效率。本文内容较长,喜欢记得收藏、点赞。与其他机器学习的工业场景不同,金融是极其厌恶风险的领域,其特殊性在于非常侧重模型
转载
2023-10-20 10:42:45
129阅读
先介绍下金融借贷业务流程:用户前来申请借贷,会先经过欺诈识别,把欺诈团伙和主观欺诈的个人拒绝掉,然后对通过的人做信用评估,最后根据额度模型,算出利润最大化时放款金额。刚才提到了团队欺诈,举个真实的例子。宜人贷在他们的财报中公布的,他们被一个团伙成功撸走了2000多单,当时宜人贷的件均4w, 一下损失了8000w!!那么如何防范这种风险呢。这就是今天要分享的图算法。图可以将这些一个个有良好记录的个体
金融风控基础篇风控的基本概念0 基于AI的风控应用1 什么是信用风险?2 信用模型和欺诈模型的区别3 小额现金贷 vs 大额信贷4 信用评分建模的基本流程5 和风控建模相关的问题有:数据清洗的全过程什么是 ETL交叉验证的优势及实现方法建立模型模型的评估方法 风控的基本概念如果说金融产品的核心是风控,那么风控的核心是:信用评估+模型规则。 互联网金融特性与产品 传统金融机构+非金融机构传统金融机
转载
2023-10-12 17:22:15
5阅读
概率质量函数 (probability mass function,PMF)是离散随机变量在各特定取值上的概率。 概率密度函数(probability density function,PDF )是对连续随机变量定义的,本身不是概率,只有对连续随机变量的取值进行积分后才是概率。 累积分布函数(cumulative distribution function,CDF) 能完整描述一个实数随机变量X的
昨天的文章,我们提到三种策略规则的挖掘方法,详细内容如下: 《三种量化规则的开发方法》。今天我们再介绍一种更常见的自动规则的挖掘方法——决策树模型的规则挖掘方法。 讲解具体的策略挖掘的技巧前,先跟大家普及介绍,目前风控规则的整体内容。一.风控规则的分类 在讲解规则挖掘的方法前,先介绍下风控规则的分类 1.从所使用的数据和业务角度出发,可分为: 1)准入规则:例如对年龄,职业,地域的限制,一般根据公
金融风控0基础入门-Task2 数据分析目的学习目标内容一、数据总体了解二、缺失值和唯一值三、深入数据-查看数据类型四、数据间相关关系五、用pandas_profiling生成数据报告总结 目的1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.
2.了解变量间的相互关系、变量与预测值之间的存在关系。
3.为特征工程
转载
2024-05-15 11:46:00
103阅读
在此数据集(查看文末了解数据获取方式)中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化?相关视频有25个变量:1. ID: 每个客户的ID2. LIMIT_BAL: 金额3. SEX: 性别(1 =男,2 =女)4.教育程度:(1 =研究生,2 =本科,3 =高中,4 =其他,5 =未知)5.
转载
2024-08-26 07:39:04
175阅读
《Python金融大数据风控建模实战》 第13章 特征工程进阶本章引言Python代码实现及注释 本章引言数据和特征决定了机器学习的上限,而模型和算法只是进一步接近这个上限而已。特征工程在整个机器学习中的重要性不言而喻,而且特征工程严重依赖于行业知识。深度学习的出现给自动特征工程带来了希望,深度学习提出了一种端到端的学习模式,即无须人工特征工程,而只需要给定输入数据与预测目标,模型即可自动实现特
转载
2024-02-27 10:02:43
89阅读
智能风控: Python金融风险管理与评分卡建模
作为一名经验丰富的开发者,我将帮助你实现"智能风控: Python金融风险管理与评分卡建模pdf"这个项目。下面,我将向你介绍整个实现流程,并给出每个步骤需要的代码和注释。
整体流程:
1. 数据预处理
2. 特征工程
3. 建立评分卡模型
4. 评估模型性能
5. 导出评分卡模型为PDF文档
接下来,我会逐步解释每个步骤需要做什么,以及相应
原创
2023-08-28 06:39:04
812阅读
数据挖掘实践-金融风控TASK03特征工程学习目标学习提纲代码实现1.导入相关的包:2.数据读取3.特征预处理4.缺失值填充5.时间格式处理6.对象类型特征转换到数值7.类别特征处理8.异常值处理 TASK03特征工程学习目标学习特征预处理、缺失值、异常值处理、数据分箱等特征处理方法学习特征交互、编码、选择的相应方法学习提纲数据预处理: a. 缺失值的填充 b. 时间格式处理 c. 对象类型特征
转载
2024-06-14 23:35:45
112阅读
1、评分卡简介信用评分卡模型是最常见的金融风控手段之一,它是指根据客户的各种属性和行为数据,利用一定的信用评分模型,对客户进行信用评分,据此决定是否给予授信以及授信的额度和利率,从而识别和减少在金融交易中存在的交易风险。评分卡模型在不同的业务阶段体现的方式和功能也不一样。按照借贷用户的借贷时间,评分卡模型可以划分为以下三种:贷前:申请评分卡(Application score card),又称为A
转载
2024-02-04 18:48:38
240阅读
知乎丨https://zhuanlan.zhihu.com/p/148102950本文摘要本文将带领读者一起进行完整的建模全流程,了解银行风控是如何做的。并提供kaggle代码。首先讲述评分卡的分类、优缺点。接下来,结合完整的可以马上运行的代码,中间穿插理论,来讲解评分卡的开发流程。最后,把方法论再梳理一次,让读者在了解全流程后,在概念上理解再加深。本文还提供了完整的全流程代码,读者打开https
原创
2021-04-06 12:05:26
5073阅读
1评论