一、关联规则概述1993年,Agrawal等人在首先提出关联规则概念,迄今已经差不多30年了,在各种算法层出不穷今天,这算得上是老古董了,比很多人年纪还大,往往是数据挖掘入门算法,但深入研究不多,尤其在领域,有着极其重要应用潜力,是一个被低估算法,很少见到公开文章提及,我尝试一一剖析,希望给你带来一定启示。我自己进行了深刻、全面的思考,并进行了大量实验,这个话题感觉可以聊三天
比赛概览拍拍贷“魔镜系统”从平均400个数据维度评估用户当前信用状态,给每个借款人打出当前状态信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率预测,为投资人提供了关键决策依据,促进健康高效互联网金融。拍拍贷首次开放丰富而真实历史数据,邀你PK“魔镜系统”,通过机器学习技术,你能设计出更具预测准确率和计算性能违约预测算法吗?比赛规则参赛团队需要基于训练集数
作者:桔了个仔,南洋理工大学,Datawhale成员想起刚入门风时,天天对变量进行WOE变换,很多书籍和文章都讲得很详细,公式和例子都有,但他们很少直接回答:为啥要用WOE?不用WOE不行吗?WOE有啥神奇功效?本文试图根据自己理解回答。在用到数据里,我们会用到两种变量:Numerical Variable,数值变量。例如逾期金额,天数。Categorical Variable,类别变量。
本发明涉及规则导出技术,尤其涉及一种基于决策树智能规则导出方法及系统。背景技术:规则在当今社会大多数互联网和金融公司有广泛应用价值。多数情况下,规则大多数是由相关业务人员和安全专家根据以往经验、业务等条件来制定。这种规则制定周期比较长,无法完全适用于不同业务系统,即当遇到另一个业务场景时,需要专家再次进行业务分析、决策。这样会给企业带来更大经济损失和开销成本。传统
Python金融大数据建模实战》 第4章 数据清洗与预处理本章引言Python代码实现及注释 《Python金融大数据建模实战》 第4章 数据清洗与预处理 本章引言数据清洗与预处理是整个评分卡模型开发乃至整个机器学习模型开发中非常重要部分,通常包括数据集成、数据清洗、探索性数据分析和数据预处理。数据集成:将多个数据源数据构成一个统一数据结构或数据表过程。如果不同数据源有结构化
这一两期课程是模型专场。我们知道金融模型,不单单指评分卡,而是针对产品营销、定价、授信、管理、催收、监测等业务流程开发一系列策略、规则、评分卡集合。 目前,利用有监督、无监督、半监督、深度学习等算法开发评分卡是模型中卓有成效技术。 模型应用于业务场景,即在特定场景下,利用数据,高效,准确地完成特定预测或者判断任务。 在模型训练过程中:每一种场景下,模型都可以通过数据进行训练而
之前,番茄学院就文章课程《贷前决策部署与策略调优》,进行了相关课程直播。本文我们会以文字内容跟大家介绍这个部分内容。策略是平衡风险与收益手段,也是追求利润最大化工具。尤其在贷前策略中,相信策略分析同学身有体会。在做整个策略过程中,最重要不是追求无坏账,而是利润最大化。而说到利润最大化就不得不提通过率与坏账整个两个指标。在整个策略中,流程大致可以分为以下几个流程:一个
零基础入门金融之贷款违约目的:1.EDA价值主要在于熟悉了解整个数据集基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来机器学习或者深度学习建模.2.了解变量间相互关系、变量与预测值之间存在关系。3.为特征工程做准备数据总体了解:读取数据集并了解数据集大小,原始特征维度;通过info熟悉数据类型;粗略查看数据集中各特征基本统计量;缺失值和唯一值: 查看数据缺失值情况查
转载 2023-10-20 19:50:43
133阅读
当下,策略岗已经是金融科技圈里热门岗位,随着各大厂布局金融领域,该岗位需求方也从早些年银行、消费金融公司扩展至如今互联网渠道。然而对于刚毕业小白或者是意图转岗“行外者”而言,却对这一岗位了解甚少。知乎上“转行,需要做哪些准备?”问题,有6万点击量,笔者也曾在豆瓣上回答过“收到美团风险政策岗,该不该去?”问题。那么,风险策略分析师具体是做什么?他发展前途怎么样,需要
转载 2023-08-30 06:49:33
144阅读
策略人都经常做一个内容就是cut-off制定,这个也是策略精准运维制胜点,一个重要却经常容易被轻视内容。本文我们来深度讲解这个内容。 一.什么是cut-off 二.怎么制定cut-off 三.怎么确定cut-off合理性一.什么是cut-off 在风险管理过程中Cut-off值制定决定了业务盈利能力,关于cut off可以说成是目标用户与非目标用户中间一条分割线,工作中c
在数字金融和相关应用中,“Android 策略”是保障用户安全重要一环。它主要通过识别潜在风险、监测异常行为以及实施多种安全措施来实现。本文将深入探讨如何有效地设置和管理“Android 策略”,涵盖环境配置、编译过程、参数调优、定制开发、调试技巧、生态集成等方面。 ## 环境配置 在配置“Android 策略环境时,我们需要确保所需工具和库都已经正确安装。下面是配置环境
原创 7月前
53阅读
在番茄往期内容中,我们一直在跟大家介绍策略干货内容,相关内容包括: ①拒绝捞回策略 ②多规则策略筛选 ③策略调优 ④策略开发与应用 … 策略相关内容可谓干货满满,比如关于策略开发与应用内容上,我们跟大家详细介绍了三大最佳策略筛选方法有: ①单维策略开发 ②二维特征交叉组合开发 ③多维特征决策树模型等策略开发内容详细内容参考如下: ①单维特征标签分布 首先来介绍单
# 策略Java实现指南 作为一名刚入行小白,你可能对如何实现策略Java感到困惑。不过别担心,我将带你一步步了解整个流程,并提供代码示例和注释,帮助你快速掌握。 ## 策略实现流程 首先,我们通过一个流程图来了解风策略实现整体流程: ```mermaid flowchart TD A[开始] --> B[定义风险类型] B --> C[收集数据]
原创 2024-07-25 09:21:26
43阅读
# Python 策略规则库简介 ## 引言 在金融领域,风险控制是确保投资安全关键环节。随着数据科学和机器学习发展,Python成为了策略开发重要工具。本文将介绍一个简单策略规则库构建,如何将这些策略应用于实际金融数据中,并通过代码示例加以说明。我们还将使用Mermaid语法展示序列图和甘特图,帮助读者更清楚地理解各个组件之间关系。 ## 策略基本概念
原创 2024-10-28 06:08:31
172阅读
信贷模型是银行等金融机构在贷款业务中必备手段之一,它通过对借款人个人信息、资产状况、还款历史等多个方面进行综合评估,来预测借款人是否具有还款能力和还款意愿。在实际应用中,信贷模型需要基于大量数据和复杂算法模型进行训练和优化,以提高预测准确性和稳定性。传统建模大多采用逻辑回归(LR)算法,而近年来,随着对于模型精度要求不断提高,一些更加先进复杂机器学习算法也开始被引
# 使用Java进行风系统开发 ## 什么是 ,或风险控制,是企业在业务运作过程中识别、评估和控制潜在风险重要管理活动。尤其在金融科技、电子商务等行业,机制建立对于保障资金安全和业务顺畅至关重要。本文将探讨如何使用Java构建一个简单系统,并提供相关代码示例。 ## 系统基本流程 系统通常包括以下几个基本步骤: 1. 数据收集:获取用户信息、交易记录等数
原创 2024-10-24 04:08:51
108阅读
前言在上一节我们使用了陌陌开源框架来处理json中单值校验,在这一篇文章里我们主要通过flink sql来处理更为复杂场景。业务场景这一部分业务场景主要是校验企业当期需要报税科目,相比企业往期报税科目是否有增加或减少,以此来防止税务漏报。我们企业用户数量在百万级别,每个业务期间漏报率、误报率在千分之5左右,也就是会有几千家会有漏报情况,而漏报会缴纳2000元罚款,每个业务期间亏损
转载 2024-02-11 21:51:14
49阅读
做了大概5年,中间做过甲方,做过乙方,做过模型,做过策略,做过数据分析,但是始终觉着不得精华,事情太多,有的东西也就很难深入,目前就是将这么几年积累写下来,给自己一个总结。一、数据分析1.1、主要目的数据分析是通过分析数据指标得到一些业务结论,不能写个代码出个报表截图发下就行,要从中善于发现和总结。1.2、年化损失率测算1.2.1、年化坏账:时点坏账率:统计时点坏账金额/在贷余额,
中,总有那么一群人,他们或是因触碰到强规则而被拒之门外客群,或是因政策从一开始进件就不被准入的人群。同时随着流量获客成本日益昂贵,以及存量客户越来越多,各金融机构对客户筛选越来越慎重。经营竞争白热化,信贷也进入了蓝海。于是通过捞回策略来筛选客群,进一步捞回就显得格外重要。拒绝捞回这个动作这个不仅仅是能得到市场同事欢迎,而且捞好了能积累数据。基于此,如何基于数据规则相关策略,番茄星球
代码实战1 数据2 特征工程2.1 数据清洗2.1.1 数据格式处理2.1.2 缺失值2.1.3 标签处理和选择数据2.2 特征衍生2.3 分箱参考资料 代码实战1 数据来自于lending club print (data.shape) #(39785, 25) data.info() ''' <class 'pandas.core.frame.DataFrame'> RangeIn
  • 1
  • 2
  • 3
  • 4
  • 5