变量中心如果说数据是原料,策略是产品的话,那么变量就是当中的零部件了。一个完整的策略依赖的关键变量可能有几百上千个,底层的变量池子就远远大于这个数了。变量中心在平台中是最重要但是同时也最容易被人忽视的一部分,一方面不像审批系统、决策引擎那样是完整的产品平台,也不像底层数据平台那么有完整的技术方案。变量在不同公司体系里面,形态有很多,可以是一个接口,也可以是一段SQL。由于变量
转载 2022-12-21 19:01:02
278阅读
近期一直忙着面试,分享下相关的心得体会。下面是之前分享的关于数据岗位的一些经验,无论是准备找工作还是正在找工作的亲们,希望能够给予参考~首先说明数据运营、数据分析、数据建模不是一个岗位。很多大厂由于业务线部门设置,以上岗位也不是在同一个部门部门的。很多部门都有数据岗位,隶属某一级部门下属二级部门。我此次面试的是数据运营岗位,工作经历是因为曾在某昌做运营。而我本身不是学习计算机、统计出身,我研究
报表体系的搭建对于任何一家金融机构都尤为重要,对于模型来说经上线部署后会因内外部各种因素引起模型分数偏移,甚至出现错误。因此,为了能在第一时间发现问题,我们需要对模型进行动态监控。有一套相对完整的报表系统,能对模型的有效性、稳定性进行监控,更好地保证模型运行以及迭代新的模型版本。对于一般的模型,即ABC卡来说,简单地可以把监控分为前端监控和后端监控。这两张报表主要是反应分数分布和区分能力的
零基础入门金融之贷款违约目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工程做准备数据总体了解:读取数据集并了解数据集大小,原始特征维度;通过info熟悉数据类型;粗略查看数据集中各特征基本统计量;缺失值和唯一值: 查看数据缺失值情况查
转载 2023-10-20 19:50:43
133阅读
引言互联网时代,万物互联,网络安全形势越来越严峻,安全是企业的基石,在企业中扮演着“警察”角色,运用各种技术和手段,保护企业内的用户利益不受侵害。 决策引是中台的入口,提供业务风险场景事件接入,可视化编排复杂决策,丰富的特征变量与场景识别服务等功能。相较于需要开发背景及算法背景才能使用的传统引擎,本文介绍的决策引擎构建完成后无需开发背景甚至无需算法建模背景,作为纯正的策略运营即可配
转载 2023-11-07 09:22:00
40阅读
1.业务理解业务的理解是做好模型的前提,才能更好的指标模型的方向,一般包括以下几个方面: 1.建模的目的及目标 2.好坏标签的确定 3.时间窗口的确定 4.建模的时间周期2.数据准备与预处理1.需要获取哪些数据,如何获取 2.数据的时间格式、特殊格式的处理 3.数据的极值/异常值(箱线图和分位数) 4.数据的缺失值(完全随机缺失、随机缺失、完全非随机缺失),补缺或作为一种状态 5.文本数据——主题
前言我们的项目是基于报税业务进行风险控制,检测出报错税的情况。对于比较复杂的风险情况,比如两个json进行比较这种情况,可能涉及到时间窗口、流程化的部分,我们采用flink cep进行处理。对于较为简单的风险情况,比如判断json的某一个数据项是否为空,数值类型是否在一个范围之内,这一部分的业务,我们将借鉴陌陌的框架进行定制化开发。需求分析通过陌陌的介绍,我们可以看出它的产品定位是静态的规则引
转载 2024-08-16 13:20:02
80阅读
说明上篇我们讲了金融信贷业务流程,今天我们讲讲金融信贷风险点及量化风险管理。过去400年间,只有保险公司始终积极从事风险管理活动;150年前,风险管理的范围开始扩大到信用风险和市场风险;最近40年,市场剧变让风险变得越来越复杂,潜在成本和未来机遇难以把握,企业开始有意识地从公司层面管理风险;20世纪80年代起, 企业在识别和管理风险上投入更多精力,带有“风险”的头衔成为新的职位;这个领域,逐渐形成
Aviator是一个高性能、轻量级的java语言实现的表达式求值引擎,主要用于各种表达式的动态求值。Aviator的特性支持大部分运算操作符,包括算术操作符、关系运算符、逻辑操作符、位运算符、正则匹配操作符(=~)、三元表达式?: ,并且支持操作符的优先级和括号强制优先级,具体请看后面的操作符列表。支持大整数和精度运算(2.3.0版本引入)支持函数调用和自定义函数内置支持正则表达式匹配,类似Rub
web项目总免不了用户的管理与注册,需求稍微再多一点儿,就涉及用户的角色及权限管理了,下面根据自己项目的实际经验,介绍如何在Jfinal项目中使用Shiro来进行简单的登陆及权限管理。主角简介Jfinal 位居开源中国年度热门开源项目前列,简单好用快速的java web开发框架,用过就知道。Shiro Apache基金会顶级项目,所以你懂得。java安全框架里的主流选择,号称相当简单,但是我至今其
## Java ### 什么是? 风险控制(Risk Control),通常简称为,是指在金融领域中对各种风险进行评估和防范的一种管理方法。在实际应用中,主要包括信用风险、市场风险、操作风险等多个方面。 ### Java中的应用 Java 是一种广泛应用于金融领域的编程语言,其优势在于具有丰富的开发工具和库,支持多线程处理,性能稳定等特点。在系统中,Java
原创 2024-06-02 04:51:29
59阅读
一、背景1.为什么要做?这不得拜产品大佬所赐目前我们业务有使用到非常多的AI能力,如ocr识别、语音测评等,这些能力往往都比较费钱或者费资源,所以在产品层面也希望我们对用户的能力使用次数做一定的限制,因此风是必须的!2.为什么要自己写?那么多开源的组件,为什么还要写呢?是不是想重复发明轮子呀.要想回答这个问题,需要先解释下我们业务需要用到的(简称业务),与开源常见的
转载 2023-07-24 14:24:07
251阅读
互联网金融产品如何利用大数据?相关解答互联网金融产品太多,这里以P2P网贷为例,从风涉及的相关环节分别来尝试讨论销售环节: 了解客户申请意愿和申请信息的真实性适用于信贷员模式,关键点:亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位审批环节: 进行基本信贷政策的核查,主要是核实申请信息、证件资料、是否伪冒申请。系统会审核剔除不符合基本信贷政策要求的客户,例如有严重不良征集记录
如果决策引擎是的大脑,那么规则引擎则是大脑内的重要构成,其编排了各种对抗黑产的规则,是多年对抗黑产的专家经验的累计,本文将向你介绍规则引擎的构成及实现。 引言如果决策引擎是的大脑,那么规则引擎则是大脑内的重要构成,其编排了各种对抗黑产的规则,是多年对抗黑产的专家经验的累计,本文将向你介绍规则引擎的构成及实现。背景什么是规则引擎?规则引擎可以帮助企业将
转载 2024-06-14 22:18:24
108阅读
介绍:radar是一款基于java语言,使用Springboot + Mongodb + Groovy + Es等框架搭建的轻量级实时风引擎,适用于反欺诈应用场景,极简的配置,真正做到了开箱即用。 项目特点: 实时风,特殊场景可以做到100ms内响应 可视化规则编辑器,丰富的运算符、计算规则灵活 支持中文,易用性更强 自定义规则引擎,更加灵活,支持复杂多变的场景 插件化的设计,快速接入其它数据
转载 2023-06-09 11:31:23
357阅读
决策引擎是的大脑,而决策树的编排能力和体验是构建大脑的手段,如何构建高效、丝滑、稳定可靠的决策树编排能力,是对决策引擎的一大挑战,本篇文章和大家分享一下过往构建心得。 引言本篇主要聚焦介绍决策引擎中决策树编排能力的构建。决策引擎是的大脑,而决策树的编排能力和体验是构建大脑的手段,如何构建高效、丝滑、稳定可靠的决策树编排能力,是对决策引擎的
转载 2024-02-11 14:57:56
72阅读
## 数据架构简介 数据架构是指在风险控制系统中用于存储和处理数据的架构设计。随着互联网的发展,各类金融风险不断增加,对数据的处理需求也越来越高。本文将介绍数据架构的基本概念、设计原则,并提供一个示例代码来演示如何实现一个简单的数据架构。 ### 数据架构的基本概念 数据架构由以下几个基本组件构成: 1. 数据源:数据的来源,可以是用户行为数据、交易数据、外
原创 2023-12-27 09:42:18
75阅读
# 数据挖掘:探索风险管理的深层次 随着现代科技的发展,数据挖掘(Data Mining)在金融和银行领域获得了极大的关注。有效的风险控制(Risk Control)不仅可以提高业务效率,还能保护企业免受潜在损失。在本文中,我们将探讨中的数据挖掘技术,并展示一个简单的代码示例来演示如何通过数据挖掘进行风险评估。 ## 数据挖掘的关系 是指通过各种手段识别、评估和控制风险,
原创 2024-09-23 05:51:56
63阅读
python信用评分卡(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 互联网金融可以应用的大数据,首先体现在社交数据:微博
目前贷款的因为每一个样本的收集都需要放款来收集,想想每人放一万,一个亿也就只能放1万人,所以样本量不会太大。所以所谓大数据主要是大在特征的数据上。很多时候是用了很多传统上不怎么敢用的特征。比如传统比较害怕missing value 比较害怕不稳定的特征 这些都是大数据需要解决的。说到模型,既然是特征多,样本少,那就需要一个非常抗过拟合的模型。另外如果是单独针对反欺诈而不是信用,因为
转载 2023-09-10 16:23:47
92阅读
  • 1
  • 2
  • 3
  • 4
  • 5