金融数据建模-冠军方案分享写在前面2019厦门国际银行“数创金融杯”数据建模大赛-冠军团队:三位靓仔成员介绍:团队成员由当下国内赛圈著名选手组成,一月三冠选手宁缺,赛圈网红林有夕,以及最具潜力选手孙中宇组成。赛事地址:https://www.dcjingsai.com/v2/cmptDetail.html?id=319首先还是非常感谢他们提供的冠军方案分享,下面就一起来看看是如何大比分遥遥领先
任务介绍 整体学习内容 本次组队学习的内容为:数据挖掘实践(金融),该内容来自 Datawhale与天池联合发起的 零基础入门数据挖掘 - 贷款违约预测 学习赛的第一场。 整体赛题要求 比赛要求参赛选手根据给定的数据集,建立模型,预测金融风险。 赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为
金融0基础入门-Task2 数据分析目的学习目标内容一、数据总体了解二、缺失值和唯一值三、深入数据-查看数据类型四、数据间相关关系五、用pandas_profiling生成数据报告总结 目的1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模. 2.了解变量间的相互关系、变量与预测值之间的存在关系。 3.为特征工程
转载 2024-05-15 11:46:00
103阅读
《Python金融大数据建模实战》 第4章 数据清洗与预处理本章引言Python代码实现及注释 《Python金融大数据建模实战》 第4章 数据清洗与预处理 本章引言数据清洗与预处理是整个评分卡模型开发乃至整个机器学习模型开发中非常重要的部分,通常包括数据集成、数据清洗、探索性数据分析和数据预处理。数据集成:将多个数据源的数据构成一个统一的数据结构或数据表的过程。如果不同数据源有结构化
导语:如何通过海量数据与欺诈风险进行博弈?随着
原创 2023-05-10 23:30:19
454阅读
以P2P网贷为例互联网金融产品如何利用大数据?      销售环节 了解客户申请意愿和申请信息的真实性;适用于信贷员模式。 关键点 亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位。   审批环节 进行基本信贷政策的核查,主要是核实申请信息、证件资料、是否伪冒申请。系统会审核剔除不符合基本信贷政策要
转载 5月前
35阅读
《Python金融大数据建模实战》 第11章 模型在线监控本章引言Python代码实现及注释 本章引言第9章介绍了在模型开发阶段的评估指标。模型完成开发后,如果其性能满足基本要求,就可以在生产环境中上线使用。在这个阶段仍然需要对模型指标进行评估,其目的在于判断模型的有效性,通过指标的判断给模型提供更新机制,即模型要使用多久,以及当哪些指标发生恶化后需要终止使用并重新开发新模型。模型评估指标决
转载 2023-10-14 06:37:10
159阅读
分享嘉宾:严澄 度小满金融 模型负责人编辑整理:黄乐平出品平台:DataFunTalk导读:金融是AI赋能传统行业的重要赛道。本次分享的主要内容为金融大数据模型在度小满金融的实践。主要介绍金融大数据模型的主要技术方法与在应用层面的主要问题,并结合新冠疫情背景下,探讨下风模型的发展。01金融大数据模型的技术方法1. 风险管理中的金融科技风险管理中的金融科技主要包括两个方面:一方面是
原创 2021-03-26 16:26:22
2281阅读
导读:本次报告曾老师主要分享了携程金融算法从0-1的发展进程,以时间为主线,经历了数据样本由少到多,特征由粗到细,模型由简单到复杂,效果由坏到好的全过程,重点以申请评分模型和反欺诈模型进行阐述,是一次很好的模型实践报告。「业务介绍」模型一定是基于业务的,所以首先介绍一下携程的业务情况,即本文所提及模型的实际应用场景。携程金融主营业务有三大模块:消费金融,包括消费分期(拿去花)和现金分期(借
原创 2021-03-29 15:39:38
1473阅读
 1 引入工具–加载数据分析包启动IPython notebook,加载运行环境:2 数据准备俗话说: 巧妇难为无米之炊。小安分析的数据主要是用户使用代理IP访问日志记录信息,要分析的原始数据以CSV的形式存储。这里首先要介绍到pandas.read_csv这个常用的方法,它将数据读入DataFrame。对的, 一行代码就可以将全部数据读到一个二维的表结构DataFrame变量,感觉很简
转载 6月前
23阅读
本文将按《数据——信用评分建模教程》行文逻辑,并结合相关参考材料,为大家梳理本书涉及的重点知识,也算是自己读书笔记分享。有需要的同学可先收藏、点赞,以便回顾学习和吸收,当然,如果愿意关注我,自然也是极好的^_^第一章 信用评分基础认识与应用 第一节 信用评分卡简介在信贷审批行业中,为提升审批效率并降低人工审批成本,信用评分卡模型应运而生。我们平时接触到的平均分卡主要
先介绍下金融借贷业务流程:用户前来申请借贷,会先经过欺诈识别,把欺诈团伙和主观欺诈的个人拒绝掉,然后对通过的人做信用评估,最后根据额度模型,算出利润最大化时放款金额。刚才提到了团队欺诈,举个真实的例子。宜人贷在他们的财报中公布的,他们被一个团伙成功撸走了2000多单,当时宜人贷的件均4w, 一下损失了8000w!!那么如何防范这种风险呢。这就是今天要分享的图算法。图可以将这些一个个有良好记录的个体
不管是传统的银行还是现在流行的互联网金融永远是其核心。前言互联网金融近几年得到了飞速的发展,它在某些方面其实是履行了部分银行的特征,给很多中小企业和个人解决了部分贷款的需求。从字面上来看,互联网金融其实就是互联网+金融的简称,这个词语算是属于中国特有,其实就是通过互联网的手段进行金融的交易,毕竟国有的金融机构覆盖人群范围还是比较狭窄,在交易方式上还是偏重于传统的线下审核和放款手段。互联网金融
内容架构:一、什么是的全称是风险控制,指的是管理者通过一定的方式和手段把事情能安全有序的完成;降低甚至消除过程中风险事件发生的可能性,或者是减少和避免风险事件带来的损失。其实一直在我们生活中以不同的方式保障着我们的安全。比如我们平时的账号登陆在异地登陆(没在过的登陆位置)会有风险提示,并需要通过验证的方式才能成功登陆,以防盗号危险。因此,风险控制无处不在。二、有哪些不同的形式?
为什么要做系统不做的话,会有以下风险:各种小号、垃圾账号泛滥撞库攻击、盗号、毁号、拖库等拉新 10w 留存率不到 5%百万营销费用,却增加不了用户粘性投票票数差距非常悬殊各种榜单被垃圾账号占领实物奖励被机器人领走红包被秒抢下单不付款占库存虚拟占座刷单炒信……场景营销活动反作弊防御现金红包奖励、优惠劵促销、电商秒杀等营销活动场景下薅羊毛、黄牛党倒卖等各种欺诈行为内容防盗爬防御行业竞争数据、高
转载 2024-07-17 00:53:50
23阅读
大数据的概念引入互联网金融行业之中已经不再是新鲜事,但是我们可以看到很多的P2P机构仍然是采用线下传统的方式去运营,比如依赖人工经验预判。这样的方式仍然会给平台带来很多的风险和问题,而伴随着行业的高速发展,这种不够标准化的方式已经不再适合大范围沿用了。因此,大数据的概念开始被倡导、甚至被重视。而眼下P2P行业所呈现出来的“资产困境”,也成为了引入大数据的重要契机。大数据对于P2
互联网金融产品如何利用大数据?相关解答互联网金融产品太多,这里以P2P网贷为例,从风涉及的相关环节分别来尝试讨论销售环节: 了解客户申请意愿和申请信息的真实性适用于信贷员模式,关键点:亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位审批环节: 进行基本信贷政策的核查,主要是核实申请信息、证件资料、是否伪冒申请。系统会审核剔除不符合基本信贷政策要求的客户,例如有严重不良征集记录
大数据与计算机视觉的结合正在重塑目标检测和图像分类的技术边界,尤其在数据规模、模型复杂度和实时性要求极高的场景下。以下是关键技术路径、优化策略及实战案例:一、大数据下的图像分类技术栈1. 数据层面的挑战与应对海量数据管理:分布式存储:图像库分片存储于HDFS或对象存储(如AWS S3),通过Petastorm格式加速TensorFlow/PyTorch读取。高效预处理:Spark并行化处理(缩放/
原创 5天前
30阅读
2020年是个人触碰知识图谱时间最多的一年,技术知识的重新梳理和学习,相关项目的参与,几乎从年初持续到年末。一直想总结知识图谱在金融领域的应用现状,但总是挣不脱一个字:乱。最直观的“乱象”是不同机构对这项技术的称呼五花八门——关联网络、关系图谱、复杂网络、知识图谱。严格来讲它们彼此之间紧密相连又有所区别,本文并不打算严谨地去论证它们的区别和联系,请允许我偷懒采用图谱这个名称来泛指这项技术,就是各位
近日蚂蚁金服在成都举办的蚂蚁开放日上称,整合互联网资源帮助线下商业升级将成为下一个创业风口,并宣布面向本地创业者开放支付、信用、营销、等互联网技术能力。其中,环节的服务为推出品牌“蚁盾”。据介绍,蚁盾是一项拥有完整风体系的服务,目前主要在金融和互联网新型行业进行布局。其中,作为蚂蚁金服移动智慧城市压轴技术环节,蚁盾多应用于消费金融、医院、出行、共享经济等行业领域。瞄准市场,开放技术储
  • 1
  • 2
  • 3
  • 4
  • 5