1、python安装安装方式1:通过官网安装。 win10 64位操作系统下,安装python过程:官网下载对应安装包(安装包地址:https://www.python.org/downloads/windows/),网络上找对应安装教程,按步骤安装即可。安装方式2:通过anaconda安装,好处是方便管理环境。 step1: 官网下载anaconda安装包,地址:https://www.anac
评分建模工具 说到评分建模工具,做过评分的应该都能想到谢博士的scorecardpy和专为工业界模型开发设计的Python工具包–Toad,两者相比,scorecardpy更加轻量级,且依赖较少,可以满足大多数场景下的评分构建。为了使评分建模流程更加便捷,该Python包针对建模中各个关键步骤都提供了现成的函数,如下:数据集划分 (split_df) 变量筛选(iv, var_filte
【流程图】 ```mermaid flowchart TD A(开始)-->B(导入aPython库) B-->C(创建一个新的Python文件) C-->D(编写代码) D-->E(运行代码) E-->F(结束) ``` 【文章】 ## 如何实现“aPython” 作为一名经验丰富的开发者,我很乐意教会刚入行的小白如何实现“aPython”。下面是详细的步骤和代码示例。 ### 步
原创 2024-01-31 11:31:22
53阅读
Python安装教程:从下载到配置Python作为一门高级编程语言,越来越受到开发人员的欢迎。Python的灵活性和易用性,让许多人选择Python作为他们的程序语言。本文将详细介绍Python安装教程,帮助初学者轻松入门。1. 下载Python安装包Python官方网站提供了最新版本的Python安装包,用户可以在该网站下载适合自己操作系统的安装包。如下所示:[外链图片转存失败,源站可能有防盗链
转载 2023-09-04 07:15:44
39阅读
5 连续型变量自动分箱在评分建模过程中,数据中的连续型变量需要进行分箱,用于计算woe值。 这里使用方分箱进行分箱# 方分箱 def Chi_merge(X, y, columns, k=6): item = dict() pinf = float('inf') # 正无穷大 ninf = float('-inf') # 负无穷大 # 需要选取连续变量,以
读写json文件的文档docimport jsondirectory =os.path.join(os.path.abspath(os.path.dirname(__name__)),wechat_point) if not os.path.exists(directory):os.makedirs(directory) # 将数据写入json文件中 file_path =os.path.join
转载 2024-02-22 19:32:37
96阅读
# 实现Python行为评分B教程 ## 一、流程概述 为了实现Python行为评分B,我们需要按照以下步骤进行操作: | 步骤 | 操作 | | ---- | ---------- | | 1 | 数据准备 | | 2 | 数据清洗 | | 3 | 特征工程 | | 4 | 模型建立 | | 5 | 模型评估 | | 6
原创 2024-07-11 06:16:00
38阅读
差异研究的目的在于比较两组数据或多组数据之间的差异,通常包括以下几类分析方法,分别是方差分析、T检验和方检验。三个方法的区别其实核心的区别在于:数据类型不一样。如果是定类和定类,此时应该使用方分析;如果是定类和定量,此时应该使用方差或者T检验。方差和T检验的区别在于,对于T检验的X来讲,其只能为2个类别比如男和女。如果X为3个类别比如本科以下,本科,本科以上;此时只能使用方差分析。进一步细分三
WOE信用评分Python+Excel实现)一、项目实施背景信用评分是近年来兴起的一种为保障银行和其他金融部门的金融安全而设立的一种关于人生金融权限的划定模型。该模型指根据用户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。根据用户的信用分数,来决定是否放贷,以及相应的授信额度。随着目前小额消费贷的蓬勃发展,银行方面面临着单笔额度较小,申请额度分散,缺乏抵押以及客户质量不确定
转载 2023-08-04 15:52:45
243阅读
1点赞
评分之数据预处理:重复值、填补缺失值、异常值与数据不平衡 在银行借贷场景中,评分是一种以分数形式来衡量一个客户的信用风险大小的手段,它衡量向别人借钱的人(受信人,需要融资的公司)不能如期履行合同中的还本付息责任,并让借钱给别人的人(授信人,银行等金融机构)造成经济损失的可能性。一般来说,评分打出的分数越高,客户的信用越好,风险越小。Python 3.7.3 (default, Ap
<此部分理论内容结合统计学教材学习>列联分析1. 收集样本数据产生二维或多维交叉列联表; 2. 对两个分类变量的相关性进行检验(假设检验)pandas.crosstab(index,columns,margins,normalize) - margins默认为False不带合计数据  - normalize=True频率列联表 salary_reform.
这篇文章主要用来记录学习如何建立信贷评分基本框架。1 数据处理在工作学习过程中感觉其实大部分数据处理过程在SQL中就应该完成,SQL输出的报表已经基本呈现了explanatory变量和response变量一一对应的关系。接下来在python则需要对报表进行进一步更加细节的处理。1.1 变量类型最终入模型的变量数据类型一般来说就是 numeric(continuous 和 discrete) 和
转载 2023-10-16 15:07:49
229阅读
通过Python代码封装评分设计中经常使用的方法 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import math from xgboost import XGBClassifier from sklearn.ensemble import Random
信用风险计量模型可以包括跟个人信用评级,企业信用评级和国家信用评级。人信用评级有一系列评级模型组成,常见是A(申请评分)、B(行为模型)、C(催收模型)和F(反欺诈模型)。 今天我们展示的是个人信用评级模型的开发过程,数据采用kaggle上知名的give me some credit数据集。一、项目流程典型的信用评分模型如图1-1所示。信用风险评级模型的主要开发流程如下: (1) 获取
方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。(更多参考:方检验、方分布) 不讲过多理论,主要使用 python 实现方验证。之前对于元素/特征/属性 异常值的选择情况,可以使用直方图、箱型图、Z分数法等筛选。如&nbs
文章目录简介使用**数据划分****变量分箱****woe转换****模型建立****模型评估****评分映射**运行示例 简介随着互联网在传统金融和电子商务领域的不断,风控+互联网的融合也对传统的风控提出了新的要求和挑战。以评分为例,互联网形态下的评分需要面临更多维数据、更实时数据、更异常数据的挑战。因此,懂得互联网业务下的风控评分已经成为互联网风控从业人员的新要求。Python中信
简介本文通过使用LendingClub的数据,采用方分箱(ChiMerge)、WOE编码、计算IV值、单变量和多变量(VIF)分析,然后使用逻辑回归模型进行训练,在变量筛选时也可尝试添加L1约束或通过随机森林筛选变量,最后进行模型评估。关键词:方分箱,WOE,IV值,变量分析,逻辑回归一、数据预处理数据清洗:数据选择、格式转换、缺失值填补由于贷款期限(term)有多个种类,申请评分模型评估的
一天晚上小淙正在电脑上学习来自东瀛的传统艺术,忽然画面卡住不动了,这种情况我见过很多自然不会慌张,一般只要耐心等待缓冲完毕就会继续播放。然那那一次却等了很久,久到足够我完成一些手艺活。终于腾出手后我拍了拍鼠标才发现,原来是整个屏幕都卡死了。Windows 屏幕卡死并不常见,但一旦发生就很难受,它通常不会有任何反应,并且也不像蓝屏一样会给出错误代码并自动修复。 这时候我们还能做什么?如何防止再次
本文摘要 本文将带领读者一起进行完整的建模全流程,了解银行风控是如何做的。并提供kaggle代码。首先讲述评分的分类、优缺点。接下来,结合完整的可以马上运行的代码,中间穿插理论,来讲解评分的开发流程。最后,把方法论再梳理一次,让读者在了解全流程后,在概念上理解再加深。一、评分的分类在金融风控领域,无人不晓的应该是评分(scorecard), 无论信用还是贷款,都有”前中后“三个阶段。根据
  • 1
  • 2
  • 3
  • 4
  • 5