定量数据的分布分析这就不用多说了,直方图。求极差--> 设定组距-->决定分点 --> 统计频率定性数据的分布分析这也不用多说了,扇形图,条形图统计法对比分析折线图统计量分析均值,中位数,极差,标准之类的就不说了,介绍一下变异系数,它是 标准差除以平均值 。反映了标准差相对于均值的离中趋势。数据:catering_sale.xls#-*- coding:utf-8 -*-
imp
转载
2024-04-11 12:48:31
35阅读
目录1.什么是特征工程2.基本预处理:缺失值处理2.1缺失值的处理2.2小练习2数值型特征2.1对数变换2.2幅度缩放2.3统计数值:描述统计分析2.4高次特征与交叉特征2.4.1高次特征3.字符型特征3.1哑变量3.2标签编码1.什么是特征工程 特征是用于描述数据中的各种属性、变量或维度的信息,它们是
参考:1. The Clean Architecture in Python (Brandon Rhodes)2. Python Best Practice Patterns (Vladimir Keleshev)3. Transforming Code into Beautiful, Idiomatic Python (Raymond Hettinger)4. Ho
# 如何计算PSI
## 导言
在风险模型开发中,我们通常需要评估模型在不同样本上的稳定性。而PSI(Population Stability Index)是一种常用的评估模型稳定性的指标之一。计算PSI可以帮助我们了解模型在不同时间段或不同样本上的预测能力是否稳定。本文将介绍如何使用Python计算PSI。
## 流程步骤
首先,让我们来了解计算PSI的整个流程,并使用表格展示出来。
|
原创
2023-07-23 20:50:32
671阅读
Hive特点1.针对海量数据的高性能查询和分析系统 由于 Hive 的查询是通过 MapReduce 框架实现的,而 MapReduce 本身就是为实现针对海量数据的高性能处理而设计的。所以 Hive 天然就能高效的处理海量数据。与此同时,Hive 针对 HiveQL 到 MapReduce的翻译进行了大量的优化,从而保证了生成的MapReduce 任务是高效的。在实际应用中,Hive 可以高效的
转载
2023-10-05 19:19:37
130阅读
1.操作系统、2.编程语言分类、3.变量、4.运行python文件的三个阶段! 一、操作系统 1.什么是操作系统 操作系统是一个协调\管理\控制计算机硬件资源与软件资源的一个控制程序 2.为何要有操作系统 1.把复杂硬件操作封装成简单的功能/接口用来给用户或者应用程序使用(文件) 2.把程序多硬件的竞争变得有序 3.如何用操作系统 一套完整的计算机系统分为三层:
转载
2024-06-18 04:38:09
39阅读
最近开始学习Python自动化运维,特记下笔记。学习中使用的系统是Kali Linux2017.2,Python版本为2.7.14+因为在KALI里面没有自带psutil模块,需要使用pip进行安装安装完成后进入python交互模式查看psutil 的帮助信息,可以发现psutil支持跨平台的环境,同时也支持python3获取CPU信息使用cpu_times获取CPU信息,用户/系统/空闲时间也可
转载
2023-10-09 08:10:11
252阅读
SVD也是对矩阵进行分解,但是和特征分解不同,SVD并不要求要分解的矩阵为方阵。假设我们的矩阵A是一个m×n的矩阵,那么我们定义矩阵A的SVD为:A=UΣVT 其中U是一个m×m的矩阵,Σ是一个m×n的矩阵,除了主对角线上的元素以外全为0,主对角线上的每个元素都称为奇异值,V是一个n×n的矩阵。U和V都是酉矩阵,即满足UTU=I,VTV=I。 以下是一个SVD求解过程:以下是我使用Python实现
转载
2024-02-08 07:41:43
137阅读
# Python计算PSI代码
在数据分析和预测中,PSI(Population Stability Index)是一个常用的指标,用于衡量两个不同时间段或者不同群体之间的分布变化。在Python中,我们可以使用一些库来计算PSI指标,帮助我们更好地理解数据的稳定性和变化情况。
## 什么是PSI指标
PSI指标是用来衡量两个概率分布之间的相似性的指标。通常情况下,我们会将一个基准群体(比如
原创
2024-05-31 06:32:03
185阅读
# 使用Python计算PSI(Population Stability Index)
在数据科学中,PSI(Population Stability Index)是一个重要指标,用于监测模型预测数据的稳定性。特别是在金融行业,PSI能帮助我们审视模型在不同时间段内的性能表现。本文将深入探讨如何使用Python代码计算PSI,帮助新手开发者加深理解。
## 计算PSI的流程
以下是计算PSI
原创
2024-08-18 07:49:59
236阅读
# PSI (Population Stability Index) 计算与 Python 实现
## 引言
在数据分析和机器学习中,了解模型的稳定性和数据的分布变化至关重要。Population Stability Index(PSI)就是一种衡量变量分布变化的方法。它通常用于信用评分、反欺诈、营销活动及其他领域,以监控模型的性能是否随着时间的推移而发生变化。
本文将介绍什么是PSI,如何
原创
2024-09-05 06:02:07
158阅读
# PSI(Population Stability Index)计算的Python实现
在数据科学与机器学习领域,Population Stability Index(PSI)是一种用于衡量特征分布在不同时间段的稳定性的方法。通过计算PSI值,数据科学家可以监控模型的有效性,并及时发现模型失效的趋势。
## PSI的定义
PSI用于比较特征在某一时间段内的分布(一般为当前模型的训练集)与基
# Python计算PSI代码实现教程
## 引言
在Python中计算PSI(Population Stability Index,人口稳定指数)是一个常见的任务,特别是在风控领域和数据分析领域。PSI可以用于比较两个时间段或两个不同群体之间的分布变化。本文将教你如何使用Python编写代码来计算PSI。
## PSi计算流程
下面是计算PSI的一般步骤:
|步骤|操作|
|----|
原创
2023-11-09 16:16:04
393阅读
在进行数据科学和机器学习的项目时,常常需要计算指标来评估模型的表现。其中,**PSI(Population Stability Index)** 是用于确定数据的稳定性的重要工具。本文将深入探讨**Python PSI计算代码**的实现过程,涵盖技术原理、架构解析、源码分析等各个方面。
## 背景描述
在数据分布随时间变化的场景中,我们需要监控模型输入特征的分布,以确保它们保持稳定。PSI 是
(一)ORB特征点提取算法的简介 Oriented FAST and Rotated BRIEF,简称ORB,该特征检测算子是在著名的FAST特征检测和BRIEF特征描述子的基础上提出来的,其运行时间远远优于SIFT和SURF,可应用于实时性特征检测。ORB特征检测具有尺度和旋转不变性,对于噪声及其透视变换也具有不变性,良好的性能是的利用ORB在进行特征描述时的应用场景十分广泛。ORB特
转载
2024-01-18 14:08:51
122阅读
# PSI(Population Stability Index)计算的介绍与实现
在数据科学和机器学习中,监控模型的稳定性是非常重要的一环。PSI(Population Stability Index)是一种广泛使用的指标,用于衡量模型的稳定性和时间变化的影响。本文将详细介绍PSI的定义、计算方法,以及如何使用Python实现这一过程。最终,我们将通过图表和代码示例加深对PSI的理解。
##
原创
2024-09-09 07:36:13
395阅读
# Python中PSI指标计算流程
## 1. 简介
在本文中,我将向你介绍如何在Python中计算PSI(Population Stability Index)指标。PSI指标用于衡量两个数据集之间的分布变化,通常用于监测模型在时间或者不同群体之间的稳定性。
## 2. 计算步骤
```mermaid
journey
title PSI指标计算流程
section 数据准
原创
2024-03-25 06:49:11
704阅读
Python科学计算包NumPy在机器学习过程中设计很多线性代数知识,因此会经常使用NumPy函数库。Numpy可以在不同的数据点上执行矩阵形式的数学运算而不需要复杂的循环操作。对于初学者,在安装python以及numpy,由于操作不慎会遇到各种细节问题,因此对于新手来说推荐使用Anaconda工具。AnacondaAnaconda是一个用于科学计算的python发行版,支持Linux、Mac、W
转载
2024-09-05 16:46:19
55阅读
# 如何在Python中计算PSI(Population Stability Index)
在数据分析和模型开发中,Population Stability Index(PSI)是一个重要的指标,用于衡量模型在不同时间段中的稳定性。在这篇文章中,我们将会一起学习如何用Python计算PSI。
## 流程概述
为了计算PSI,我们需要遵循以下几个步骤:
| 步骤 | 描述 |
|------
原创
2024-10-19 08:16:21
214阅读
1.今日内容生成器初识生成器产生方式yield与return的区别yield与yield from的区别send与next的区别列表推导式,生成器表达式(字典推导式,集合推导式)闭包2.具体内容生成器初识生成器本质就是迭代器,python社区中生成器与迭代器是一种概念。生成器与迭代器的唯一区别:迭代器都是python给你提供的已经写好的工具或者通过数据转化得来的,(比如文件句柄,iter([1,2