1 生成0和1的数组empty(shape[, dtype, order]) empty_like(a[, dtype, order, subok])
eye(N[, M, k, dtype, order])
identity(n[, dtype])
ones(shape[, dtype, order])
ones_like(a[, dtype, order, subok])
zeros(shap
转载
2024-07-17 21:29:08
17阅读
从python的优缺点来说一下吧:python语言的优点⑴作为初学python的科班出身的小白,python非常简单,非常适合人类阅读。阅读一个良好的Python程序就感觉像是在读英语一样,尽管这个英语的要求非常严格!Python的这种伪代码本质是它最大的优点之一。它使你能够专注于解决问题而不是去搞明白语言本身。⑵易学。python虽然是用c语言写的,但是它摈弃了c中非常复杂的指针,简化了pyth
转载
2024-02-19 19:07:11
31阅读
最近开始学习Python自动化运维,特记下笔记。学习中使用的系统是Kali Linux2017.2,Python版本为2.7.14+因为在KALI里面没有自带psutil模块,需要使用pip进行安装安装完成后进入python交互模式查看psutil 的帮助信息,可以发现psutil支持跨平台的环境,同时也支持python3获取CPU信息使用cpu_times获取CPU信息,用户/系统/空闲时间也可
转载
2023-10-09 08:10:11
252阅读
模型效果主要从两个方面衡量: 1.模型本身的效果,主要评价指标包括区分度、准确度等。 2.模型稳定性,主要评价指标包括PSI和CSI等。 之前阐述了模型本身的评价指标:混淆矩阵、F1值、KS曲线、count_table和ROC曲线AUC面积,本文介绍模型稳定性指标PSI。 文章目录一、详细介绍PSI1 什么是PSI2 PSI计算公式3 PSI阈值衡量标准二、用Python如何计算
转载
2023-09-07 11:22:10
995阅读
基础: 时间序列学习笔记(2)平稳性 许多预测模型都要求时间序列具有一定的一致性,即“平稳性”。平常的转换,即整数阶差分(譬如,在金融学中表现为建模收益而不是绝对价格),消除了数据中的记忆,从而影响了建模的预测能力。本文概述了分数微积分如何保留更多的信息,以及如何更好地在平稳性和有意义的记忆之间做出权衡。一般而言,我们会把一个给定的时间序列理解为一个随机过程产生的样本,并试图
目录1.什么是特征工程2.基本预处理:缺失值处理2.1缺失值的处理2.2小练习2数值型特征2.1对数变换2.2幅度缩放2.3统计数值:描述统计分析2.4高次特征与交叉特征2.4.1高次特征3.字符型特征3.1哑变量3.2标签编码1.什么是特征工程 特征是用于描述数据中的各种属性、变量或维度的信息,它们是
2021-03-15因为模型是以特定期间的样本所开发的,此模型是否实用于开发样本之外的族群,必须通过稳定性测试能力得悉。稳定度指标(population stability index ,PSI)可掂量测试样本及模型开发样本评分的的散布差别,为最常见的模型稳定度评估指针。其实PSI示意的就是按分数分档后,针对不同样本,或者不同工夫的样本,population散布是否有变动,就是看各个分数区间内人
作者:泛音/Fainke混淆矩阵:也称为误差矩阵,是一种特定的表格布局,允许可视化算法的性能,通常是监督学习的算法(在无监督学习通常称为匹配矩阵)。矩阵的每一行代表预测类中的实例,而每列代表实际类中的实例(反之亦然)。从字面理解:看出系统是否混淆了两个类(即通常将一个类错误标记为另一个类)(多类可以合并为二分类)。一级评价指标:由四个基础指标构成:TP、FN、FP、TN① 真实值是positive
关键词:CPCT、精细化运营思维、客户、产品、渠道、时机、运营电信运营商市场饱和,用户新增主要靠弃卡后重新入网以及异网用户策反。用户新增已如此艰难,所以更加关注存量用户经营。运营商营销资源不断收缩,广撒网的粗放式传统模式不再适用,精细化运营,科学投放资源,不断提高资源投放效益是运营必须坚持的运营策略。运用数据的CPCT策略(Customer、Product、Channel、Time),对合适的客户
转载
2024-01-26 12:02:17
67阅读
外部标准:
1.
给客户带来的损失
。比如数据错误,系统宕机。把损失换成金钱,除以此系统本来可以赚的利润,达到一个百分比:
标准1: 客户损失金额/利润
说明:得到这个数据可能比较困难,现实有很多情形,我们可以灵活处理
转载
2023-11-27 09:19:43
76阅读
1 最小二乘拟合2 函数最小值3 非线性方程组求解4 B-Spline样条曲线5 数值积分6 解常微分方程组7 滤波器设计8 用Weave嵌入C语言 SciPy函数库在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性 代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等。 注:python版本不同,语法会略微有所差异。 我所使用的是Python 3.6.5
转载
2024-04-24 14:35:09
33阅读
文章目录系统性能信息模块psutil获取系统性能信息系统进程管理方法项目实战: Linux服务器主机监控脚本 系统性能信息模块psutilpsutil(python system and process utilities), 是系统监控及进程管理且 跨平台的系统管理库,实现命令行中类似ps、top、lsof、netstat、ifconfig、who、df、kill、free、nice、ioni
转载
2023-11-09 12:46:04
89阅读
在风控领域的业务中,稳定性压倒一切,一套风控模型正式上线运行后往往需要很久(通常一年以上)才会被替换下线。如果模型不稳定,意味着模型不可控,对于业务本身而言就是一种不确定性风险,直接影响决策的合理性,这是不可接受的。在机器学习构建风控模型时,我们基于假设“历史样本分布等于未来样本分布”。因此,我们通常认为:
转载
2023-10-07 13:50:09
121阅读
参考:1. The Clean Architecture in Python (Brandon Rhodes)2. Python Best Practice Patterns (Vladimir Keleshev)3. Transforming Code into Beautiful, Idiomatic Python (Raymond Hettinger)4. Ho
# 深入了解PSI函数与Python的实现
## 引言
在科学和工程领域,特别是在信号处理、图像处理和统计分析中,PSI(或称为“积累函数”)是一种重要的数学工具。本文将介绍PSI函数的概念,并用Python进行实现和应用。我们将通过具体的代码示例来帮助读者理解PSI函数的工作方式,并展示如何在Python中实现它。在结尾,我们还会通过饼状图展示PSI函数在数据分析中的应用。
## 什么是
SciPy函数库在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等。最小二乘拟合假设有一组实验数据(x[i],y[i]),我们知道他们之间的函数关系:y=f(x),通过这些已知信息,需要确定函数中的一些参数项。例如:如果f是一个线形函数f(x)=k*x+b,那么参数k和b就是我们需要确定的值。如果将这些参数用p表
转载
2024-02-19 08:21:50
55阅读
对系统稳定性的一些理解 在数字信号处理中,系统的稳定性是一个很重要的问题,比如说在滤波器的设计中,都要求系统必须稳定,否则是无法使用的。那么,如何判断系统是否稳定呢? 从定义上说,如果输入有界,则输出必定有界的系统是稳定的。从数学上可以推导出,因果系统冲击响应Z变换的收敛域包含单位圆的系统是稳定的。从零点极点的角度,则是系统函数的所有极点都在单位圆内的系统是稳定的。如何来理解呢? 我们先以一个简单
转载
2024-09-21 19:46:40
58阅读
# 如何计算PSI
## 导言
在风险模型开发中,我们通常需要评估模型在不同样本上的稳定性。而PSI(Population Stability Index)是一种常用的评估模型稳定性的指标之一。计算PSI可以帮助我们了解模型在不同时间段或不同样本上的预测能力是否稳定。本文将介绍如何使用Python计算PSI。
## 流程步骤
首先,让我们来了解计算PSI的整个流程,并使用表格展示出来。
|
原创
2023-07-23 20:50:32
671阅读
引言与示例:datenum日序转月序在处理数据时,我们经常需要将逐日数据转为逐月数据,这就需要我们知道日序对应的月序,比方说,我有2019年一整年的天数据共365个,我知道这个文件代表的是2018年的第几天?那么我如何知道它是2018年的第几个月呢? 如果直接上网搜索你会发现一个常见的思路:首先判断是闰年还是非闰年,然后给出每个月都日期总数,编写函数来计算。 这方法当然可行,但却是基于C语言的一种
# Python计算PSI代码
在数据分析和预测中,PSI(Population Stability Index)是一个常用的指标,用于衡量两个不同时间段或者不同群体之间的分布变化。在Python中,我们可以使用一些库来计算PSI指标,帮助我们更好地理解数据的稳定性和变化情况。
## 什么是PSI指标
PSI指标是用来衡量两个概率分布之间的相似性的指标。通常情况下,我们会将一个基准群体(比如
原创
2024-05-31 06:32:03
185阅读