1、背景应用背景是一个企业非法集资风险预测的竞赛,赛题提供了各个企业多维度特征的数据以及标注了部分企业有无非法集资风险的数据,目的是根据所提供的企业数据资料去预测出未标注的企业有无非法集资风险。其中有非法集资风险标注为1,无非法集资风险标注为0。该问题可以归结为一个二分类问题。本文采用keras框架搭建神经网络(keras框架高度模块化,使用简单上手快,以Tensorflow、Theano或CNT
转载
2024-04-09 02:04:59
369阅读
说到softmax和sigmoid二者差别,就得说说二者分别都是什么。其实很简单,网上有数以千计的优质博文去给你讲明白,我只想用我的理解来简单阐述一下:sigmoid函数针对两点分布提出。神经网络的输出经过它的转换,可以将数值压缩到(0,1)之间,得到的结果可以理解成“分类成目标类别的概率P”。而不分类到该类别的概率,就是(1 - P),这也是典型的两点分布的形式;softmax本身针对多项分布提
转载
2024-05-30 19:48:53
196阅读
效果评估是模型选择和算法设计的重要步骤,知道评估优劣才能选择最佳的模型和算法,本节介绍一些有关评估方法的定义,凡是在统计或大数据领域都用得到 真阳性 true positives, TP 真阴性 true negatives, TN 假阳性 false positives, FP 假阴性 false negatives, FN) 准确率 分类器预测正确性的比例
二分类问题评价指标评价指标准确率精确率召回率F1值ROCAUC 评价指标二分类问题评价指标的相关整理,持续更新。评价指标是针对同样的数据,输入不同的算法,或者输入相同的算法但参数不同而给出这个算法或者参数好坏的定量指标。二类分类问题常用的评价指标是精准度(precision)、召回率(recall)、F1值 通常以关注的类为正类,其他类为负类,混淆矩阵表示如下: TP—将正类预测为正类数 FN—
算法的理解 Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢,就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的问题。BiKmeans只是Kmeans其中一个优化方案,其实还是有很多优化的方案,这里BiKmeans容易讲解和理解,并且容易用numpy, pandas实现。 那为什
本文目录详解SVM一、什么是SVM1. SVM定义2. 函数间隔和几何间隔(1)函数间隔(2)几何间隔3. 支持向量二、SVM求解1. 问题描述2. SVM的对偶形式(1)对偶形式(2)求解(3)KKT条件 详解SVM一、什么是SVMSVM是一种二类分类模型,与感知机不同的是,他的基本模型是定义在特征空间上的间隔最大的线性分类器。支持向量机还包括核技巧,使他成为实质上的非线性分类器。一句话总结:
转载
2024-09-26 13:29:37
73阅读
1. 常用的激活函数1.1 Sigmoid函数 Sigmoid函数的数学表达形式为:,它接受一个实数并将其压缩到0-1的范围内,其中大的负数将会变成0,而大的正数将会变成1。在历史上,sigmoid函数被经常使用到,因为它对神经元的激活有很好的解释性:从完全未激活的状态0,到完全饱和的激活状态1。实际上,
转载
2024-09-10 06:42:20
518阅读
目录 二分类:多分类:一、什么是多类分类?二、如何处理多类分类?三、代码实践:评估指标:混淆矩阵,accuracy,precision,f1-score,AUC,ROC,P-R(不能用)1.混淆矩阵:2. accuracy,precision,reacall,f1-score:3. ROC图和AUC值:4 . 多类分类问题不能用P-R曲线 5.其他评分函数 : score&nb
转载
2024-08-27 21:50:52
66阅读
前言LeNet-AlexNet-ZFNet: LeNet-AlexNet-ZFNet一二维复现pytorch VGG: VGG一二维复现pytorch GoogLeNet: GoogLeNet一二维复现pytorch ResNet: ResNet残差网络一二维复现pytorch-含残差块复现思路分析 DenseNet: DenseNet一二维复现pytorch Squeeze: SqueezeNe
转载
2024-08-21 10:30:02
24阅读
。前面介绍了很多二分类资料的模型评价内容,用到了很多R包,虽然达到了目的,但是内容太多了,不太容易记住。今天给大家介绍一个很厉害的R包:tidymodels,一个R包搞定二分类资料的模型评价和比较。一看这个名字就知道,和tidyverse系列师出同门,包的作者是大佬Max Kuhn,大佬的上一个作品是caret,现在加盟rstudio了,开发了新的机器学习R包,也就是今天要介绍的tidymodel
转载
2024-03-13 11:30:28
100阅读
在文章NLP(二十)利用BERT实现文本二分类中,笔者介绍了如何使用BERT来实现文本二分类功能,以判别是否属于出访类事件为例子。但是呢,利用BERT在做模型预测的时候存在预测时间较长的问题。因此,我们考虑用新出来的预训练模型来加快模型预测速度。 本文将介绍如何利用ALBERT来实现文本二分类。关于ALBERT ALBERT的提出时间大约是在2019年10月,其第一作者为谷歌科学家蓝振忠
很算法在原理推导上都是假设样本是二分类的,比如SVM、Adaboost等,整个推导过程以至结论都是相对二分类的,根本没有考虑多分类,如果你想直接将SVM直接应用在多分类上是不可能的,除非你在从原理上去考虑多分类的情况,然后得到一个一般的公式,最后在用程序实现这样才可以。通常情况是将多分类转化为二分类问题。 那么多分类问题怎么转化为二分类问题?很简单,一个简单的思想就是分主次,采取投票机制。
逻辑回归基本概念 前面提到过线性模型也可以用来做分类任务,但线性模型的预测输出 y = wx + b 可能是(-∞,+∞)范围内的任意实数,而二分类任务的输出y={0,1},如何在这之间做转换呢?答案就是找一个单调可微函数将分类任务输出y和线性回归模型联系起来,对数几率函数(Sigmoid函数)可以很好地胜任这个工作,函数图形如下,预测值z大于零判
转载
2024-03-29 06:47:34
195阅读
说到softmax和sigmoid二者差别,就得说说二者分别都是什么。其实很简单,网上有数以千计的优质博文去给你讲明白,我只想用我的理解来简单阐述一下:sigmoid函数针对两点分布提出。神经网络的输出经过它的转换,可以将数值压缩到(0,1)之间,得到的结果可以理解成“分类成目标类别的概率P”。而不分类到该类别的概率,就是(1 - P),这也是典型的两点分布的形式;softmax本身针对多项分布提
转载
2023-06-21 22:32:10
830阅读
本文将介绍如何使用pytorch和resnet18模型,实现图片二分类网络微调(Fine Tune)的全过程。首先,我们将介绍pytorch的基本概念,包括tensor、autograd、nn.Module以及optimizer。然后,我们将介绍resnet50模型的结构,以及如何使用pytorch的nn.Module模块来定义模型。接下来,我们将介绍如何使用pytorch的nn.Module模块
转载
2023-07-17 18:11:29
212阅读
形式1:输出为单通道即网络的输出 output 为 [batch_size, 1, height, width] 形状。其中 batch_szie 为批量大小,1 表示输出一个通道,height 和 width 与输入图像的高和宽保持一致。在训练时,输出通道数是 1,网络得到的 output 包含的数值是任意的数。给定的 target ,是一个单通道标签图,数值只有 0 和 1 这两种。为了让网络
转载
2023-09-22 12:24:04
116阅读
跑一个简短的程序from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation
from tensorflow.keras import optimizers
import numpy as np
imp
转载
2024-03-16 00:59:41
158阅读
本文章参考deeplearning 一书第六章6.2.2.2 Sigmoid Units for Bernoulli Output Distributions 要建立一个模型,不可或缺的有:1、数据,2、损失函数,3、模型算法,4、优化算法。今天我们讨论下损失函数这块。损失函数的设计,与模型最后输出的内容是有一定关联的。所以我们今天讨论二分类问题的损失函数时,主要
文章目录源码下载分类网络的常见形式分类网络介绍1、VGG16网络介绍2、MobilenetV2网络介绍3、ResNet50网络介绍a、什么是残差网络b、什么是ResNet50模型分类网络的训练1、LOSS介绍2、利用分类网络进行训练a、数据集的准备b、数据集的处理c、开始网络训练总结 源码下载https://github.com/bubbliiiing/classification-pytorc
转载
2024-02-02 14:18:05
153阅读
数据集我们将使用狗与猫数据集(有免费许可证),你可以在以下链接中找到:https://www.kaggle.com/datasets/biaiscience/dogs-vs-cats。这些数据集可以免费使用。我将向你展示如何创建一个模型来解决这个二分类任务,以及使用它对新图像进行推理。下载此数据集的第一件事是使用凭据访问Kaggle,然后下载Kaggle。你可以通过单击“创建新API token”
转载
2024-08-16 22:30:11
51阅读