1 为什么要用 Transformer ?(创新点)1.1 问题来源最开始机器翻译使用的 seq2seq 所存在的问题:encoder 和 decoder 之间的上下文向量长度固定,但输入文本的长度是不固定的,长度不对称固定长度的上下文向量无法对长语句做有效编码,会遇到信息瓶颈,产生信息丢失的情况为了解决上述问题,基于 attention 的 seq2seq 随即被提出(这个 attention
项目背景 现在要对XXX疾病进行二分类,通常医学上称之为阴性(无XXX病),阳性(有XXX病)。对于分类任务来说,二分类是最简单的分类任务。经典的分类网络(VGG,ResNet,DenseNet等)都是在ImageNet进行1000类分类任务。因此,本项目拟采用经典网络ResNet系列网络结构进行二分类实验。基本内容数据采集:特定设备采集人体3D数据,渲染生成训练需要的各种类型的2D图片。那么应
转载
2024-04-01 11:17:39
174阅读
·在神经网络的计算中,通常先有一个叫做前向暂停(forward pause)或叫做前向传播(foward propagation)的步骤,接着有一个叫做反向暂停(backward pause) 或叫做反向传播(backward propagation)的步骤。·逻辑回归是一个用于二分类(binary classification)的算法。·一张图片在计算机中是如何表示的:为了保存一张图片,需要保存
引言经过一番折腾,我们终于配置好了Tensorflow2.0的环境,接下来通过Tensorflow来一起揭开深度学习的神秘面纱吧。实战Tensorflow分类器首先我们打开我们昨天的Hello TF工程,进入编辑界面之后,依次点击Kernel -> Restart & Clear Output,这样就可以把上一次的编译结果清除了。为了避免产生一些不必要的错误,我们尽量在每次重新打开一
转载
2024-07-26 12:58:37
54阅读
环境:OS:UbuntuCaffe环境(CUDA、OpenCV、cuDNN、...)Nvidia显卡 TITIAN X目录1.数据准备(使用自己的数据)1.1生成 所有图像数据的 每一幅图的路径 类别标签的 txt文件2.利用1中的txt文件生成 lmdb文件3.准备网络模型:网络定义文件prototxt4.准备Caffe的Solver 文件:solver.prototxt5.开始训练6.训练完成
1、model.pyimport torch.nn as nn
import torch
# 【1】定义18/34层的残差结构;这个模块不仅需要有实线残差功能,还要有虚线的功能
class BasicBlock(nn.Module):
# 18/34层的残差结构,他的第一层与第二层的卷积核的个数是一样的
expansion = 1 # 对应的残差结构主分支上所采用的卷积
转载
2024-08-29 20:09:20
50阅读
一 继往开来提出Batch Normalization 加速训练(丢弃dropout):将一批数据的feature map转化为满足均值=0,方差=1的分布提出了残差网络块(Residual):人为地让神经网络某些层跳过下一层神经元的连接,隔层相连,弱化每层之间的强联系。在这之前,神经网络都是由卷积层+池化层堆叠而成。而且我们认为这种堆叠深度越深,抽取的图像特征越高级,效果也会最佳。
实际上,随
转载
2024-04-28 12:57:17
449阅读
环境tensorflow 2.1
最好用GPUCifar10数据集CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题。任务的目标对一组32x32 RGB的图像进行分类,这个数据集涵盖了10个类别:飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船以及卡车。下面代码仅仅只是做显示Cifar10数据集用import numpy as np
import matplotlib.pyp
目录1.回忆上一讲及本讲我们要做什么2.回顾finetune是怎么训练的(finetune.py)3. 训练SVM二分类模型 (linear_svm.py)3.1 load_data3.2 custom_classifier_dataset.py 3.3 custom_batch_sampler.py3.4 hi
转载
2024-08-08 12:03:14
94阅读
这篇教程我们来实现Kaiming He大神提出的ResNet网络,并在CIFAR-10数据及上进行测试,我的测试结果完全复现了论文中的精度。本文中的参数设置、数据增强等内容均遵循原文。网络搭建ResNet原文: Deep Residual Learning for Image Recognition这篇文章中提出了像下面这样的经典残差结构,关于这种结构的解读可搜索其他文章,在此不多赘述。 后续Ka
转载
2024-07-02 21:40:30
180阅读
一.说明我的环境:Windows10系统 Pycharm tensorflow2.3.0代码目录结构:数据集按类别分开成单独的文件夹,每个文件夹下存储对应的数据集图片:各文件夹说明: 1.datasets:数据集所在位置 2.model:训练之后生成的模型所在位置 3.pretrain_model:存放着resnet50的预训练模型 4.test:单独进行预测的图片 5.predict.py:调用
转载
2024-05-03 11:51:54
30阅读
https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson8/resnet_inference.py这篇文章主要介绍了 图像分类的 inference,其中会着重介绍 ResNet。模型概览在torchvision.model中,有很多封装好的模型。 可以分类 3 类: 经典网络 alexnetvggres
零基础学Pytorch#3 | 用Pytorch实现Softmax多分类Ⅰ.笔记目标此博文就学习Pytorch具体实践做学习笔记,适用于对机器学习、深度学习有一定理论基础但实践能力薄弱的朋友。本文也着重讲解代码实践过程,不重概念的讲解。*此账号与error13为同一拥有者,此博客为error13博文的补充与更新(增加源码和详细解说)。Ⅱ.代码实操这节课老师主要讲是如何应用softmax实现多分类问
转载
2023-09-13 11:44:25
198阅读
在lifelong比赛上下载了图片数据集,目标是将不同光照下不同视角物体的分类,每张图片只含有一种类别,一共有51个类别(有刀、订书机、杯子、勺子等),所以想到了用ResNet50做图片分类,顺便学习ResNet的背后原理。论文阅读:Residual learning 部分图片展示
在ResNet之前理论上,加深神经网络层数之后,网络应该可以对更为复杂的特征进行提取,但是实验
转载
2024-06-12 12:54:02
367阅读
“ 前文我们使用libtorch实现的Resnet34网络对Cifar-10进行分类,测试集的分类准确率仅有74.95%,本文我们在前文的基础上做了一些改进,使得测试集的分类准确率达到94.15%。”深度学习这玩意儿就像炼丹一样,很多时候并不是按照纸面上的配方来炼就好了,还需要在实践中多多尝试,比如各种调节火候、调整配方、改进炼丹炉等。我们在前文的基础上,我们通过以下措施来提高Cifar
转载
2024-08-30 13:37:46
113阅读
二分类问题可能是应用最广泛的机器学习问题。在这个例子中,你将学习根据电影评论的文字内容将其划分为正面或负面。 本节使用 IMDB 数据集,它包含来自互联网电影数据库(IMDB)的 50 000 条严重两极分化的评论。数据集被分为用于训练的 25 000 条评论与用于测试的 25 000 条评论,训练集和测试集都包含 50% 的正面评论和 50% 的负面评论。1 二分类问题模型的训练二分类问题有以下
目录前言一、任务介绍二、具体实现代码框架导入包及读入数据网络模型定义模型训练三、模型改进 前言本文将尝试应用残差神经网络网络解决图片分类的问题。实践平台为Kaggle。 链接: Kaggle - 树叶分类竞赛一、任务介绍任务是预测叶子图像的类别。 该数据集包含 176 个类别,18353 张训练图像,8800 张测试图像。 每个类别至少有 50 张图像用于训练。 测试集平均分为公共和私人排行榜。
转载
2024-06-16 11:52:54
82阅读
使用Resnet-50进行图片分类1 说明2 实验目的3 任务内容4 实验原理一、ResNet-50结构介绍二、SqueezeNet1.1与ResNet-50比较5 操作步骤6 实验状况 1 说明本实验所有代码均在ubuntu 18.04 + OpenVINO 2020R3.LTS installed 环境下验证通过,若需要代码移植,请务必检查环境配置是否与本实验环境相同。2 实验目的1、了解R
转载
2024-03-18 20:14:07
266阅读
作者丨Happy 导读本文是DeepLab系列作者“Liang-Chieh Chen”大神在全景分割领域的又一力作。它在Wide-ResNet的基础上引入SE与"Switchable Atrous Convolution,SAC"两种改进,嵌入到Panoptic-DeepLab框架中并在全景分割领域取得了SOTA性能(在更快、更大模型配置方面均取得了SOTA指标)。paper: https://a
分类器性能指标之ROC曲线、AUC值一 roc曲线1、roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity)纵轴:真正类率(true p
转载
2024-07-10 14:13:02
132阅读