这几年深度学习快速发展,在图像识别、语音识别、物体识别等各种场景上取得了巨大的成功,例如AlphaGo击败世界围棋冠军,iPhone X内置了人脸识别解锁功能等等,很多AI产品在世界上引起了很大的轰动。在这场深度学习革命中,卷积神经网络(Convolutional Neural Networks,简称CNN)是推动这一切爆发的主力,在目前人工智能的发展中有着非常重要的地位。【问题来了】那什么是            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-01 09:19:04
                            
                                50阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            +创新点:将整张图片作为网络的输入,直接在输出层对BBox的位置和类别进行回归。简介YOLO意思是You Only Look Once,创造性的将候选区和对象识别这两个阶段合二为一,属于one-stage的检测模型。整体上来说,首先将图片resize到448×448,送入到CNN网络之后,经过进一步预测得到检测的结果。YOLO是用了一个单独的CNN模型来实现了end2end的检测,它是一个统一的框            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-09 12:26:10
                            
                                107阅读
                            
                                                                             
                 
                
                             
         
            
            
            
             目录简介FCN的提出背景核心思想FCN网络原文的网络结构直观的网络结构卷积部分skip部分网络训练第一阶段第二阶段第三阶段第四阶段小结 简介FCN的全称是Fully Convolutional Network,出自2015年Jonathan Long等人的《Fully Convolutional Networks for Semantic Segmentation》,FCN的提出可以说是图像分割            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-27 18:16:34
                            
                                70阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
             循环神经网络(RNN, Recurrent Neural Networks)介绍   循环神经网络(Recurrent Neural Networks,RNNs)已经在众多自然语言处理(Natural Language Processing, NLP)中取得了巨大成功以及广泛应用。但是,目前网上与RNNs有关的学习资料很少,因此该系列便是介绍RNNs的原理以及如何实现。主要分成以下几个部分对RN            
                
         
            
            
            
              接触TransE算法也有半年多了,从一开始的一脸懵逼到现在满脸懵逼,也算是有点收获。。。 于是,,,献丑了~  关于算法的具体实现,网上有很多,也不过多赘述,推荐几篇比较好的(不保证是原创,因为同款文章太多了。。。抄袭严重,如有知道原创的盆友,烦请告知~)TransE算法(Translating Embedding)  这篇文章以不同的作者名出现在众多平台,,,足            
                
         
            
            
            
                                                    CNN 网络标签分类 1. 语料处理与模型建立训练语料格式遵循 标签->标题->内容 ,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-10 00:46:15
                            
                                20阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
             文章目录0. 介绍1. ConvLstm1.1 Lstm1.2 ConvLstm 0. 介绍文章: Exploiting Temporality for Semi-Supervised Video Segmentation代码: https://github.com/mhashas/Exploiting-Temporality-For-Semi-Supervised-Video-Segmenta            
                
         
            
            
            
            目录论文:模型架构:模型参数:模型搭建:应用:数据集:1、公开数据集2、自己的数据集训练:1、寻找可使用的GPU2、图像预处理3、找到训练集 4、将类索引写入json文件5、加载数据集 6、定义网络、训练设备、损失函数、优化器7、训练训练结果:预测: 编辑预测结果:数据可视化:论文:2012年才出现的AlexNet,在ImageNet LSVRC-2010比赛中实现了            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-29 14:30:25
                            
                                48阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            原文作者:Matthijs Hollemans
WWDC 2017 使一件事情变得非常清楚,那就是:Apple 正在全力以赴地支持「设备上的机器学习」了。他们希望 App 的开发者们能够尽可能的简单的加入他们的行列中。Apple 去年发布了可以用于创建基本的卷积神经网的 Metal CNN 和 BNNS 框架。今年,Metal 得到了进一步扩展,增加了一个全新的计算机视觉框架,以及 Core ML            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-20 20:15:45
                            
                                39阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            R-CNN 原理详解 文章目录R-CNN 原理详解1. Contributions2. 流程详解2.1 总体流程2.2 提取候选区域2.3 训练CNN2.4 训练SVM3. 总结  最近开始学习物体检测的知识,就读了一下R-CNN的论文原文 Rich feature hierarchies for accurate object detection and semantic segmentatio            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-30 09:52:33
                            
                                39阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            引入和代码项目简介https://github.com/songyingxin/Bert-TextClassification模型有哪些?使用的模型有下面七个BertOrigin,BertCNN, BertLSTM, BertATT, BertRCNN, BertCNNPlus, BertDPCNN通用数据集情感分类: 采用 IMDB, SST-2, 以及 Yelp 数据集。IMDB: run_i            
                
         
            
            
            
            关于YOLOYOLO的意思是 you only look once,比起想RCNN,FAST RCNN这些two stage的方法,YOLO仅仅需要扫描一遍图像,而不需要另外再寻找ROI,感兴趣的区域。YOLOv3是2018年发明的算法,并且所发表的论文也较为简短。以下是YOLOv3的网络结构图: 上图三个蓝色方框内表示Yolov3的三个基本组件: (1)CBL:Yolov3网络结构中的最小组件,            
                
         
            
            
            
            一、相关理论   本篇博文主要讲解2014年CVPR上的经典paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation》,这篇文章的算法思想又被称之为:R-CNN(Regions with Convolutional Neural Network Feature            
                
         
            
            
            
            1.卷积层1.1对图像进行卷积操作1.1.1 图像不分通道进行卷积操作假设有一个5*5的图像,使用一个3*3的卷积核(filter)进行卷积,得到一个3*3的矩阵(其实是Feature Map,后面会讲),如下所示:上面的计算过程中,步幅(stride)为1。步幅可以设为大于1的数。例如,当步幅为2时,Feature Map计算如下:我们注意到,当步幅设置为2的时候,Feature Map就变成2            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-24 19:17:56
                            
                                331阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            学习的初期,我们就要知道,标准文档流等级森严。标签分为两种等级:行内元素块级元素 行内元素和块级元素的区别:(非常重要)行内元素:与其他行内元素并排;不能设置宽、高。默认的宽度,就是文字的宽度。块级元素:霸占一行,不能与其他任何元素并列;能接受宽、高。如果不设置宽度,那么宽度将默认变为父亲的100%。块级元素和行内元素的分类:从HTML的角度来讲,标签分为:文本级标签:p、span、a、            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-01 17:01:25
                            
                                113阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            由于比赛的原因,接触了图像文字识别,即是对输入的图片,识别其中的文字。然而对于现实世界中随机的一张图片,首先需要文字检测,即检测出图片中文字的所在文字,然后再进行文字识别,由于比赛给出的数据不用考虑文字检测部分,所以此篇文章主要介绍文字识别算法CRNN。CRNN算法思想很简单,架构模型为CNN+RNN,CNN用于提取图片的特征,然后转换成特征序列,作为RNN的序列输入,RNN网络用于预测序列,RN            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-08 10:35:17
                            
                                69阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            AlexNet:2012ImageNet Classification with Deep Convolutional Neural [paper]University of Toronto摘要:在ImageNet LSVRC-2010比赛中,训练了一个卷积神经网络对1000种类别的数据进行分类,top-1和top5的error rate 分别为37.5%和17.0%,优于之前的所有方法。使用的网            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-06 00:01:04
                            
                                14阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            在可视化训练好的mobilenet 的weights时发现有挺多的卷积核的值很小,几乎为0,这些卷积核对整个model没有贡献,所以我们通过减枝压缩技术去去除这些卷积核。以绝对值为0.0001作为阀值,减枝后(没有finetune)直接valid发现精度跟mobilenet本身的精度一模一样,说明这些滤波器对mobilenet的模型一点点的影响都没有.上图是mobilenet的valid 精度上图            
                
         
            
            
            
            初窥门径:什么叫行内元素?常见的span、a、lable、strong、b等html标签都是行内元素什么叫块级元素?常见的div、p、li、h1、h2、h3、h4等html标签都是块级元素略知一二:行内元素有:
a, span, label, strong, em, br, img, input, select,  textarea,  cite,
块级元素:
div, h1~h6, p, for            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-28 01:12:34
                            
                                48阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            vector和string迭代器支持的运算iter + n迭代器加上一个整数仍得一个迭代器,迭代器指示的新位置与原来相比向前移动了若干个元素。结果迭代器或者指示容器内的一个元素,或者指示容器尾元素的下一个位置iter - n迭代器减去一个整数仍得一个迭代器,迭代器指示的新位置与原来相比向后移动了若干个元素。结果迭代器或者指示容器内的一个元素,或者指示容器尾元素的下一个位置iter1 += n迭代器