读“放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较”的笔记NLP的特征- 输入是个一维线性序列
- 输入不定长
- 单词相对位置
- 相距较远的单词特征需要联合背景,RNN的流行 NLP的输入往往是个不定长的线性序列句子,而RNN本身结构就是个可以接纳不定长输入的由前向后进行信息线性传导的网络结构,而在LSTM引入三个门后,对于捕获长距离特征也是非            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-09 06:29:06
                            
                                21阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
                   与前馈神经网络、卷积神经网络等不同之处在于,RNN具有一定的记忆暂存功能,模拟了大脑的记忆性。具体来说,就是把之前的输入产生的影响量化后与当前输入一起传递到网络中训练。因此,RNN可以有效解决上下文相关场景下的问题,如自然语言处理等等。       RNN示意图及时间维度上的展开图如下: &nb            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-06 10:47:20
                            
                                28阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、Seq2Seq 模型1. 简介Sequence-to-sequence (seq2seq) 模型,顾名思义,其输入是一个序列,输出也是一个序列,例如输入是英文句子,输出则是翻译的中文。seq2seq 可以用在很多方面:机器翻译、QA 系统、文档摘要生成、Image Captioning (图片描述生成器)。2. 基本框架第一种结构[参考1]论文            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-24 11:28:38
                            
                                27阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            循环神经网络RNN,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅这次的输入x,还包括上一时刻隐藏层h。RNN公式:——>,。一、tensor表示输入x:[input_num,batch,feacture_num] 特征xt:[batch,feacture_num] 上            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-20 09:54:45
                            
                                99阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            前言:针对之前n-gram等具有fixed-window size的模型的缺点,例如无法处理任意长度的输入、不具有记忆性等,提出了一个新的模型:循环神经网络(RNN)。下对其做简要介绍:RNN:RNN的特点是有多少输入就有多少对应的激活值。可以看成输入是在时间上有先后的,每一次输入是一个时间步,每一个时间步产生激活值,也可能产生预测值(根据需要)。 RNN的不同点是,它不是仅用本时间步的输入值来预            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-17 13:22:49
                            
                                40阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            循环神经网络 RNN(recurrent neural network)特点:RNN对具有序列特性的数据非常有效 能挖掘数据中的时许信息及语义信息      序列特性:符合时间顺序、逻辑顺序或其他顺序的。如:人的语言、语音、股票结构: 如果先不看W,展开,图就变成了 全连接神经网络结构:X是某个字或词的特征向量,作为输入层。上图是三维向量U是输入层到隐藏层的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-14 16:42:48
                            
                                57阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            我想在这边篇文章浅入浅出的谈谈这几个方面,当然深度学习你所要了解必然不仅仅如此,后面如果有机会我会一篇篇的完善:CNN/RNN理解Attention理解深度学习(CNN和RNN)传统领域的简单应用关于深度学习的一些想法大概会将全文分为以上几块,大家可以跳读,因为本文理论上应该会冗长无比,肯定也包括数据块+代码块+解析块,很多有基础的同学没有必要从头在了解一遍。好了,让我们正式开始。CNN/RNN理            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-08 22:12:50
                            
                                38阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            都是从其他文章看到的,自己总结归纳一下,只是作为复习用,图片很多很多。RNN循环神经网络,是用来处理一些序列问题,翻译,曲线预测之类的,当然发展到现在,网络都是加夹在一起用的。基本结构是这样的: xt表示当前输入,h(t-1)为上一个的输出,h(t)是输出,h0需要自己初始化的,w表示权重,从表达式就可以看出当前的输出与之前的输出是由一定的关系。如何训练的?和CNN差不多,都是利用BP来            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-01 21:03:36
                            
                                89阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1 从单层网络谈起在学习RNN之前,首先要了解一下最基本的单层网络,它的结构如图:输入是x,经过变换Wx+b和激活函数f得到输出y。2 经典的RNN结构(N vs N)在实际应用中,我们还会遇到很多序列形的数据:如:自然语言处理问题。x1可以看做是第一个单词,x2可以看做是第二个单词,依次类推。语音处理。此时,x1、x2、x3……是每帧的声音信号。时间序列问题。例如每天的股票价格等等。序列形的数据            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-07 19:57:37
                            
                                27阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            RNN基本结构解读1. RNN的多种结构1.1 单层网络结构1.2 经典RNN网络结构1.3 其它RNN结构2. Encoder-Decoder2.1 Encoder-Decoder的基本结构2.2 Encoder-Decoder应用范围:2.3 Encoder-Decoder 缺点3. LSTM3.1 LSTM基本结构参考:  在计算机视觉领域,最常用的网络结构就是CNN卷积神经网络。但是在现            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-08 14:06:45
                            
                                15阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            RNN及其变体RNN为什么需要RNN?这里以Hung-yi Lee给出的例子为例当TaiPei前的单词不同时,TaiPei所表示的含义是不同的。如果用一般的neural network来训练,是实现不了这个任务的,因为在一般的feed forward网络中,相同的input会得到相同的output。因此,我们需要一种能够处理序列信息的神经网络,而RNN(Recurrent Neural Netwo            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-19 08:19:47
                            
                                58阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            上期我们一起学习了静态RNN和动态RNN的区别,深度学习算法(第16期)----静态RNN和动态RNN我们知道之前学过的CNN的输入输出都是固定长度,今天我们一起学习下RNN是怎么处理变化长度的输入输出的?1. 处理变化长度的输入到目前为止,我们已经知道在RNN中怎么使用固定长度的输入,准确的说是两个时刻长度的输入,但是如果输入的序列是变化长度的呢?比如一个句子。这种情况下,当我们调用dynami            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-12 13:17:26
                            
                                81阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            RNNRNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络。首先我们要明确什么是序列数据,摘取百度百科词条:时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。这是时间序列数据的定义,当然这里也可以不是时间,比如文字序列,但总归序列数据有一个特点——后面的数据跟前面的数据有关系。RNN它并非刚性地记忆所有固定长度的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-25 21:35:27
                            
                                243阅读
                            
                                                                             
                 
                
                             
         
            
            
            
              在此之前,我们已经学习了前馈网络的两种结构——DNN和CNN,这两种结构有一个特点,就是假设输入是一个独立的没有上下文联系的单位,比如输入是一张图片,网络识别是狗还是猫。但是对于一些有明显的上下文特征的序列化输入,比如预测视频中下一帧的播放内容,那么很明显这样的输出必须依赖以前的输入, 也就是说网络必须拥有一定的”记忆能力”。为了赋予网络这样的记忆力,一种特殊结构的神经网络——递归神经网络(R            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-04 13:27:30
                            
                                88阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、 tf.nn.dynamic_rnn的输出
 tf.nn.dynamic_rnn的输入参数如下tf.nn.dynamic_rnn(
     cell,
     inputs,
     sequence_length=None,
     initial_state=None,
     dtype=None,
     parallel_iterations=None,
     swa            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-06 11:01:17
                            
                                54阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            RNN之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。 RNN的应用领域有很多, 可以说只要考虑时间先后顺序的问题都可以使用RNN来解决.这里主要说一下几个常见的应用领域:自然语言处理(NLP): 主要有视频处            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-13 22:17:40
                            
                                31阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            RNN循环神经网络的直观理解:基于TensorFlow的简单RNN例子RNN 直观理解一个非常棒的RNN入门Anyone Can learn To Code LSTM-RNN in Python(Part 1: RNN)
基于此文章,本文给出我自己的一些愚见基于此文章,给出其中代码的TensorFlow的实现版本。完整代码请看这里
RNN的结构如果从网上搜索关于RNN的结构图,大概可以下面的结构图            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-21 08:50:26
                            
                                29阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            从哪里开始研究卷积神经网络也有一段时间了,因为其相对简单易学,实现也容易,所以偷懒就没有去深究其他的网络类型,但是处理一个语音信号处理相关的任务,循环神经网络有优势,那就是对过去(未来)状态的记忆,正如人脑思考的上下文一样,RNN能联系起来时间序列的记忆,以及由过去对未来的期许,最终目的是准确滴解决当下的问题参考Understanding LSTM NetworksRNN详解(Recurrent            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-27 07:15:06
                            
                                23阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、引入attention机制就有点像人们找重点,看图片的时候抓住图片上的主体,看文章的时候看中心句。我们对图片上的不同位置,文章中不同部分所投放的attention是不一致的。机器也是会“遗忘”的,比如传统的机器翻译基本都是基于Seq2Seq模型,模型分为encoder层与decoder层,并均为RNN或RNN的变体构成,如下图所示:可以看到,在encoding阶段,下一个节点的输入是上一个节点            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-22 14:24:31
                            
                                34阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.1 认识RNN模型什么是RNN模型RNN(Recurrent Neural Network), 中文称作循环神经网络, 它一般以序列数据为输入, 通过网络内部的结构设计有效捕捉序列之间的关系特征, 一般也是以序列形式进行输出.一般单层神经网络结构:RNN单层网络结构:以时间步对RNN进行展开后的单层网络结构:RNN的循环机制使模型隐层上一时间步产生的结果, 能够作为当下时间步输入的一部分(当下            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-16 03:33:07
                            
                                35阅读