RNN-循环神经网络

【介绍】RNN与Encoder-Decoder模型

作者 : 老饼 发表日期 : 2023-07-28 10:50:18 更新日期 : 2024-04-28 14:59:23
本站原创文章,转载请说明来自《老饼讲解-深度学习》www.bbbdata.com



Encoder-Decoder模型是解决Seq2Seq问题的一种常用模型

本文讲解Encoder-Decoder模型是什么,以及如何将RNN与Encoder-Decoder模型结合来解决Seq2Seq问题




   01.RNN-Encoder-Decoder模型是什么    




本节介绍Encoder-Decoder模型以及RNN-Encoder-Decoder模型是什么




       Encoder-Decoder模型介绍     


Encoder-Decoder模型与其说是一种模型,不如说是一种方法,或者一种模型结构
 Encoder-Decoder模型的主体如下所示:
      
 它把模型拆成了两部分构成:编码器与解码器
  👉1. 第一部分先用一个模型(称为编码器)把输入x压缩成一个信息(称为编码信息c) 
👉2. 第二部分用另外一个模型(称为解码器)通过编码信息c预测出目标y              
 总的来说,就是引入c来作为X与y之间的桥梁
Encoder-Decoder模型具体的细节,还得看具体问题具体实现,
只要应用了如上形式或思想的,都可以称为Encoder-Decoder模型





      RNN-Encoder-Decoder模型     


RNN-Encoder-Decoder模型用来做什么
RNN-Encoder-Decoder模型就是将Encoder-Decoder应用到了RNN上,它主要用于解决seq2seq问题,
seq2seq问题也就是"输入一个长为n的序列,输出一个长为m的序列"这类型"输出输出都为不定长"的序列预测问题
 翻译问题就是一个典型的seq2seq问题,例如输入"真好吃",输出"It's really delicious",它的输入与输出的长度都是任意的
RNN-Encoder-Decoder模型
Decoder-Encoder(RNN)的主要思路如下:
   
 上图只是一种思路的描述,不能直接作为具体的模型,具体的Decoder-Encoder(RNN)模型请看后续文章的例子











 End 






联系老饼