本站原创文章,转载请说明来自《老饼讲解-深度学习》www.bbbdata.com
Encoder-Decoder模型是解决Seq2Seq问题的一种常用模型
本文讲解Encoder-Decoder模型是什么,以及如何将RNN与Encoder-Decoder模型结合来解决Seq2Seq问题
本节介绍Encoder-Decoder模型以及RNN-Encoder-Decoder模型是什么
Encoder-Decoder模型介绍
Encoder-Decoder模型与其说是一种模型,不如说是一种方法,或者一种模型结构
Encoder-Decoder模型的主体如下所示:
它把模型拆成了两部分构成:编码器与解码器
👉1. 第一部分先用一个模型(称为编码器)把输入x压缩成一个信息(称为编码信息c)
👉2. 第二部分用另外一个模型(称为解码器)通过编码信息c预测出目标y
总的来说,就是引入c来作为X与y之间的桥梁
Encoder-Decoder模型具体的细节,还得看具体问题具体实现,
只要应用了如上形式或思想的,都可以称为Encoder-Decoder模型
RNN-Encoder-Decoder模型
RNN-Encoder-Decoder模型用来做什么
RNN-Encoder-Decoder模型就是将Encoder-Decoder应用到了RNN上,它主要用于解决seq2seq问题,
seq2seq问题也就是"输入一个长为n的序列,输出一个长为m的序列"这类型"输出输出都为不定长"的序列预测问题
翻译问题就是一个典型的seq2seq问题,例如输入"真好吃",输出"It's really delicious",它的输入与输出的长度都是任意的
RNN-Encoder-Decoder模型
Decoder-Encoder(RNN)的主要思路如下:
上图只是一种思路的描述,不能直接作为具体的模型,具体的Decoder-Encoder(RNN)模型请看后续文章的例子
End