seq2seq 做翻译,训练时 最终feed的数据的样子(接上文)_java


50是“但”

76是“等了”

58是 “五年”

之所以有多个50 50 50 50是因为batchsize比数据量大

seq2seq 做翻译,训练时 最终feed的数据的样子(接上文)_java_02


1是开始

2是句子结束

可见 竖列 前四个也是一样的

76是 “but”

64是 “waited”

100是 “5”

5是 “years”

seq2seq 做翻译,训练时 最终feed的数据的样子(接上文)_java_03


可见00-09的前4竖列是1,对应decoder_inputs的长度