第7章 循环神经网络部分彩图 图7.1 贝勒医学院的研究成果(Jiang et al., 2015) 图7.3 RNN的不同结构(Alom et at., 2018) 图7.7 翻译任务举例 图7.9 按时间序列展开的LSTM单元格(Olah, 2015) 图7.14 3种不同门的初始化方法得到的train loss 和vali loss对比(Y Jango, 2017) 图7.15 不同遗忘门初始值对结果的影响(Y Jango, 2017 图7.16 在输入门和输出门的权重添加L2正则化的结果(Y Jango, 2017) 图7.24 ACT的主要想法(Olah, Carter, 2016) 图7.36 不同的数据集和变量模型的测试结果(Greff et al., 2017) 图7.50 四种模型在英法翻译和法英翻译任务上,句子长度对BLEU值的影响结果(He et al., 2016) 图7.63 由人类评估的结果(Vinyals et al., 2015) 图7.64 模型的解释,(a)显示用于培训的完整模型。(b)和(c)分别展示了从视觉特征生成句子和从句子中生成视觉特征所需要的模型部分(Chen, Lawrence, 2015) 图7.65 MS COCO数据集上的句子生成的定性结果(Chen, Lawrence, 2015) 图7.67 使用CTC的在线手写识别(Liwicki et al., 2007)