引言:
这是一个教程,目的是对机器翻译的基础知识和建模方法进行较为系统的介绍,并在此基础上对机器翻译的一些前沿技术展开讨论(前身为《机器翻译:统计建模与深度学习方法》)。其内容被编纂成书,可以供计算机、人工智能相关专业高年级本科生及研究生学习之用,亦可作为自然语言处理,特别是机器翻译相关研究人员的参考资料。本书用tex编写,所有源代码均已开放。
本书共分为四个部分,每部分由若干章节组成,章节的顺序参考了机器翻译技术发展的时间脉络,同时兼顾了机器翻译知识体系的内在逻辑。
作者:肖桐 (Tong Xiao) 朱靖波 (Jingbo Zhu)
单位:东北大学自然语言处理实验室 (NEUNLPLab) / 小牛翻译 (NiuTrans Research)
顾问:姚天顺 (Tianshun Yao) 王宝库 (Baoku Wang)
内容:
Part I 机器翻译基础
- 机器翻译简介
- 统计语言建模基础
- 词法分析和语法分析基础
- 翻译质量评价
Part II 统计机器翻译
- 基于词的机器翻译建模
- 基于扭曲度和繁衍率的模型
- 基于短语的模型
- 基于句法的模型
Part III 神经机器翻译
- 人工神经网络和神经语言建模
- 基于循环神经网络的模型
- 基于卷积神经网络的模型
- 基于自注意力的模型
- 12.1 自注意力机制
- 12.2 Transformer 架构
- 12.3 位置编码
- 12.4 基于点乘的多头注意力机制
- 12.5 残差网络和层标准化
- 12.6 前馈全连接网络子层
- 12.7 训练
- 12.8 推断
- 12.9 小结及拓展阅读
Part IV 机器翻译前沿
- 神经机器翻译模型训练
- 神经机器翻译模型推断
- 神经机器翻译结构优化
- 低资源神经机器翻译
- 多模态、多层次机器翻译
- 机器翻译应用技术
Part V 附录