欢迎来到《每周NLP论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。
生成式聊天机器人是研究的热点,现在看来,通过端到端的方式,构建一个可靠又可控的聊天机器人还是没有太多方法。本篇我们来看看,聊天机器人的研究者们在这方面都做了哪些努力。
作者 | 小Dream哥
编辑 | 言有三
1 早期开创性的工作
这是第一篇将SMT引入聊天机器人中实现答案生成的论文,具有开创性的意义。
文章引用量:140+
推荐指数:✦✦✦✦✧
[1] Ritter A , Cherry C , Dolan W B . Data-Driven Response Generation in Social Media[C]// Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing, EMNLP 2011, 27-31 July 2011, John McIntyre Conference Centre, Edinburgh, UK, A meeting of SIGDAT, a Special Interest Group of the ACL. Association for Computational Linguistics, 2011.
2 RNN based
这是早期用RNN网络实现端到端的聊天机器人研究的一篇典型论文。
文章引用量:180+
推荐指数:✦✦✦✦✧
[2] Sordoni A , Galley M , Auli M , et al. A Neural Network Approach to Context-Sensitive Generation of Conversational Responses[J]. Transactions of the Royal Society of Tropical Medicine & Hygiene, 2015, 51(6):502-504.
3 LSTM based
随着NLP的发展,end-to-end的聊天机器人研究均开始引入LSTM作为特征抽取器,这是典型的一篇。
文章引用量:130+
推荐指数:✦✦✦✦✦
[3] Li J , Galley M , Brockett C , et al. A Diversity-Promoting Objective Function for Neural Conversation Models[J]. Computer Science, 2015.
4 HRED Model
LSTM能够提出长度约为500的句子的特征,但是机器人生成答案常常需要参考更长的对话历史和语境。因此,HRED模型得以引入。
文章引用量:58
推荐指数:✦✦✦✦✦
[4] Sordoni A , Bengio Y , Vahabi H , et al. A Hierarchical Recurrent Encoder-Decoder For Generative Context-Aware Query Suggestion[J]. Computer Science, 2015.
5 Attention Model
在是输入较长时以上的机制都比较无力,为了提升答案生成能力,Attention机制开始被引入。
文章引用量:较少
推荐指数:✦✦✦✦✦
[5] Shao L , Gouws S , Britz D , et al. Generating High-Quality and Informative Conversation Responses with Sequence-to-Sequence Models[J]. 2017.
6 如何获取文章与交流
找到有三AI开源项目即可获取。
https://github.com/longpeng2008/yousan.ai