欢迎来到《每周NLP论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。

生成式聊天机器人是研究的热点,现在看来,通过端到端的方式,构建一个可靠又可控的聊天机器人还是没有太多方法。本篇我们来看看,聊天机器人的研究者们在这方面都做了哪些努力。

作者 | 小Dream哥

编辑 | 言有三


1 早期开创性的工作 


这是第一篇将SMT引入聊天机器人中实现答案生成的论文,具有开创性的意义。

文章引用量:140+

推荐指数:✦✦✦✦✧



【每周NLP论文推荐】 生成式聊天机器人论文介绍_sed


[1] Ritter A , Cherry C , Dolan W B . Data-Driven Response Generation in Social Media[C]// Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing, EMNLP 2011, 27-31 July 2011, John McIntyre Conference Centre, Edinburgh, UK, A meeting of SIGDAT, a Special Interest Group of the ACL. Association for Computational Linguistics, 2011.


2 RNN based 


这是早期用RNN网络实现端到端的聊天机器人研究的一篇典型论文。

文章引用量:180+

推荐指数:✦✦✦✦✧



【每周NLP论文推荐】 生成式聊天机器人论文介绍_生成式_02



[2] Sordoni A , Galley M , Auli M , et al. A Neural Network Approach to Context-Sensitive Generation of Conversational Responses[J]. Transactions of the Royal Society of Tropical Medicine & Hygiene, 2015, 51(6):502-504.


3 LSTM based


随着NLP的发展,end-to-end的聊天机器人研究均开始引入LSTM作为特征抽取器,这是典型的一篇。

文章引用量:130+

推荐指数:✦✦✦✦✦



【每周NLP论文推荐】 生成式聊天机器人论文介绍_生成式_03


[3] Li J , Galley M , Brockett C , et al. A Diversity-Promoting Objective Function for Neural Conversation Models[J]. Computer Science, 2015.


4 HRED Model


LSTM能够提出长度约为500的句子的特征,但是机器人生成答案常常需要参考更长的对话历史和语境。因此,HRED模型得以引入。

文章引用量:58

推荐指数:✦✦✦✦✦



【每周NLP论文推荐】 生成式聊天机器人论文介绍_生成式_04


[4] Sordoni A , Bengio Y , Vahabi H , et al. A Hierarchical Recurrent Encoder-Decoder For Generative Context-Aware Query Suggestion[J]. Computer Science, 2015.


5 Attention Model


在是输入较长时以上的机制都比较无力,为了提升答案生成能力,Attention机制开始被引入。

文章引用量:较少

推荐指数:✦✦✦✦✦



【每周NLP论文推荐】 生成式聊天机器人论文介绍_sed_05


[5] Shao L , Gouws S , Britz D , et al. Generating High-Quality and Informative Conversation Responses with Sequence-to-Sequence Models[J]. 2017.


6 如何获取文章与交流


找到有三AI开源项目即可获取。


​https://github.com/longpeng2008/yousan.ai​



【每周NLP论文推荐】 生成式聊天机器人论文介绍_聊天机器人_06