Generic Intent Representation in Web Search

本文提出GEneric iNtent Encoder (GEN Encoder),为用户搜索意图训练一个向量表示,
使用大规模必应搜索的用户点击日志作为用户意图的弱监督
GEN Encoder 端对端的 训练将 查询和点击信息 映射到相似向量,之后再在多个任务finetune,
实验在 一个 查询意图相似性 数据集 显示高于之前的 向量表示方法,
独立实验显示,训练能学到 用户隐式反馈信息 来表示用户意图,
我们也说明GEN Encoder缓解了长尾搜索问题的稀疏性,以及 用近似最近邻搜索 减少了一半的 不可见查询,
最后,我们说明GEN Encoder产出的向量能反映很多搜索行为。