DSSM模型可以生成item的语义向量,再推荐系统中经常再召回环节使用,很经典的一个召回模型。它的关键点:
1.用 word hashing将输入的高维向量先变换到了比较低维的向量,这种方式对于业界来说是很不错的,因为通常我们的词库或者物品集是很大的,如果我们用很高维的向量直接输入 那模型训练的压力就太大了。word hashing就是一层的线性映射
2. 使用的有监督学习方法。以推荐为例,输入特征有物品特征 用户特征 然后标签为用户下一刻点击的物品,负样本从非正样本的item随机抽取。得到用户和物品的语义向量,计算语义向量的余弦相似度,余弦相似度进行映射作为预测结果,物品是否是下一刻点击物品用0和1标识真实结果,然后损失函数二分类损失函数
3.我们通常会取模型中的语义向量出来作为物品的语义向量,用于召回任务。
论文中的模型图
推荐系统中的召回结构
这块的理解就到这里了,自己实际项目中没有用到,就不再细究DSSM模型如今其他的变种了。
参考博客: