用户搜 牛肉面 --- 高频下单 面馆A 面馆B 面馆C
用户搜 牛肉拉面 --- 高频下单 面馆A 面馆B 面馆D

那么可以认为 牛肉面 和 牛肉拉面 是很相似的词了

如果用文本生成模型来做
训练一个文本生成模型

输入 面馆A 面馆B,输出 牛肉面
输入 面馆A 面馆B,也输出 牛肉拉面

然后认为 牛肉面 和 牛肉拉面 互为相似词

当然用文本匹配模型做更好点