有了一个text-match模型,给一对句子打分,给出句义一致程度,
注意:
训练数据是问题和问题,不是问题和答案,
问题和问题用lucene筛出,然后标注,然后训练,
预测的时候,也先用lucene筛出候选10-20对,然后过text-match模型打分再rank,
因为如果是问题和答案放到text-match模型里,来了一个要预测的问题,没法用lucene做答案的初筛,lucene基于词共现的。