训练数据中

prompt1 response1
prompt1 response2

考虑这两个response,在更多训练数据中,可能会对应其他的prompt:

prompt3 response1
prompt4 response2

所以对prompt-response-pair去重,不会造成分类问题里的(存在一个输入对应两个类的)歧义问题