LawsonAbs的认知与思考,还请各位读者批判阅读。
总结
- 详细代码可以在我的GitHub中查看
1. 余弦相似度
在pytorch中,有一个专门的函数用于计算相似度:torch.cosine_similarity()
,下面看看cosine_similarity
的使用方法。
参考文档
相似度的概念是:求向量的相似度。但是官方文档竟然给出的是求矩阵的相似度。这么做的原因是,让大家学习到这个参数dim,表示对矩阵的哪个维度求相似,该值默认为1。下面我以一个较小的矩阵来分析:
2. 常见报错
IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
如果我们直接使用F.cosine_similarity()
方法计算两个一维向量计算相似度,那么就会得到这种错误。示例如下:
这是一种维度错误,主要原因是==cosine_similarity()这个方法计算相似度时的维度默认是dim=1,所以就导致对于一个向量计算错误。==有两种方法可以解决这个问题:
- 如注释,将tensor添加一个维度,那么就得到了最后的可以正确结果。
- 或者在调用
cosine_similarity()
的时候使用dim=0
这个参数,如下所示: