PyTorch中余弦相似度计算及应用

余弦相似度是衡量两个向量之间相似程度的一种常用方法，特别在机器学习领域中，它经常被用于比较两个向量之间的相似性。在PyTorch中，计算余弦相似度非常简便，本文将介绍如何在PyTorch中使用余弦相似度

qq_38100666

1528人浏览 · 2023-11-11 00:09:45

qq_38100666 · 2023-11-11 00:09:45 发布

什么是余弦相似度？

余弦相似度是通过测量两个非零向量之间的夹角余弦值来评估它们的相似性的一种方法。计算公式如下：

Pytorch中计算余弦相似度

PyTorch提供了一个方便的函数 torch.nn.functional.cosine_similarity 用于计算余弦相似度。下面是一个简单的例子：

import torch
import torch.nn.functional as F

# 定义两个向量
A = torch.tensor([1.0, 2.0, 3.0])
B = torch.tensor([4.0, 5.0, 6.0])

# 计算余弦相似度
cosine_sim = F.cosine_similarity(A, B, dim=0)

print("余弦相似度:", cosine_sim.item())

在上面的例子中，dim=0 表示沿着第一个维度（即向量的维度）计算余弦相似度。

若是计算两个维度不同的张量，比如维度分别为[B1, C]和[B2, C]的两个张量，希望得到[B1, B2]维度的结果，则可以如下操作：

import torch
import torch.nn.functional as F

features_a = torch.rand((4, 64))
features_b = torch.rand((5, 64))
similarity_matrix = F.cosine_similarity(features_a.unsqueeze(1),
                                        features_b.unsqueeze(0), dim=2)

print(similarity_matrix.shape)

输出结果为：