余弦相似度是衡量两个向量之间相似程度的一种常用方法,特别在机器学习领域中,它经常被用于比较两个向量之间的相似性。在PyTorch中,计算余弦相似度非常简便,本文将介绍如何在PyTorch中使用余弦相似度

什么是余弦相似度?

余弦相似度是通过测量两个非零向量之间的夹角余弦值来评估它们的相似性的一种方法。计算公式如下:

Pytorch中计算余弦相似度

PyTorch提供了一个方便的函数 torch.nn.functional.cosine_similarity 用于计算余弦相似度。下面是一个简单的例子:

import torch
import torch.nn.functional as F

# 定义两个向量
A = torch.tensor([1.0, 2.0, 3.0])
B = torch.tensor([4.0, 5.0, 6.0])

# 计算余弦相似度
cosine_sim = F.cosine_similarity(A, B, dim=0)

print("余弦相似度:", cosine_sim.item())

在上面的例子中,dim=0 表示沿着第一个维度(即向量的维度)计算余弦相似度。

若是计算两个维度不同的张量,比如维度分别为[B1, C]和[B2, C]的两个张量,希望得到[B1, B2]维度的结果,则可以如下操作:

import torch
import torch.nn.functional as F

features_a = torch.rand((4, 64))
features_b = torch.rand((5, 64))
similarity_matrix = F.cosine_similarity(features_a.unsqueeze(1),
                                        features_b.unsqueeze(0), dim=2)

print(similarity_matrix.shape)

输出结果为:

torch.Size([4, 5])

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐