用到一两个image caption任务的模型,模型中没有给出性能评估的方法,于是在github上找到了一个能够评估image caption的模型,该模型能够帮助计算常见的评价指标的结果,包括Bleu1Bleu2Bleu3Bleu4METEORROUGE_LCIDErSkipThoughtsCosineSimilarityEmbeddingAverageCosineSimilarityVectorExtremaCosineSimilarityGreedyMatchingScore
github地址:点击链接

依照github上的要求一步步安装后,在nlg-eval-master根目录上导入result.txt(生成的caption),caption1.txt(caption的标准结果1),caption2.txt(caption的标准结果2),caption3.txt(caption的标准结果3),caption4.txt(caption的标准结果4),caption5.txt(caption的标准结果5),并创建文件evaluation.py

import nlgeval
res=nlgeval.compute_metrics(hypothesis='./result.txt',
                   references=['./caption1.txt','./caption2.txt','./caption3.txt','./caption4.txt','./caption5.txt'])
print(res)

就会得到各评价指标的结果。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐