机器学习随笔二--查准率和查全率

梦里她落

1985人浏览 · 2022-10-19 21:20:40

梦里她落 · 2022-10-19 21:20:40 发布

机器学习随笔二--查准率（precision）和查全率（recall）

一.混淆矩阵

通过真实情况和机器的预测结果，我们可以把最终得到的结果分为四类：真正例（true positive),假正例(false positive),真反例(true negative)，假反例(false negative)，TP+FN+FP+TN=样例总数

1. 真正例（true positive,TP）：预测为真，实际为真
2.假反例（false negative,FN）：预测为假，实际为真
3.假正例（false positive,FP）：预测为真，实际为假
4.真反例（true negative,TN）：预测为假，实际为假

分类结果混淆矩阵
	预测结果
真实情况	正例	反例
正例	TP（真正例）	FN（假反例）
反例	FP（假正例）	TN（真反例）

二.查准率和查全率解释

1.查准率是针对我们预测结果而言的，它表示的是预测为正的样本中多少是真正的正样本。我们可以把预测的结果分为两类，一种是正类预测为正类（TP），另一种是负类预测正类（FP）。按下图来看，预测为正的样本即selected elements（被选中的元素），其中真正的正样本是selected elements内颜色为绿色的部分。故查准率就是