统计学中的真阳性(TP),假阴性(FN),假阳性(FP),真阴性(TN)怎么理解？

举个例子，假如要在一个地区进行1000人的核酸检测，我们站在上帝视角，知道这1000人中，有10人是新冠感染者，占比%1。但实际的检测结果可能存在误差，误差包括两种情况新冠感染者，被错误诊断为健康身体健康，但却被错误诊断为感染者检测结果如下：9名感染者得到了正确的阳性结果(TP,true positive)，1人出现假阴性(FN,false negative).其余990位健康的人中，检测除了89

papaofdoudou

12707人浏览 · 2021-10-06 21:15:13

papaofdoudou · 2021-10-06 21:15:13 发布

举个例子，假如要在一个地区进行1000人的疾病检测，我们站在上帝视角，知道这1000人中，有10人是疾病感染者，占比1%。

但实际的检测结果可能存在误差，误差包括两种情况

疾病感染者，被错误诊断为健康
身体健康，但却被错误诊断为感染者

对应了两种情况

检测出来的是阴性，就一定没有问题么?
检测出来阳性，就真的是阳性吗？

如上两种情况都属于误诊，需要用到贝叶斯公式来回答.

检测结果如下：

9名感染者得到了正确的阳性结果(TP,true positive)，1人出现假阴性(FN,false negative).
其余990位健康的人中，检测除了89为假阳性(FP,false positive).901人得到了正确的阴性结果（TN,true negative)

图形化表示是这个样子的：

列成表格表示如下：

真实情况	预测为阳性	预测为阴性	召回率
阳性患者	9人(True Positive,TP)	1人(False Negative,FN)	$\tiny \mathbf{\frac{TP}{TP+FN}=\frac{9}{9+1}}$
健康人员	89人(False Positve, FP)	901人(True Negative, TN)
准确率	$\tiny \mathbf{\frac{TP}{TP+FP}=\frac{9}{89+9}}$

分析流程如下:

根据以上的分析，我们总结如下：

TP、True Positive 真阳性：预测为正，实际也为正
FP、False Positive 假阳性：预测为正，实际为负
FN、False Negative 假阴性：预测与负、实际为正
TN、True Negative 真阴性：预测为负、实际也为负
样本总数=TP+FN+FP+TN
准确率表示的是在预测结果中，有多少是真正的阳性
召回率表示的是在所有的阳性样本中，你究竟找回来几个？猜对了多少？

TP/FP/FN/TN组合，第一个字母表示算法预测的对错，也就是是否和实际情况相符，T表示正确，F表示错误。第二个字母表示算法预测的结果，P为正例，N为负例.

以上的分析中，我们实际上是使用了被称为混淆矩阵的数学工具，混淆矩阵也被称为混淆表，是表示分类器的预测值和实际结果（标签）之间关系的，由行和列构成的表。我们用这个表更好的理解模型或分类器的实现。

除了准确率，还有一个概念叫做准确度，它描述的是测量值与真实值的接近程程度，公式是：

$\frac{TP+TN}{TP+TN+FP+FN}$ $\frac{}{}$

以上面的新冠筛查为例，准确度为：

$\frac{9+901}{9+901+89+1}=\frac{910}{1000}=91%$

既然有了准确度，是不是还可以定义一个错误度:

$\frac{FP+FN}{TP+TN+FP+FN}$

错误率度为：

$\frac{89+1}{9+901+89+1}=\frac{90}{1000}=9%$

准确率和召回率是相互影响的，理想情况下肯定是两者都高，但是一般情况下准确率高，召回率就低；召回率高，准确率就低；如果两者都低，那肯定是什么环节有问题了。

比如，在检索系统中，如果希望提高召回率，即希望更多的相关文档被检索到，就要放宽“检索策略”，便会在检索中伴随出现一些不相关的结果，从而影响到准确率。如果希望提高准确率，即希望去除检索结果中的不相关文档时，就需要严格“检索策略”，便会使一些相关文档不能被检索到，从而影响到召回率。

针对不同目的，如果是做搜索，那就是优先提高召回率，在保证召回率的情况下，提升准确率；如果做疾病监测、反垃圾，则是优先提高准确率，保准确率的条件下，提升召回率。

大样本上看，无论是病人分布还是健康人群的分布，都符合正太分布，所以，一种划分如下：

参考资料：

P-R曲线和ROC曲线理解 - 知乎

https://blog.csdn.net/tugouxp/article/details/120624088https://blog.csdn.net/tugouxp/article/details/120624088

AP和mAP的计算

（9.45+40.28+40.56+8.66+16.85+10.59+7.91+23.15+0.00+40.28）/ 10= 19.773

结束！

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

【图像加密】基于DCT变换的图像加密与解密附matlab代码

一、引言：频域扰动赋能图像隐私保护1.1 图像加密的核心需求与 DCT 变换的适配性图像传输与存储中，隐私泄露风险突出（如医疗影像、军事图像、个人隐私照片），传统加密（如 AES）直接对像素值加密，存在以下问题：计算量大，不适配实时场景（如视频流加密）；加密后图像完全杂乱，无法兼容压缩传输（如 JPEG）；硬件实现复杂，移动端部署成本高。

DAMO开发者矩阵

【路径规划】基于Bi-RRT算法实现机器人路径规划实现，最终找到一条无碰撞路径附matlab代码

这段代码是 2D 环境下的双向 RRT（Bi-RRT）路径规划实现，核心逻辑是通过两棵树（分别从起点和终点生长）快速探索构型空间，最终找到一条无碰撞路径。代码结构简洁，模块化程度高，下面从核心功能、代码解析、关键细节三方面展开说明：一、核心功能总览• 环境：2D 平面构型空间（范围 [0,0]~[100,100]），支持自定义障碍物（通过 make2Dobstacles() 创建）。