基于视网膜图像的青光眼人工智能检测技术

1. 引言

青光眼是一组损害视神经并导致视力丧失的眼部疾病。眼部的结构变化会引发功能改变,早期检测这些结构变化有助于青光眼的诊断。房水是眼内的一种液体,当房水流出通道堵塞时,眼内液体增多,导致眼压(IOP)升高。过高的眼压会使虹膜和角膜之间的角度变窄或闭合,损害视网膜神经节细胞(RGC),从而导致视力丧失。此外,视杯(OC)在视盘(OD)内的扩张也会引发青光眼,这会增加杯盘比(CDR)的值。

青光眼是全球导致永久性视力丧失的第二大疾病,且失明无法治愈,但早期检测可以避免。它主要分为开角型青光眼(OAG)和闭角型青光眼(ACG)等类型,其中OAG最为常见,约90%的青光眼患者受其影响,其排水角保持开放;而ACG则是由于排水通道堵塞,导致眼压突然升高。

青光眼的危险因素包括眼压升高、杯盘比增加、视野丧失和视神经头受损等,年龄增长是主要危险因素。据世界卫生组织报告,全球约有6400万人患有青光眼,到2020年,40 - 80岁的患者将达7600万,到2040年将超过1.18亿。由于训练有素的医生数量有限,自动诊断青光眼的需求日益增加。

医生通常使用多种方法检测青光眼,如前房角镜检查、检眼镜检查、眼压测量、视野检查和角膜厚度测量等。医学图像处理可以捕捉人体内部结构,有助于疾病的临床和医学分析,但图像质量差会影响疾病诊断。眼底图像是诊断青光眼的常用工具,而光学相干断层扫描(OCT)则可用于早期检测,但成本较高。计算机辅助诊断(CAD)系统可以快速准确地诊断青光眼,避免人工检测的错误和耗时问题。

2. 文献综述
2.1 可用数据集

有多个公开数据集可用于青光眼诊断,包含眼底照片和OCT图像,具体如下:
| 数据集 | 青光眼图像数量 | 健康图像数量 |
| — | — | — |
| DRISHTI - GS | 70 | 31 |
| 包含OCT和眼底图像的数据集 | 32 | 18 |
| RIM - ONE | 51 | 118 |
| ORIGA | 168 | 482 |
| G1020 | 296 | 724 |
| REFUGE | 120 | 1080 |

2.2 性能评估指标

为评估不同算法的诊断性能,常用的指标包括准确率、受试者工作特征曲线(ROC)、灵敏度、特异度、骰子相似度系数(DSC)、混淆矩阵和曲线下面积(AUC)等。具体计算公式如下:
- 准确率:$Accuracy = \frac{TP + TN}{TP + FP + TN + FN}$
- 灵敏度:$Sensitivity = \frac{Total\ No.\ of\ TruePositive}{Total\ No.\ of\ TruePositive + Total\ No.\ of\ FalseNegative}$
- 特异度:$Specificity = \frac{Total\ No.\ of\ TrueNegative}{Total\ No.\ of\ TrueNegative + Total\ No.\ of\ FalsePositive}$
- 骰子相似度系数:$DICE = \frac{2 \times TruePositive}{2 \times TruePositive + FalsePositive + FalseNegative}$

3. 传统机器学习方法检测青光眼

机器学习是人工智能的一个分支,可自动执行任务。它通过提取有意义的模式来训练算法,以识别图像中的异常区域。机器学习算法可分为监督学习、无监督学习和半监督学习。在青光眼诊断中,通常需要对手工提取的特征进行处理,如减少特征数量、归一化等,以提高模型效率。

以下是一些使用传统机器学习方法诊断青光眼的研究:
| 序号 | 作者 | 年份 | 技术 | 数据集 | 结果 |
| — | — | — | — | — | — |
| 1 | Acharya等 | 2011 | 使用纹理和高阶谱(HOS)特征,结合多种分类器 | 60张眼底图像的本地数据集 | 随机森林算法准确率达91.7% |
| 2 | Mookiah等 | 2012 | 使用离散小波变换(DWT)和高阶谱(HOS)特征,SVM分类 | 60张眼底图像的本地数据集 | 准确率95%,灵敏度93.33%,特异度96.67% |
| 3 | Yousefi等 | 2013 | 使用OCT图像的结构和功能特征,多种分类器 | 632张图像的本地数据集 | 随机森林分类器的AUROC为0.88% |
| 4 | Simonthomas等 | 2014 | 使用灰度共生矩阵(GLCM)预处理图像,Haralick纹理特征,K - 近邻(K - NN)分类器 | 60张眼底图像的本地数据集 | 准确率98% |
| 5 | Sakthivel和Narayanan | 2015 | 通过感兴趣区域(ROI)检测视盘,使用Gabor滤波器定位,Daugman和局部二值模式(LBP)提取特征,欧氏距离检测青光眼 | 44张眼底图像的本地数据集 | 灵敏度、特异度和ROC均为95.45% |
| 6 | Acharya等 | 2015 | 使用Gabor变换提取特征,PCA降维,t - 检验排序,SVM分类 | 510张眼底图像的本地数据集 | 准确率93.10%,灵敏度89.75%,特异度96.20% |
| 7 | Salam等 | 2015 | 合并颜色和纹理特征,PCA降维,SVM分类 | 50张眼底图像的本地数据集 | 灵敏度1%,特异度0.88%,准确率0.92% |
| 8 | Akram等 | 2015 | 从预处理图像中检测视盘,提取ROI和特征空间,使用多元m - 中心法分类 | 554张眼底图像的本地数据集 | 灵敏度85.72%,特异度92.91%,准确率90.84% |
| 9 | Dey和Bandyopadhyay | 2016 | 图像预处理后使用PCA提取特征,SVM分类 | 100张眼底图像的本地数据集 | 准确率86%,阳性预测准确率81.08%,灵敏度100%,特异度65%,阴性预测准确率100% |
| 10 | Singh等 | 2016 | 从分割的ROI中提取小波特征,PCA和进化属性选择降维,多种分类器 | 63张眼底图像的本地数据集 | SVM和K - NN分类器准确率94.75% |
| 11 | Kim等 | 2017 | 计算RNFL厚度和视野,t - 检验评估特征,多种分类器 | 499张图像的本地数据集 | 随机森林模型准确率0.98%,AUC 0.979%,灵敏度0.983%,特异度0.975% |
| 12 | Maheshwari等 | 2017 | 变分模态分解(VMD)分解图像,ReliefF算法提取特征,最小二乘支持向量机(LS - SVM)分类 | 488张眼底图像的本地数据集 | 三折交叉验证准确率95.19%,十折交叉验证准确率94.74% |
| 13 | Khalil等 | 2017 | 使用混合结构和文本特征,SVM分类 | 100张眼底图像的本地数据集 | 准确率100% |
| 14 | Acharya等 | 2017 | 预处理图像,提取纹理特征,SFFS技术降维,t - 检验排序,多种分类器 | 702张眼底图像的本地数据集 | K - NN分类器准确率95.7%,灵敏度96.2%,特异度93.7%,阳性预测值98.3% |
| 15 | Sengar等 | 2017 | 使用自适应阈值和几何特征分割视盘和出血区域,检测疑似青光眼 | 140张眼底图像的本地数据集 | 诊断疑似青光眼准确率93.57% |
| 16 | Christopher等 | 2018b | 使用扫频源光学相干断层扫描(SS - OCT)图像,RNFL厚度图输入无监督逻辑回归模型,PCA提取结构特征 | 179张图像的本地数据集 | AUC 0.95% |
| 17 | Kausu等 | 2018 | 使用模糊c - 均值聚类分割视盘,Otsu阈值分割视杯,2D - AADT - CWT提取特征,多种分类器 | 86张眼底图像的本地数据集 | 多层感知器(MLP)准确率97.67%,灵敏度97.1%,特异度98% |
| 18 | An等 | 2019 | 使用OCT和眼底图像,CNN训练五种输入尺度,RF组合分类 | 357张图像的本地数据集 | AUC 0.963% |
| 19 | Sharma等 | 2019 | 使用高阶统计(HOS)方法,中心切片双倒谱提取特征,LSDA降维,SVM分类 | 私有 - 公共数据集 | 本地数据集准确率98.8%,公共数据集准确率95% |
| 20 | Mohamed等 | 2019 | 使用简单线性迭代聚类(SLIC)聚合图像像素,统计像素级(SPL)方法提取特征,SVM分类超像素,测量CDR | RIM - ONE数据集 | 准确率98.6%,灵敏度92.3% |
| 21 | Gour和Khanna | 2019 | 使用对比度受限自适应直方图均衡化(CLAHE)预处理图像,提取GIST和PHOG特征,PCA选择特征,SVM分类 | DRISHTI - GS1和HRF数据集 | 准确率83.40%,AUC 0.88% |
| 22 | Bisneto等 | 2020 | 使用生成对抗网络(GAN)分割视盘,分类使用MLP、RF和SMO | DRISHTI - GS和RIM - ONE v2数据集 | 准确率100%,AUC 1%,灵敏度100%,特异度100% |

传统机器学习方法在青光眼诊断中,通常需要经过图像预处理、特征提取、特征降维、归一化和分类等步骤。常用的分类器包括支持向量机(SVM)、朴素贝叶斯(NB)、随机森林(RF)、K - 近邻(K - NN)和逻辑回归(LR)等,其中SVM使用最为频繁。然而,手工提取的特征可能无法保证诊断的最优结果。

graph LR
    A[图像] --> B[预处理]
    B --> C[特征提取]
    C --> D[特征降维]
    D --> E[归一化]
    E --> F[分类]
    F --> G[诊断结果]

这个流程图展示了传统机器学习方法在青光眼诊断中的基本流程,从图像输入开始,经过预处理、特征提取、降维、归一化,最后进行分类得到诊断结果。

4. 深度学习方法检测青光眼

深度学习是机器学习的一个更高级分支,其架构广泛应用于语音识别、自然语言处理和医学图像分析等领域。在医学成像中,深度学习的成功应用为青光眼的早期诊断开辟了道路。

卷积神经网络(CNN)是一种常用的深度学习神经网络。与传统机器学习需要手工提取特征不同,CNN能够自动提取特征。CNN架构在训练过程中自我学习,其包含卷积层、激活层(如修正线性单元[ReLU])、最大池化层和全连接层等。卷积层对输入图像应用滤波器,输出特征图;激活层根据输入激活输出;池化层减小特征图的大小;全连接层对输入图像进行分类,标记为青光眼或健康。

以下是一些使用深度学习方法诊断青光眼的研究:
| 序号 | 作者 | 年份 | 深度学习架构 | 数据集 | 结果 |
| — | — | — | — | — | — |
| 1 | Gayathri等 | 2014 | 人工神经网络(ANN) | 30张眼底图像的本地数据集 | 准确率97.6% |
| 2 | Yadav等 | 2014 | 自适应共振理论(ART) | 20张眼底图像的本地数据集 | 准确率75% |
| 3 | Chen等 | 2015 | 改进的CNN | ORIGA和新加坡华人眼研究(SCES)数据集 | ORIGA数据集AUC值83.8%,SCES数据集AUC值89.8% |
| 4 | Asaoka等 | 2016 | 深度前馈神经网络(FNN) | 159张眼底图像 | AUC为92.6% |
| 5 | Sevastopolsky | 2017 | 改进的U - Net架构 | RIM - ONE v3、DRISHTI - GS和DRIONS - DB数据集 | RIM - ONE - v3数据集盘分割DICE为0.95,IOU为0.89;DRISHTI - GS数据集杯分割DICE为0.85,IOU为0.75 |
| 6 | Abbas | 2017 | 软最大线性分类器 | DRIONS - DB、sjchoi86 - HRF、HRF、PRV - Glaucoma数据集 | 灵敏度84.50%,特异性98.01%,准确率99%,精度84% |
| 7 | Al - Bander等 | 2017 | AlexNet | RIM - ONE数据集 | 灵敏度85%,特异性90.8%,准确率88.2% |
| 8 | Raghavendra等 | 2018 | 18层CNN | 1426张眼底图像的本地数据集 | 准确率98.13% |
| 9 | Christopher等 | 2018a,b | ResNet50、Inception和VGG16 | 14,822张眼底图像的本地数据集 | 健康眼睛AUC为0.91,轻度至重度功能丧失AUC为0.97,轻度丧失AUC为0.98 |
| 10 | Ahn等 | 2018 | CNN、逻辑回归、GoogleNet Inception v3 | 1542张眼底图像的数据集 | CNN测试数据准确率87.9%,AUROC为0.94% |
| 11 | Shibata等 | 2018 | ResNet | 3132张眼底图像的本地数据集 | AROC为96.5% |
| 12 | Al - Bander等 | 2018 | DenseNet | RIM - ONE、ORIGA、DRISHTI - GS、ONHSD、DRIONS - DB数据集 | AUROC为0.7776% |
| 13 | Gómez - Valverde等 | 2019 | VGG19 | 2313张眼底图像的本地数据集 | AUC为0.94%,灵敏度87.01%,特异性89.01% |
| 14 | Phan等 | 2019 | ResNet152、DenseNet201和VGG19 | 3777张眼底图像的本地数据集 | AUC为0.9% |
| 15 | Liao等 | 2019 | ResNet | ORIGA数据集 | 准确率0.88% |
| 16 | Serte和Serener | 2019 | ResNet50、ResNet152和GoogleNet | HRF、DRISHTI - GS1、RIM - ONE、sjchoi86 - HRF、ACRIMA数据集 | 准确率53%,AUC 83%,特异性100% |
| 17 | Juneja等 | 2019 | U - Net | DRISHTI - GS数据集 | 视盘分割准确率95.8%,视杯分割准确率93.0% |
| 18 | Yu等 | 2019 | U - Net、ResNet | RIGA、DRISHTI - GS、RIM - ONE数据集 | 视盘DICE为97.38%,视杯DICE为88.77% |
| 19 | Maetschke等 | 2019 | CNN | 1110张OCT图像 | AUC为0.94% |
| 20 | Li等 | 2019 | CNN | LAG、RIM - ONE数据集 | 准确率95.3% |
| 21 | Thakoor等 | 2019 | CNN | 737张眼底图像的本地数据集 | 准确率96.27% |
| 22 | Thakur等 | 2020 | MobileNet V2 | 45,301、42,601、42,498张眼底图像的本地数据集 | AUC为0.97% |
| 23 | Maheshwari等 | 2020 | AlexNet | RIM - ONE数据集 | 准确率98.90%,灵敏度100%,特异性97.50% |
| 24 | de Moura Lima等 | 2020 | CNN | RIM - ONE r3数据集 | 准确率91% |
| 25 | Hemelings等 | 2020 | ResNet128 | 1424张眼底图像的本地数据集 | AUC为0.995%,灵敏度99.2%,特异性93% |
| 26 | Saxena等 | 2020 | CNN | ORIGA、SCES数据集 | ORIGA数据集AUC为0.822,SCES数据集AUC为0.882 |

深度学习方法在青光眼诊断中,CNN是最常用的模型。不同的CNN架构,如ResNet、U - Net、MobileNet V2、GoogleNet、DenseNet、AlexNet、VGG和Inception等都有应用。其中,ResNet因克服了“梯度消失”问题而受到广泛关注。

graph LR
    A[图像] --> B[CNN输入]
    B --> C[卷积层]
    C --> D[激活层]
    D --> E[池化层]
    E --> F[全连接层]
    F --> G[分类结果]

这个流程图展示了深度学习中CNN用于青光眼诊断的基本流程,图像输入后经过卷积层、激活层、池化层和全连接层,最终得到分类结果。

5. 讨论

在青光眼诊断中,不同的研究采用了传统机器学习和深度学习方法。传统机器学习方法通常需要经过图像预处理、特征提取、特征降维、归一化和分类等步骤。常用的分类器包括SVM、NB、RF、K - NN和LR等,其中SVM使用最为频繁。然而,手工提取的特征可能无法保证诊断的最优结果,且特征提取过程可能受到眼科医生的影响,存在一定的偏差。

深度学习方法则具有自动特征学习和分类的能力,能够克服传统机器学习的一些局限性。CNN等深度学习模型在青光眼诊断中表现出了良好的性能。不同的CNN架构在不同的研究中被应用,如ResNet、U - Net等。

在图像使用方面,眼底图像和OCT图像都有应用。眼底图像可以清晰地看到眼睛的结构,检测异常,但提供的青光眼特征信息有限;OCT图像是3D图像,可用于准确诊断青光眼,但成本较高,且需要专业的眼科医生进行检查,过程耗时且可能存在偏差。

不同的数据集被用于模型的训练和测试,但目前的数据集规模可能不足以满足深度学习模型的训练需求。因此,构建大规模的数据集对于提高深度学习模型的准确性至关重要。

在评估诊断性能时,常用的指标包括灵敏度、特异性、准确率、AUC、ROC和DICE分数等。这些指标可以衡量研究工作的质量。

6. 总结

传统机器学习方法在青光眼诊断中需要有效的特征空间来实现准确诊断。然而,深度学习在自动学习和准确诊断方面具有明显优势,逐渐成为传统机器学习的理想替代方案。

尽管在使用深度学习进行青光眼诊断方面已经取得了很大进展,但仍需要构建大规模的数据集,并深入研究深度学习架构,以提高青光眼早期诊断的准确性。由于青光眼是一种不可逆的疾病,早期检测可以降低发病风险。基于深度学习的自动青光眼诊断系统将提高早期诊断的准确性,并帮助临床医生解决专家短缺的问题,为大量患者的筛查提供支持。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐