在GPU无法满足复杂数据集要求的情况下,英特尔通过其基于CPU的解决方案提供检测结果。
Madhu Nair博士和Asha Das博士即将取得巨大突破,即利用人工智能(AI)模型在从患者组织样本中获取的扫描图像中检测乳腺癌细胞。
然而,这两位来自印度的研究人员面临着巨大的挑战。通常,他们需要花费数月的时间,艰难地教他们的AI模型去准确地识别癌细胞。而Das与她的团队经常需要耗费数周来审阅高分辨率、百万像素的图像,并逐一标记出癌变区域。
【资料图】
因此,该团队需要一个能够在无人监督的情况下,准确、快速扫描这些图像的解决方案。
针对这种情况,英特尔提供了帮助。
2022年,来自印度科钦科技大学人工智能与计算机视觉实验室的研究人员Madhu Nair博士和Asha Das博士与英特尔工程、销售及市场团队展开合作,利用英特尔®至强®可扩展处理器,以及充分利用英特尔CPU加速功能的英特尔® TensorFlow优化软件套件,打造了一个全新的解决方案。
高需求之下,GPU力有不逮
目前,乳腺癌早期迹象的发现很大程度上依赖于放射科医生以及负责手动扫描组织病理学结果医生的专业知识。然而,仅仅依靠人眼存在弊端。根据美国国家癌症研究所的数据,约20%的乳腺癌迹象正在被遗漏。
而AI在这方面可以提供很好的帮助。随着近期算力技术的突破,越来越多的医院开始热衷于使用AI来发现医生可能错过的迹象。12月,英特尔与宾夕法尼亚大学医学院联合宣布,其已帮助研究人员将癌性脑瘤的检测率提高了33%。
Das表示,她的团队首先采用了基于GPU的解决方案以提升其深度学习模型。然而,他们发现,由于处理大型图像所需的计算量远远超过了系统的设计极限,其基于GPU的系统经常会卡顿,甚至毫无原因地出现死机或重启的情况,令人十分沮丧。
"我们的模型在计算上要求很高,我们试图用GPU来训练模型的尝试以失败告终",Nair写道,"我们耗费了数日进行执行,并且发现GPU很难完成更高分辨率图像的训练,因此,我们不得不探寻更好的计算设施"。
英特尔通过硬件及软件提供服务
2022年,Nair发现了英特尔或许能够提供帮助。当时,他与一位戴尔员工正在就另一个研究项目进行会面,Nair提出了他所面临的挑战,而戴尔则将Nair介绍给了英特尔印度团队。
几个月后,他们部署了四台服务器,在没有任何深度学习加速器的情况下,作为单一的计算集群运行。这些服务器和存储使用高速以太网网络进行连接。
在软件方面,该联合团队采用了英特尔® TensorFlow优化,该软件套件通过利用英特尔CPU的加速功能来提升TensorFlow的性能。
"我与英特尔团队分享了我们的问题,非常高兴他们迅速理解了这项工作的重要性",Nair表示,"他们给了我们使用这种分布式架构的机会。"
Asha Das博士,印度科钦科技大学人工智能与计算机视觉实验室的研究员。利用英特尔的硬件和软件,其与Madhu Nair博士打造了基于CPU的解决方案,能够在医疗图像上检测出乳腺癌的早期迹象。
Madhu Nair博士,印度科钦科技大学人工智能与计算机视觉实验室的研究员。利用英特尔的硬件和软件,其与Asha Das博士打造了基于CPU的解决方案,能够在医疗图像上检测出乳腺癌的早期迹象。
新的解决方案不仅准确而且快速
这些结果正是研究人员所期待的,而且还有一个超乎预期的收获:他们的模型不仅能标记出癌细胞,还能区分出不同等级的癌症。
而且它非常准确:该解决方案达到了98%的准确率--比其他模型好约10个百分点。(了解更多关于该解决方案的信息:CUSAT通过深度学习改善癌症筛查结果)。
这是个一开始就设定的高标准。
此后,该团队在更多的数据集上训练其模型,研究人员预计这一准确率将逐步上升。
"英特尔的架构非常‘神奇’",Nair表示,"我们能够在几个小时内完成训练,这其中有很多原因。因为服务器有192GB的内存,比显卡上的40GB或80GB还要多,而且我们能够使用高分辨率的图像,并将整个模型装入内存。此外,英特尔还帮助我们改进模型,并与我们共同优化,以保证其正常运行。"
Das指出,考虑到相较于其他模型所需的训练数据要少得多,这一准确性结果更加令人印象深刻,而且极大缩短了反馈时间。她补充道:“我们对结果非常满意。”
"我们能够在只拥有20%被注释数据的情况下,收获98%的准确率,这很了不起,而且很令人兴奋。"
即将在你身边的病理中心出现
接下来,对于这项技术而言,团队将等待以确保能获得专利,并与愿意颠覆一个习惯于人工干预的市场领域的商业合作伙伴达成合作。对此,Das分享了一些可能需要咨询多位病理学家的扫描结果,每位病理学家根据他们不同的经验提供自己的结论。
还有一个问题是准确性。虽然98%的准确率可能看起来很高,但对于实际应用来说,它依然不够精确。
现在,Das和Nair都已经证明他们的模型能够可靠地检测乳腺癌细胞,他们正在研究将类似的方法,应用于脑动脉瘤和对内窥镜检查中的息肉分类。
Das指出:"我们还计划扩展这个模型,以检测多器官癌症",她补充说,因为乳腺癌经常扩散到手臂下的邻近淋巴结,所以她现在正在努力扩展这个解决方案,以分析淋巴结图像。
Nair表示:"我们很感谢英特尔的支持,而且也期待未来能展开更多类似的合作。"
标签: