说可能具有挑战性。布莱根妇女医院马哈茂德实验室的研究人员是麻省总医院布莱根医疗保健系统的创始成员,他们开发了一种深度学习算法,该算法可以自学学习特征,然后可用于在大型病理图像存储库中查找类似病例。这种被称为SISH(组织学自我监督图像搜索)的新工具就像一个病理图像搜索引擎,具有许多潜在的应用,包括识别罕见疾病和帮助临床医生确定哪些患者可能对类似疗法产生反应。一篇介绍自学算法的论文发表在NatureBiomedicalEngineering上。我们表明,我们的系统可以帮助诊断罕见疾病并找到具有相似形态模式的病例,而无需手动注释和用于监督训练的大型数据集。该系统具有改善病理学训练、疾病分型、肿瘤识别和罕见形态学识别的潜力。”

现代电子数据库可以存储大量的数字记录和参考图像,尤其是在病理学方面的全幻灯片图像(WSI)。然而,每个单独的WSI的千兆像素大小以及大型存储库中不断增加的图像数量意味着WSI的搜索和检索可能缓慢而复杂。因此,可扩展性仍然是有效使用的相关障碍。

为了解决这个问题,Brigham的研究人员开发了SISH,它可以自学学习特征表示,无论数据库大小如何,都能以恒定的速度找到病理学中具有相似特征的病例。

在他们的研究中,研究人员测试了SISH检索常见和罕见癌症的可解释疾病亚型信息的速度和能力。该算法成功地从超过22,000例患者病例、超过50种不同疾病类型和十几个解剖部位的数万张完整幻灯片图像的数据库中快速准确地检索到图像。在许多情况下,检索速度都优于其他方法,包括疾病亚型检索,尤其是当图像数据库规模扩大到数千张图像时。即使存储库规模扩大,SISH仍然能够保持恒定的搜索速度。

然而,该算法有一些局限性,包括大内存需求、大型组织载玻片内有限的上下文感知以及它仅限于单一成像模式的事实。

总体而言,该算法展示了在独立于存储库大小和不同数据集中有效检索图像的能力。它还展示了诊断罕见疾病类型的能力,以及作为搜索引擎识别可能与诊断相关的某些图像区域的能力。这项工作可能会极大地为未来的疾病诊断、预后和分析提供信息。

“随着图像数据库的规模不断扩大,我们希望SISH将有助于更容易地识别疾病,”Mahmood说。“我们相信这一领域的一个重要未来方向是多模式病例检索,其中涉及联合使用病理学、放射学、基因组和电子病历数据来查找类似的患者病例。”