杨光
近日,百度研究院发表论文提出一种名为“神经条件随机场”的全新病理切片分析算法,将肿瘤识别定位准确率大幅提高。在公开数据集 Camelyon 16大赛测试集上,该算法的肿瘤定位 FROC 分数达到0.8096,超过专业病理医生水平及由哈佛和麻省理工学院联合团队保持的最好成绩。
病理切片分析是癌症诊断中的黄金标准,但病理切片的阅片流程十分困难复杂。一张被放大40倍的电子化病理切片通常由超过十亿个像素点组成,磁盘空间大小超过1GB。然而淋巴结附近微转移肿瘤细胞群可能最小只有不到1000像素的直径。而一旦发现微转移肿瘤细胞群,病人的治疗方案和预后可能就会有极大差别。因此,详尽的阅读病理切片,且不漏掉任何一处具有临床价值的病灶,如同大海捞针,是一项十分复杂和耗时的任务。
百度研究院提出一种全新的深度学习算法,一次性输入一组3x3的图块,并联合预測每张图块是否有肿瘤区域。图块间的空间关系可通过一种名为“条件随机场”的概率图模型来模拟。整套算法框架可在 GPU 上进行端到端的训练,而不需任何后处理的步骤。由于考虑到了相邻图块之间的空间关系,该算法让假阳性得以大大降低,算法预测的肿瘤区域也更加平滑。对比之前的算法,该算法除了真实肿瘤区域外,几乎没有引入任何其他假阳性区域。
同时,百度研究院也在 Github 上开源了整套算法代码,以便其他研究人员在此基础上进行更深入的研究,促进人工智能在医学图像分析领域取得更加长足的发展。