深度学习识别皮肤癌媲美医生,智能手机检测癌症将不再遥远

镁客 7年前 (2017-02-08)

研究人员希望在不久的将来将这项技术投入实用,让更多人获得更好的医疗服务。试想一下吧:一台皮肤癌检测仪,就在你智能手机里。

导读】斯坦福大学的研究人员开发深度学习算法,识别皮肤癌的准确率与专业的人类医生相当,相关研究论文被选为封面论文在本期 Nature 发表。研究人员训练系统观看了近13万张痣、皮疹和其他皮肤病变的图像,然后让系统与21位皮肤科医生对比测试,结果系统的精确度与人类医生相当(“至少”91%)。使用这一技术,有望制造出家用便携皮肤癌扫描仪,造福广大患者。

“我们制作了一个非常强大的机器学习算法,能够从数据中学习,”论文的其中一位主要作者、斯坦福博士生 Andre Esteva 在新闻发布稿中表示,“不是通过编写代码,而是让算法自己发现该去寻找的东西。”

Esteva 提到的强大的算法也就是我们所说的“深度学习”,或者说神经网络。

当斯坦福的这项合作研究开始时,神经网络已经能够从大约1000个不同类别中识别128万幅图像。但是,与分辨不同种类的狗的图片不同,将一块不规则的皮肤色斑识别为良性脂溢性角化病还是恶性肿瘤会影响患者的生活乃至生命。因此,算法需要极高的准确率与可靠性。

深度学习识别皮肤癌媲美医生,智能手机检测癌症

与分辨不同种类的狗的图片不同,将一块不规则的皮肤色斑识别为良性脂溢性角化病还是恶性肿瘤会影响患者的生活乃至生命。因此,算法需要极高的准确率与可靠性。来源:Fig. 1b, Esteva, Kuprelet. al,2017

“我们没有用来训练算法的皮肤癌数据库,因此只能动手自己做。”论文的另一位主要作者、斯坦福博士生 Brett Kuprel 表示。“我们从互联网上收集数据,与医学院合作,从十分杂乱的数据中整理出了很好的分类——光是标签就使用了好几种语言,包括德语、阿拉伯语和拉丁语。”Kuprel 说。

不仅如此,在正式进行图像处理前,他们还需要进行数据清洗。皮肤科医生经常使用一种称为皮肤镜的仪器仔细检查患者的皮肤。因此,医疗人员使用的皮肤病图像,它们的放大率和透视角度都是大体一致的。但是,从互联网上收集的许多图像都不是在这样受控的环境中拍摄的,因此在角度、焦距和照明方面各不相同。

研究人员最终累积了将近13万张可用的皮肤病变图像,覆盖了2000多种不同的疾病类型。他们使用这一数据集创建了图像库,并将其作为原始像素提供给算法,每个像素都带有标签,描述了相关疾病的附加数据。研究人员训练算法总结出图像里的模式,也即发现疾病经由组织传播在外观上所遵循的规则。

深度学习识别皮肤癌媲美医生,智能手机检测癌症

过程示意图:研究人员训练算法总结图像里的模式,也即发现疾病经由组织传播在外观上所遵循的规则。来源:Fig. 1b, Esteva, Kuprelet. al,2017

为了测试算法的性能,研究人员找来斯坦福医学院的21名皮肤科医生。实验中,算法和人类医生需要完成三项任务:①角质细胞癌分类、②黑素瘤分类,以及③使用皮肤镜检查的结果对黑色素瘤进行分类。

在最后一项测试中,研究人员仅使用了高质量、经活检证实的恶性黑色素瘤和恶性癌的图片。研究人员让参与测试的人类医生观看这些图片,并询问他们是“进行活检、治疗,还是安慰病人”。算法在发现所有癌性病变和不得到假阳性结果两方面都表现良好,综合准确率为91%,与人类医生表现相当。

斯坦福大学的研究人员希望在不久的将来将他们的这项技术投入实用,让更多人获得更好的医疗服务。试想一台就在你智能手机里的皮肤癌检测仪,随时随地方便使用。

论文:用深度神经网络分类皮肤癌,达到皮肤科医生水平

摘要

皮肤癌是最常见的人类恶性肿瘤,主要通过视觉方式诊断,从临床筛查开始,之后可能跟进皮肤镜分析检查、活体细胞检测和组织病理学检查。由于皮肤病变外观的细粒度变化,让系统自动对皮肤病变图像进行分类十分困难。深度卷积神经网络(CNN)常被用于分类各种不同细粒度的对象,并且在多项任务中表现良好。

在这里,我们展示了使用单一CNN 对皮肤病变进行分类的过程,这一神经网络仅以像素和疾病标签作为输入,直接使用图像进行端到端的训练。我们使用了含有 129450 幅临床图像的数据集——比以前的数据集大了两个数量级——包含 2032 种不同的疾病类型,训练了一个CNN。我们使用活检证实的临床医学图像,测试了该网络在两大案例中的性能,结果与 21 位认证皮肤科医生的表现做对比。

这两大案例分别是:角质细胞癌与良性脂溢性角化病,以及恶性黑色素瘤和普通的痣。第一例代表最常见的癌症识别,第二例代表了最致命的皮肤癌识别。深度卷积神经网络在这两个任务上的表现都达到了所有接受测试的专家的水平,证明了这一人工智能系统的皮肤癌鉴定水平与皮肤科医生相当。

配备这一深度神经网络的移动设备可以让皮肤科医生的诊断得到临床以外的使用。预测到 2021 年,全球将有 63 亿智能手机用户,这为实现低成本的重要诊断铺平了道路。

深度学习改变癌症诊疗,仍有很大提升空间

斯坦福的这项研究发表后,两位皮肤病学研究者——俄勒冈健康和科学大学的 Sancy A. Leachman 和美国国家癌症研究所 Glenn Merlino 在 Nature 撰写了评论文章《癌症诊断的最后前沿》(The Final Frontier in Cancer Diagnosis)。

Leachman 和 Merlino 肯定了斯坦福大学研究者的贡献。但他们也指出,Esteva 等人所使用的训练数据集比此前公布的任何同类方法都要大100倍左右,这或许能很好地介绍他们的机器为什么能成功。当然,这种方法也还存在提升的空间。随着越来越多的数据被填入到这类系统当中,机器可以在自己的错误被改正的过程中进行学习,从而让其性能得到显著的提升。Esteva和他同事的工作代表了提升曲线上的第一点,而不是峰值。作者使用的模型算法名叫 Inception v3,现在,也有一些新的程序和算法可用,这些新的东西能缩减训练时间、提升精度。

但是,算法参考信息的准确度决定了算法的准确度。如果机器诊断出病变是恶性的,但是一个病理学家对病变的活组织检查分类的结果诊断为良性(non-malignant),那么这可能是一个“错误”的机器诊断。但是,如果在一个例子中,机器是正确的,而人是错误的呢?机器和人诊断的相对准确率可以通过病变的发展进程进行不断地追踪。

人工智能用于诊断技术的一个显要的潜在社会好处在于,能让更多的人可以获得高质量的医疗。比起既有的医疗系统,一个包含了这一技术的智能手机应用程序可以让更多的人享受高效的、简便且低成本的医疗检查。以皮肤癌的检测为例,其他依赖医生来进行以图像为基础的癌症诊断,比如放射检查,可能会被改变。

如果医学检查开始依赖患者对可疑病变的自我识别,那么皮肤癌高风险的个体更有可能在医生的手术中选择不进行正常的全面皮肤筛查,这样可以挽救他们的生命。

但是,人工智能驱动的医疗诊断可能会带来意想不到的负面结果。医务人员是否会变成技术人员,只是对机器的诊断结果做出一定的反应?当然他们可能偶尔也会有凌驾于计算机之上的权力。并且,如果医疗的检查都依赖于病人对可疑病症的自我诊断,个人会不会更可能选择不做全面的皮肤检测,但是,这在医生的诊断中是必须的,这是可以拯救生命的。

在疾病的早期阶段,精确和有效的癌症诊断,从而获得最好的治疗时机,长久以来,这样的事其实很多都只是发生在科幻小说而不是现实生活中。但是,也许用不了多久,我们就能拥有能诊断癌症的智能手机,就像《星际迷航》中出现的那些一样。我们应该提前做好准备,或者是说转变自己的观念,大胆地把人工智能技术应用在更多的领域。

本文转载自新智元,编译:文强、胡祥杰

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到