AI进军癌症诊断凸显优势，或面临数据获取和分享挑战-知识分子的财新博客-财新网

编者按

我们生活的复杂环境，可被完全地数字化，这意味着它可被精准地计算，既能储存已逝去的信息，同时也能对未来的发展趋势做出精准的预测。

对疾病的诊断同样如此，基于过去数十年，我们累积的庞大医疗数据，通过深度学习不仅能对这些数据进行有效分析，帮助我们更新对疾病的认识，同时也能精准地预测疾病未来发展趋势，提前做好预防。癌症是我们当下最关心的话题之一。本文汇集了近年来，深度学习在癌症诊断方面的一系列科研成果，同时也指出数据共享、数据标准化对人工智能在这一领域进一步应用所带来的挑战。

撰文 | 李家劲（加州大学洛杉矶分校）

责编 | 叶水送

●　●　●

人工智能正在改变医疗诊断行业

今年年初，谷歌成功研发出一套用于乳腺癌诊断的人工智能系统。这套系统分析了大量的病理组织显微图像，速度比人类快得多，且肿瘤检出率高达92.4%。如果是人类医生完成这项工作，必须非常仔细分析大量组织样本才能确诊癌症，而且这是一个极度费时且易出错的过程。一个有经验的医生需要几年甚至十年的时间来培训。如今谷歌的成功预示着人工智能疾病诊断的到来。

事实上，利用人工智能检测癌症并不是新鲜事。早在30年前，人工智能的重要分支之一，机器学习技术如人工神经网络算法和决策树算法，就被用来做癌症检测。然而，早期的尝试并没有得到令人满意的结果。

近年来，科学家在深度学习技术上取得了很大的突破，例如，AlexNet的出现极大提升了计算机识别图片的能力。比起一般的机器学习，深度学习能从数据中自动提取更丰富、有用的信息，因而有更高的精确度。同时，计算机性能的迅速提升以及可用数据的增加，使得深度学习网络的训练成为可能。因此，深度学习技术正逐渐应用于癌症检测上。

不少研究也证明，比一般的机器学习方法更加精确，无论是肠癌、乳腺癌、肺癌还是胰腺癌的检测。最近，以深度学习为主的人工智能技术在癌症检测上取得了激动人心的进展。接下来，我们就一起回顾一下过去三年人工智能在癌症检测上的一些代表性成果。

深度学习在癌症诊断中的独特优势

深度学习框架有很多种，自编码器（Autoencoder, AE）、深度置信网络（Deep Belief Network, DBN）以及卷积神经网络（Convolution Neural Network, CNN）等。其中，CNN在癌症检测中最为常用，其次是AE和DBN。它们或被用于分析医学图像，如X光片、CT图像等，或用于分析分子层面的数据，如基因突变、基因表达数据等。目前，深度学习技术还不能应用在所有类型的癌症上，因此现有研究一般将肺癌、乳腺癌等常见癌症，作为检测目标。

CNN是一个多层神经网络框架，旨在通过卷积处理来学习数据中的高位信息。它包含三种神经元层：卷积层（Convolutional Layer）、池化层（Pooling Layer）和全连通层（Fully Connected Layer）。其中，卷积层能够从数据中提取特征，池化层一般用于降低数据的维度（复杂度），而全连通层则利用前两层学习的信息进行分类。基于这种精密的设计，CNN十分擅长图片识别，这也是它近几年声名鹊起的原因，所以研究人员多用它来分析医学图像，以检测癌症。不过，图片识别并不是CNN的唯一应用，CNN还很适合用来做文本分析。我们知道，生物体的基因组信息储存在碱基序列中，这些信息在计算机中的表示就是文本，所以，CNN也很适合分析引起癌症的基因组数据。

在医学图像分析上，CNN可以说是深度学习在医疗诊断领域最成功的应用之一。2015年，中科院和南佛罗里达大学的学者使用CNN的变种之一——多层卷积神经网络（Multi-scale Convolution Neural Network），使计算机能从胸部CT扫描图像识别出肺结节（肺结节是诊断肺癌的依据之一），其准确度高达86.84%。不过，使用肺部细胞纤维图像，Teramoto训练的CNN成功检测肺癌的准确率却只有71%。

除肺癌之外，CNN也能成功检测出乳腺癌。Kooi使用超过45000张乳房X光图片训练CNN，使诊断准确度达到人类专家的水平。当然还有文章开头提到的谷歌，他们的CNN能够自动从100万像素的组织显微图像中，检测并定位出100×100像素的肿瘤，灵敏度达到92.4%，而每张图片平均只有8个假阳性结果，是当下检测乳腺癌最好的人工智能系统。另一种十分常见的癌症——胰腺癌，由华中科技大学的学者用CNN实现了自动化识别，且获得了89.85%的灵敏度与95.83%的特异度。不同于之前的研究，他们的CNN可直接使用原图片作为输入，而不需要预先对图片进行剪辑等预处理。

而对于肠癌，大肠息肉的检测对早期诊断十分关键，因为肠息肉很有可能恶化为癌症。2017年，Korbar实现了从肠道组织染色图鉴别可能致癌的肠道息肉的CNN，精确度达到93%。同年，Lequan Yu则设计了3D-CNN，使计算机能够分析结肠镜拍摄到的视频来找到肠息肉。除了这些癌症种类之外，CNN还被设计来分析不同的医学图像，以检测骨肉瘤、头颈癌、膀胱癌、脑癌和口腔癌等癌症。

最值得一提的是，斯坦福大学的Andre Esteva今年在Nature上发表了突破性进展，他们设计的CNN诊断皮肤癌的精确度能够达到甚至超越皮肤病学专家的水平。他们使用已经预先用128万张图片训练过的GoogleNet Inception v3 CNN框架，然后拿包含2032种疾病的13万张医疗图片，用迁移学习技术来训练，最终使这个CNN能够把图片归类为757类皮肤疾病中的一种，包括皮肤癌。它的另一项优势是可直接对普通的照片进行分析，不需要像以往的研究一样要求医学图像或需要对图片进行预处理。更重要的是，这项技术在未来有望部署在移动终端，也就是说，用户只要用手机对可疑部位拍照，就能知道是否出现了癌变，而不需要专程去看医生。作者预计，到2021年，全世界大约有63亿台智能手机会连接到这个系统中，从而为大众提供低成本、准确的皮肤病诊断服务。

CNN还被用在基因信息分析上，用于发现基因突变或基因表达的变化。众所周知，癌症是由于细胞基因突变造成的。因此，癌细胞的基因序列和基因表达模式跟正常细胞不一样，这为我们提供了一个诊断依据。理论上，基因检测是最佳的癌症检测手段，因为细胞的行为最终都是由基因控制。直接检查基因的异常情况可让我们及早发现癌症，为此科学界付出了很多努力，例如目前正如火如荼进行的“精准医学”计划，就想利用遗传信息来提高临床诊疗有效性。但比起医学成像的检测方法，检测基因突变和基因表达信息会昂贵得多。更为重要的是，基因检测传达的信息要隐晦得多，基因表达与癌症的关联还需要大量的研究，尚不能知道基因与癌症的确切关系。所以，目前这方面的相关研究并不多。

具有有代表性的是，2017年，Yuan开发了基于深度神经网络的DeepGene，能够分析病人的基因突变数据，并鉴别其属于什么类型的癌症。DeepGene从基因测序数据过滤无关基因和降低数据稀疏度后，使用深度神经网络进行以判定是哪种类型的癌症。虽然能够比之前的一些方法，如支持向量机（Support Vector Machine）和朴素贝叶斯（Naive Bayes）等，获得更高的精确度，但也只有60%左右。Xiao则针对基因差异表达数据，设计了结合多种机器学习模型和深度神经网络的方法，应用于鉴定胃癌、肺癌和乳腺癌，但精确度并不高。

AE是一种无监督学习型神经网络，目标在于将复杂的数据用简单的特征来表示，包括降噪自编码器（Denoising Autoencoder，DAE）和稀疏自编码器（Sparse Autoencoder，SAE）等类型，同样适用于图片分析。其中，DAE能够接受损坏的输入数据，并还原出其本来的信息。2016年，深圳大学和台湾大学的联合团队使用堆栈式降噪自编码器（Stacked Denoising Autoencoder）成功识别出肺结节，精确度在86.6%以上，这项技术还能用于分析胸部超声图像以检测乳腺癌。

而SAE则给神经网络中的隐藏神经元层加入了稀疏性的限制，使得其可以在隐藏神经元较多的时候依然可以学习到输入数据中的有用结构。2016年，吴恩达跟他的合作者利用稀疏自编码器（Sparse Autoencoder）算法，分析乳房X光图像，能够预测出乳腺癌的发病概率。这个方法也可以用来分辨正常组织和病变组织，但由于只是用了1000多个图片训练，其准确度只有不到60%。

DBN可看成一个由许多较为简单的、无监督学习型的神经网络，如受限玻尔兹曼机（Restricted Boltzmann Machines）或自编码器组成的网络系统，它能够允许快速、逐层的无监督训练。目前DBN在癌症检测上的应用比较少，但效果也算不错。2016年，Azizi使用DBN，结合多参数磁共振成像（Multi-parametric Magnetic Resonance Imaging）和超声波成像，使计算机自动识别胰腺癌的准确度达到80%。

数据质量以及开放是AI未来发展的瓶颈

目前，大部分的人工智能的准确度不如人意，且仅可应用于部分常见疾病，这主要是可用数据不足导致。不难发现，在之前提到的研究中，使用训练样本越多，精确度就越高。但由于数据标准化和隐私限制等原因，数据的获取和分享一直受阻。除了数据数量之外，数据质量也相当重要，尤其是医疗数据，大多需要训练有素的专家手动给出“标准答案”，才能提高AI的准确性，但这将是一个十分消耗资源的过程。不过，就算人工智能的准确性足够令人信服，解释它的行为将是另一件让人头痛的事。

深度学习算法复杂，尽管得到正确的结果，我们往往也很难理解计算机如何”思考“得出这样的结果。然而，方法总比问题多。现在，针对数据数量和质量的不足，越来越多的公共标准数据库建立起来，如癌症影像集（The Cancer Imaging Archive），研究者有更多可靠的数据可供自由使用。同时，研究者也可以使用无监督学习的方法，来减少数据缺少”答案“的影像。

总的来说，深度学习技术能够从数据中学习到丰富的信息，意味着它可完成更加复杂的任务；而且我们能很方便地将这项技术应用到其它地方。除了癌症检测外，深度学习技术，尤其是CNN，还可以用来检测其它疾病，如白内障、骨折、脑出血等。不难想象，随着人工智能在医疗领域的广泛应用，医生的工作量将会大大减少，且诊疗准确率也将会得到提升。它们能够在图片上找到我们肉眼难以发现的异常。

参考文献

1、Esteva, Andre, Brett Kuprel, Roberto A. Novoa, Justin Ko, Susan M. Swetter, Helen M. Blau, and Sebastian Thrun. 2017. “Dermatologist-Level Classification of Skin Cancer with Deep Neural Networks.” Nature 542 （7639）:115–18.

2、Liu, Yun, Krishna Gadepalli, Mohammad Norouzi, George E. Dahl, Timo Kohlberger, Aleksey Boyko, Subhashini Venugopalan, et al. 2017. “Detecting Cancer Metastases on Gigapixel Pathology Images.” arXiv []. arXiv.

3、Maclin, P. S., J. Dempsey, J. Brooks, and J. Rand. 1991. “Using Neural Networks to Diagnose Cancer.” Journal of Medical Systems 15 （1）:11–19.

4、Qi Dou, Hao Chen, Lequan Yu, Lei Zhao, Jing Qin, Defeng Wang, Vincent Ct Mok, Lin Shi, and Pheng-Ann Heng. 2016. “Automatic Detection of Cerebral Microbleeds From MR Images via 3D Convolutional Neural Networks.” IEEE Transactions on Medical Imaging 35 （5）:1182–95.

5、Teramoto, Atsushi, Tetsuya Tsukamoto, Yuka Kiriyama, and Hiroshi Fujita. 2017. “Automated Classification of Lung Cancer Types from Cytological Images Using Deep Convolutional Neural Networks.” BioMed Research International 2017 （August）:4067832.

6、Wang, Xinggang, Wei Yang, Jeffrey Weinreb, Juan Han, Qiubai Li, Xiangchuang Kong, Yongluan Yan, et al. 2017. “Searching for Prostate Cancer by Fully Automated Magnetic Resonance Imaging Classification: Deep Learning versus Non-Deep Learning.” Scientific Reports 7 （1）:15415.

7、Xiao, Yawen, Jun Wu, Zongli Lin, and Xiaodong Zhao. 2018. “A Deep Learning-Based Multi-Model Ensemble Method for Cancer Prediction.” Computer Methods and Programs in Biomedicine 153 （January）:1–9.

8、Yuan, Yuchen, Yi Shi, Changyang Li, Jinman Kim, Weidong Cai, Zeguang Han, and David Dagan Feng. 2016. “DeepGene: An Advanced Cancer Type Classifier Based on Deep Learning and Somatic Point Mutations.” BMC Bioinformatics 17 （Suppl 17）:476.

话题：