王玉峰 蔡文杰
IBM低估了垂直领域的技术难度,急于在全球部署沃森医疗系统,想靠沃森这个半成品挣钱,可是实际使用效果不佳,投入产出不成正比,合作伙伴纷纷离弃。这一切为沃森的前路蒙上一层阴影。
IBM Watson(沃森)认知计算系统曾经是数据科学和人工智能领域的“明星”。它后来的境遇经历却让知情者感慨唏嘘不已。
沃森的LOGO通过明亮、渐变的线条表现了“智慧地球”的概念以及沃森认知系统的三项重要特质:理解、推理、学习,展现了沃森的雄心壮志,就是要依托认识系统不断学习各种知识,从而改变全世界人们的生活。
然而,理想很丰满,现实很骨感。沃森的昨天、今天和明天,明白无误地证明此言不虚。
昨日回忆
答题明星,沃森出世
让我们回到2011年那个现代人工智能的“拓荒”年代,那是深度学习才刚刚被Hinton等人重新定义、苹果还没有Siri、打败李世石的AlphaGo还未现身的年代。沃森出现了,它以IBM创始人汤姆斯·沃森命名,寄托了IBM对人工智能的美好愿景。沃森是一个基于认识学习的超级计算机。它能够回答基于认知计算的自然语言提出的问题。认识学习是一种全新的计算模式,它包含信息分析、自然语言处理和机器学习领域的大量技术创新,能够助力决策者从大量非结构化数据中揭示非凡的现象。
同时,沃森作为认识系统,能够依据强大的数据库,不断学习新的内容,不断扩充自己的“知识面”。简言之,可以把IBM 沃森看作一台能够回答问题的超级计算机。
2011年,沃森在美国最受欢迎的智力竞猜节目《危险边缘》中击败该节目历史上最成功的两位选手。这种强烈、直观的视觉冲击,激起了普通人对人工智能(AI)的无限美好幻想。许多人认为AI真的要来到人们身边了,而沃森就是那个能解决一切问题的超级机器人。
目标医疗,高调宣传
科技发展的最终目的是助力人类的美好生活,所以沃森带着自己的雄心壮志,器宇轩昂地走进了医疗领域。
在沃森参加节目2年后,IBM宣布沃森将进入医疗领域。沃森跨入医疗领域并不让人觉得奇怪,IBM的医疗“大棋”已经下了半个世纪。20世纪50年代,IBM就开始开发医疗硬件和软件,比如人工心肺机、听力受损的信号处理等。60年代就开始钻研医疗数据采集,同时还对影像信息访问的计算机自动化有所涉猎,这与沃森当下着眼的领域有很强的关联。进入21世纪后,IBM提出“智慧地球”计划,针对医疗行业投入了大量精力,加速在医疗学术、解决方案上的合作。一系列的探索和实践,都为IBM打下了不错的医疗行业基础,同时也为沃森进入医疗行业深耕埋下伏笔。
在宣布进军医疗领域后不久,IBM又将目标再次缩小。2013年,IBM宣布将会把研究重心放在肿瘤的治疗上,实现医学技术的一大飞跃。当时美国专注生命科学、医药领域的新闻网站STAT的报道如此描述:为了推广自己的标志性品牌——沃森,IBM 决定以独特的创造力来吸引全球的目光。肿瘤作为世界上最难治愈的疾病之一,人们每每提到都是谈虎色变,如何有效治疗是一个医学界至今难以回答的问题。在IBM的宣传中,沃森成为了肿瘤医生,沃森一跃成为全世界最受关注的AI项目之一。
合作并购,整合医疗数据
医療数据是解决肿瘤问题的根本所在。只有拥有大量医学数据,沃森才能即时训练、学习。早在2012年,全球著名的安德森癌症中心就已经与IBM合作,目标是让沃森阅读最新的医学数据,数据涉及病人的症状、基因序列、病理报告,然后将信息与内科医生的报告、重要期刊论文整合,帮助医生制定诊断和治疗策略。
在进军医疗领域后,为了能够获得更多的一线医学数据,IBM进行了大量的收购工作。2014年4月,IBM收购了两家数据驱动型健康公司Phytel和Explorys。在这之后IBM成立了专门负责医疗健康的部门沃森健康。2015年8月,为了获取影像数据,IBM又花费了十亿美元让Merge健康加入了沃森健康队列。整个2015年,IBM一直在健保行业大力投入,总共投入超过40亿美元用来收购医疗技术公司。2016年,IBM又以26亿美元收购医疗数据与健康数据公司Truven Health Analytics Inc,进一步扩大IBM已成规模的健保业务。至此,成立短短两年多的沃森健康,员工规模扩大了整整一倍,达到了一万多人。
沃森肿瘤,开疆拓地
沃森肿瘤是沃森在医疗人工智能领域推出的重要产品。IBM公开表示,沃森肿瘤拥有强大的自学习及深度学习能力,通过链接至业界权威评审的研究以及临床指南,它可以随着时间的推移不断吸收新的知识,为医生构建最新的知识库,沃森能够为13种癌症提供治疗方案。随着沃森肿瘤的声名大噪,全世界各种各样的机构与企业购买了沃森的服务,尤其是在沃森健康计划启动之后,很多医院与医疗机构希望借助这种新的技术来探究临床医学背后的秘密。合作者有纪念斯隆-凯特琳癌症中心 (Memorial Sloan Kettering Cancer Center)、梅奥医院(Mayo Clinic)、奎斯特诊断公司(Quest Diagnostics)等医疗领域的著名机构。
与此同时,沃森积极推进中国市场的开发。2016年8月,IBM宣布沃森健康开始进入中国。IBM推出“健康中国”生态圈共赢计划,将运用认知计算、云计算、大数据分析和物联网等技术,助力中国医生应对威胁人类健康的癌症、慢病、流行病等顶级“健康杀手”。
今日总结
饱受质疑,沃森败在哪里?
沃森健康高调宣传、圈地砸钱、并购合作,看似顺风顺水,全世界都为之瞩目。然而对于肿瘤的有效治疗真的要实现了吗?事情真的会像沃森高管做出的承诺那样美好吗?残酷事实证明,直到如今美好愿望依旧只是愿望,事情的发展完全没有按照IBM高层给定的剧本走,谁都没有想到沃森的失败会来得那么快。
首先是一系列的合作伙伴选择终止合作。2017年2月,安德森肿瘤中心在投入6200万美元后终止了和沃森健康的合作关系。这是沃森健康项目出现问题的信号,业界由一开始的满心期待变成了疑问重重。同样在2017年2月,美国德克萨斯大学宣布关闭沃森合作项目;5月,风投公司Social Capital的创始人Chamath Palihapitiya 在 CNBC 上直言:沃森就是个笑话,IBM的专长其实是通过强大的营销和市场体系,以及信息不对称,让消费者为他们并不了解的服务买单。
其次,等待沃森的是大规模裁员。2018年上半年,据美国媒体The Register报道,IBM内部消息人士透露,沃森健康部门要解雇大约50%—70%的员工。这一消息引发了全球范围关注沃森肿瘤项目者的巨大震动。毫无疑问,裁员举措意味着IBM 沃森在医疗健康领域遭遇重挫。对于刚刚进行大量收购正准备大展宏图的IBM来说,这无疑是个晴天霹雳。
在短短的两年内,沃森从香饽饽变成了许多人抨击的“江湖术士”。那么沃森健康为何走到了今天这个地步呢?
商业角度原因——“人”财两空
虽然IBM宣称沃森肿瘤系统能够在极短时间内诊断肿瘤和给出治疗方案,且诊断结果准确率高达93%,但是依据媒体报道,在实际的使用中,沃森肿瘤并不像IBM承诺的那样好用,会带来未知的风险。丹麦一个医院在一份研究中称,沃森给出的诊断方案与专家给出的仅有30%的符合度,所以该医院拒绝采购沃森系统。《明镜周刊》指出,德国两家机构的测试表明,在实际应用中,沃森对于那些症状特殊的病人会开出致命的药物。我们在这不去追究这些媒体报道的是否属实,我们单单来看沃森现在面临的困境吧。
在医院实际使用方面,几乎所有用过沃森系统的医生都认为沃森只能充当辅助系统,它给出的治疗方案与传统方案没有差别。佛州朱庇特医疗中心于2017年开始使用沃森帮助肺癌、乳腺癌和妇科癌症患者的临床护理。该院胸外科主任K. Adam Lee说,人类医生普遍认同沃森的建议,但它很少会对治疗造成影响。如果沃森的诊断结果与专家们的结果几乎一致,那么对于患者来讲使用沃森系统能带来多大收益就要打上一个大大的问号。《财经》曾以北京某医院的一位三阴乳腺癌晚期患者作为案列进行过介绍,沃森提出了使用奥拉帕尼治疗,这与专家们给出的方案并没有什么区别。这让患者家人无比失望,专家给出的治疗方案收效甚微,在花费高昂费用后,沃森却提不出任何不一样的方案来解决目前的危局。这无疑与IBM最初宣传的能挖掘新的有效治疗方法、解决癌症问题大相径庭。
沃森较人类专家最大的优势是速度快,最快只需十分钟便可给出最终结果。但是这种快有多大的意义?就实际医院使用而言,沃森给出的诊断结果和治疗方案只能作为参考意见,最终做决定的还是谨慎的医生们,医院依然会进行大量的临床研究,毕竟谁也无法承担误诊风险。一旦出了问题,谁来负责,沃森这个计算机吗? 于法、于理、于情,医生都只会把沃森当成一种重要的、能够弥补医生知识或经验不足的辅助工具。
据了解,沃森在国内的使用价格是6000元一次,由患者支付,费用可以说是相当的高昂。也许一开始,凭借着AI医生这个噱头,许多人愿意一试,但随着沃森的神秘面纱被揭开,越来越多的人发现,沃森并不能改变他们的命运,与普通医生无异,又有多少人愿意掏这个钱呢。一旦患者不愿掏钱,对于沃森来说就是致命一击,毕竟IBM不是来做慈善的。像沃森这样的商用系统一旦失去收入,接踵而来的必然是失败。财务数据显示,IBM已经连续21个季度总营收下滑。
另一方面,由于训练阶段的投入过大,收益不明显,沃森的大量合作伙伴在近两年来纷纷选择与沃森终止合作关系。安德森肿瘤中心就是其中一个,自2012年以来,安德森肿瘤中心投入6200万美元用于与IBM合作训练沃森系统,然而巨大的投入却与收益完全不成正比。训练出来的产品效果与IBM当年做的承诺相去甚远。对于沃森的数据训练又像是个无底洞,不断投入却让人看不到希望。IBM前员工和前客户的医院管理人员说,IBM低估了数据融合的复杂性,虽然收购了大量数据,在融合各种各样的数据时发现需要花费难以想象的人力物力,还没开始训练,就让人筋疲力尽。在巨大的经济压力和暗淡的前景面前,各个合作伙伴只能选择终止合作,留下一个半成品。
投入产出不成正比,合作伙伴纷纷离弃。多年来投入近百亿美元,实际使用效果不佳,饱受质疑。在舆论与经济的双重压力下,IBM的日子并不好过,面临“人”财两空的局面,沃森的前路蒙上了一层阴影。
技术角度原因——“三岁孩子”
那么沃森为什么在实际应用上和预期的效果差别如此之大呢。我们从技术的层面上简单分析一下。沃森需要获得足够多的数据,通过不断学习给出可能的答案。在这一过程中,当它给出正确或错误的答案时,我们要不断纠正它来提高准确率。
一方面,沃森的这种训练模式导致了在常见癌症的诊断上只做到了求同,却做不到求异。常见病例的医学专业期刊、医学书籍、论文研究数据以及临床案例的确非常丰富,然而,实际情况是沃森在大量训练后给出的治疗方案与人类专家给出的大同小异。如何做到求异,即让沃森能够给出不同的有效的治疗方案迫在眉睫。目前,沃森还做不到产生新的“思想”。这就是人工智能在垂直领域应用中的三大要素中后两个要素“模型和算法”的问题。
另一方面,制定特殊癌症的治疗方案通常比较复杂,沃森要给出的东西未必是我们早就教它的。事实上,我们也很难教它。其中最大的障碍在于数据,沃森需要特定类型的数据,用来训练系统。在多种环境下,数据供应严重不足,很难获得。在解析沃森的数据中我们发现,在罕见病例研究中,本来应该喂给沃森大量的真实数据从而找到新的治疗手段,由于罕见病例数据的极端匮乏,实际上沃森被灌了一堆没什么用的假想数据,而并不是真正的病人数据。这种通过假想数据学出来的 AI,准确性可想而知。这就出现了罕见病例中沃森的误诊情况。这就是人工智能在垂直领域应用中的三大要素第一个要素“数据”的问题。
要训练沃森在X光片中识别恶性肿瘤还是比较简单的。如何给出有效的解决方案,大大超出人类的已知范畴,即沃森既要“消化”一系列信息,例如并发症、医疗指南、临床数据、药物的效果和副作用等,又要找出它们之间错综复杂的关系,而其中很多东西资深的医生和专家都还没搞懂。由于缺乏罕见病例数据,沃森的训练也跟不上进度,当前癌症的发展速度已经超过了IBM能够更新沃森系统的速度。让AI本身去治疗重大疾病,无论是技术能力还是存在的巨大安全风险,以目前的科技水平来说,在实现难度上显然高出了一大截。
然而IBM小看了这些技术上的难题,急于将沃森推上舞台,急于在全球部署沃森医疗系统,导致了现在骑虎难下的局面。在技术上,沃森还是个“三岁孩童”,IBM想靠沃森这个半成品挣钱,未免太想当然了。
明日展望
凭借着IBM这块金字招牌和吸引人眼球的表现力,沃森在节目上一炮而红,然而一味地吹嘘也许能带来一时的盛名,却经不起时间的考验。当人们发现沃森健康完全达不到自己所期望的那样,且费用昂贵,之前的一切宣传、承诺都是空头支票,即使你是IBM,人工智能界的老大哥和风向标,依然可能沦为一个不折不扣的笑话。
但是,技術是通用的,不必在一棵树上吊死。虽然沃森在医疗领域的部署可以说是失败的,但是沃森在其他领域也可以进行探索。有报道称沃森借助大数据和人工智能还将服务领域成功扩展至天气预警领域,沃森也会在未来参与到农业的无人机运作和监控食品安全整个过程等多项实际应用领域。心急吃不了热豆腐,IBM在医疗领域的改革步子显然迈得太大,想一口气解决肿瘤的治疗问题,结局令人唏嘘。但是作为探索了半个世纪人工智能的IBM,如果能够吸取沃森肿瘤的教训,利用好沃森平台本身的优越性,调整好前进方向,脚踏实地的研究,定能实现沃森LOGO所展示的“智慧地球”的远大理想。