李雅琪
《IEEE Spectrum》2019年4月发表特别报告《IBM沃森在人工智能医疗方面的妄言与食言》,细数了沃森健康曾经设立的目标与现实难以兑现的窘境。此文一经发表,再次引发了产业界对人工智能高速发展的忧虑与反思。因此,有必要全面审视人工智能应用发展过程中出现的问题与思维误区,为后续高质量健康有序发展提供借鉴。
IBM沃森面临的三大困境
一是发展后劲不足。IBM沃森成立之初前景看好。早在2011年IBM就开始布局人工智能医疗,同时承诺将在两年内推出首批医疗保健产品。2015年4月,IBM成立独立的沃森健康部门,并于一年后投入约40亿美元收购了包括Explorys、Phytel以及Merge Healthcare 等在内的数家医疗数据公司。短短4年间,IBM汇聚了人工智能医疗保健领域应用所需的技术、资源与人才,在智能诊断、临床决策等领域的技术布局一路高歌猛进,成为媒体宣传和企业争相效仿的标杆。然而,截至目前,IBM曾经的承诺并未兑现,市场推广阻碍重重,已出现治疗方案导致患者死亡、营收下滑、相关业务快速收缩、高管离职,以及大幅度裁员70%等诸多负面新闻,唱衰之声不断。
二是医疗AI产品落地困难。IBM沃森开展了广泛的项目合作,成果却十分有限。自2011年起,沃森已发布近50份关于智能医疗的合作研发公告,涉猎领域十分广泛,包括面向医生的临床决策支持工具研发,以及面向消费者的健康管理工具研发等,旨在打造全面的新一代医疗保健产品。这些项目大多为人工智能技术与医疗行业融合应用的首次尝试,虽具有重要价值与意义,但多数至今尚未产生可商用的医疗健康产品。2016年,安德森癌症中心在花费6200万美元之后,依旧选择终止与沃森健康的合作,只因深层次合作研究之后发现,深度学习与医疗护理的现实之间有着根本性的不匹配,深度学习尚无法独立地从医学文献的最新进展与患者的电子健康档案中提取有效信息。
三是数据获取存在梗阻。沃森用于技术研发的医疗数据资源十分有限,一方面,由于癌症的病历数量相对其他常见临床病症本身就十分有限,样本数据不足,可用于深度学习模型训练的成功案例就更为罕见。另一方面,由于企业与医疗机构之间的有效沟通渠道尚未打通,获取病人真实病历面临多重阻碍以及高额的资本与时间投入。因此,沃森智能癌症诊断工具的大量训练时间都用于掌握肿瘤学家设计出的理想化病历与治疗方案,即便是仅有的635例真实病历数据也多集中于肺癌,不具备普适性。將沃森的癌症治疗建议与医院肿瘤专家的建议进行比较后发现,沃森的智能诊断方案差强人意。尤其是在韩国加钦大学吉尔医疗中心,为656名结肠癌患者提供的诊断建议与医生的医疗方案的一致率仅有49%。
IBM沃森项目折射出人工智能应用的四大误区
夸大宣传,名实难副。不仅是以沃森为代表的智能医疗行业,其他领域的人工智能应用也是名实不符。以无人驾驶为例, 2018年无人驾驶企业纷纷提出年内实现无人驾驶商业化运营计划,看似是无人驾驶元年的2018年,却成为无人驾驶商用的平台期,所谓的“无人驾驶”实则只是 L2、L3 级别的有条件自动驾驶,“商业化运营”也多为短期封闭园区内的应用示范,众多商业计划纷纷“跳票”,甚至还有几项在世人瞩目下以失败告终。目前,业界尚缺乏统一的人工智能测试标准,其产品无法被量化评价,企业对人工智能产品进行过分夸大的宣传,不利于行业的长远健康发展。人工智能的确未来可期,但目前应用落地尚处探索阶段,终端产品的性能与用户体验仍需提高,过多的夸大宣传与造势炒作,一方面会给公众以不切实际的想象与期望,另一方面,还容易引发资本界的无序跟风投机,进而激发行业泡沫。
急功近利,根基不稳。人工智能的技术能效在很大程度上取决于用于模型训练的数据数量与质量。然而,在很多情况下,高质量的数据样本非常稀缺,且获取数据的过程面临重重阻碍,相关企业对此类基础环节不够重视,在投入与积淀严重不足的情况下,急切地将尚不成熟的产品推向市场,引发一系列“质量”问题,为人工智能技术商业化落地平添阻碍。截至2018年5月8日,全国有人工智能企业4040家,其中拿到风险投资的人工智能企业仅有1237家,仅占30%,仍有70%的公司 拿不到风险投资。全球新增人工智能企业数量自2016年达到2733家巅峰后,便开始逐年下降,随着人工智能创业热潮趋于理性,未来市场将会更加注重核心技术与落地能力,急功近利的布局策略终很难在市场立足。
研用脱节,落地困难。目前除计算机视觉、深度学习等相对成熟的人工智能技术催生出的智慧安防、智慧交通、精准营销等垂直应用场景外,医疗、制造业等大多数传统行业的业务需求与人工智能前沿科技成果之间尚存在较大鸿沟,人工智能技术的全流程应用尚未实现。据统计,目前人工智能技术多聚焦于计算机视觉,其中68%的计算机视觉技术集中应用于智慧安防、智慧交通等场景。多数人工智能创新成果与实体经济融合尚处于起步阶段,人工智能创新成果在行业推广应用时,仍面临数据、标准、 资质、安全评估等多种壁垒。
迷信深度学习,以偏概全。深度学习仅是实现人工智能的路径之一,且并非一项完美的技术路径。一方面,当前的深度学习本质上是一项黑盒技术,其训练过程具有难以解释、不可控制的特点,随着人工智能应用复杂度、需求数据量的指数式增长,机器学习尤其是基于多层神经网络的深度学习的复杂程度,将愈发超出人类的理解和控制范畴,在快速进化过程中极易偏离预设轨迹。另一方面,基于深度学习的人工智能技术过度依赖数据,而数据建模与真实生活之间却很难直接划上等号,数据采集时也很难保证完全合理。比如,亚马逊智能简历筛选工具歧视女性,就是由于过去十年里,男性在科技行业从业人数中占有主导地位,用于训练的样本数据中大部分简历来自男性,导致其误以为女性简历不具备竞争力,在抓取关键词时更偏向男性。
对策建议
筑根基。人工智能发展要一步一个脚印地向前走,强化人工智能的基础性研究,切勿急功近利。一是以技术基础理论、算法 为核心,系统谋划和组织攻关,促进共性技术的研发和应用推广,夯实发展基础。二是开发人工智能算法所需的数据资源,构建基础设施等关键环节,推动人工智能软硬件平台及生态建设。三是前瞻布局脑科学、计算机科学等领域的基础理论研究,探索人工智能发展的最优路径与根本目标。
促应用。积极培育人工智能创新产品和服务,推进人工智能技术产业化,形成科技创新和产业应用互相促进的良好发展局面。一是聚焦智慧交通、智能家居、智慧安防等需求明、范围广、基础好且可形成示范带动效应的领域,积极推广人工智能技术应用。二是提供更多有代表性的应用场景,为人工智能创新成果提供展示与示范应用平台,推动其实用化、产业化。
强监管。一是强化智能医疗、智能金融等多种人工智能应用的事中事后监管,避免出现“伪人工智能”等违规应用。二是建立健全法律法规,确保人工智能技术向商业化产品转换过程中的安全可靠,规范人工智能产品宣传,避免夸大其词,误导消费者。