贺涛 张利 刘浩南
没有数据,不成AI。
数据同样是医疗AI引擎的宝贵燃料。医疗大数据与AI结合,不仅会提升临床诊疗效果,还可应用于药品研发、健康保险等领域,想象空间巨大。
医疗数据更为敏感、更私密,获取的代价也就更高。获取途径主要有,企业自有数据、政府的公共数据和产业合作数据。
在各国政府的公共数据中,有相当多的医疗数据可以挖掘。如美国联邦政府在Data.gov数据平台开放的数据,包含医疗、商业、农业、教育等多个领域的13万个数据集。
中国在公共数据的开放上,更为保守。直到2015年,大数据上升到国家战略层面,推进数据资源开放共享成为应有之义,尽管如此,还需要产业界不断促其加速,同时要有些耐心。
产业合作数据是当下最为关键的“金矿”。AI公司、医疗相关公司,纷纷通过和医院、行业公司建立合作关系,来获取更多数据,在这一点上,中外情况相同。比如IBM一开始就是通过和纪念斯隆-凯特琳癌症中心合作获取病历、文献等数据,训练人工智能“沃森”成长。
数以十亿计的年门诊人数,加之医疗AI技术离不开医生标注数据和提供训练支持,使优质的医院和医生的价值在这场合作中飙升,考验医疗AI公司的,除却研发能力,更重要的是如何让合作者兴奋起来。
数据就像一个个孤岛,在各医院中沉浮,甚至国家卫计委也很难联通这些数据。
“卫生主管部门推不动,硬来也不行。”汇医慧影创始人兼CEO柴象飞告诉《财经》记者,打通数据壁垒,一定是通过业务、场景和需求。
比如患者有转诊需求,通过医疗卫生机构的数据共享平台,社区医院可以帮助签约居民预约专家号、向上级医院转诊,大医院可以让康复病人下转,同时,基层医生也能看到病人在上级医院的就诊记录。
“数据共享一定是由商业和利益连接起来的,否则医院没有动力。”蓝驰创投合伙人陈维广对《财经》记者分析。
在1300余家三级甲等医院,沉淀着中国最优质的医疗大数据,是医疗AI公司们竞逐的对象。
而医院方使用AI产品,并没有付费的意愿。因为即便数据在手,还是要靠医生发现临床问题,且AI真正能给三甲医院带来的帮助还不多,双方最常见的合作方式是医院提供数据,公司来分析,共享成果。
广东省人民医院放射科副主任医师刘再毅担心,这样的合作不会长久,有些将分道扬镳。理由是,AI公司与医院的目标存在根本分歧,前者为钱,后者为名。
顶级医院的医生们更关注偏临床的研究,目标是发表论文;而创业公司想做的是产品,比如做病灶的检出,但这对于发论文价值不大。在北京大学口腔医院信息科主任曹战强看来,一旦双方合作的产品投入商业化,医院方面肯定还是想分一杯羹。毕竟,医院的资源贡献大。
这样的担心还没有影响到新玩家云集在医疗AI,尽管现阶段多为小规模研究,未来形成应用到临床的辅助医生诊断,乃至自动诊断的产品,还需要一定规模的多中心临床试验验证。
这将是一个漫长的过程。期间,只有那些能与医院保持良好关系的公司,才能持续和医院合作并推广业务。“医疗行业非常讲究信任,相对比较封闭保守。”推想科技CEO陈宽向《财经》记者抱怨。
此前一些做医疗产品的企业已经积累了一些数据,且和医院更紧密。像CT这一类在医院里运用成熟的技术和产品,在使用上已成体系,后来者如推想科技,想推基于CT开发的医学影像AI进入,难度很大。
医疗机构是相当传统的产业,制度也好,人的意识也好,他们选取合作方的标准,与互联网公司的视角大不相同。技术、产品优化程度这类产业的“黄金标准”,在医疗机构有时不那么重要,可能合作时长、品牌认可度等才是决定性的因素。
亿欧智库医疗产业分析师尚鞅在调研医院信息管理系统(HIS系统)时发现,医院最终选择的HIS系统研发公司,大多都是此前与该医院有其他业务联系。如今,医院引进AI也如出一辙。
“放眼整个行业,医疗影像AI会率先支撑基层医疗。”基于这一判断,阿里健康于2016年3月投资2.25亿元,持万里云医疗信息科技(北京)有限公司(下称“万里云”)25%的股份。
AI的筛查技术已实现大幅突破,准确率堪比高资历影像医生。但让万里云独获青睐的,还是母公司万东医疗(600055.SH)坐拥全球第二大影像产品制造基地,是中国最早的医疗影像公司。母公司的医院客户资源丰厚,多年深耕细作,助力万里云建立起10家远程影像诊断中心,成功签约了2000多家医院用户。
阿里健康不仅资金入股,还投入AI技术全力支持。2017年7月,阿里健康在万里云平台上首先发布“Doctor You”AI系统,主攻医疗影像的辅助诊断。阿里健康副总裁柯研预测,将来有可能很多基层医疗机构就不用再配备专门的影像诊断医生了,而是先交给AI筛查,一些有问题或者看不准的病例交由上级医生来诊断。
在乡镇医院、卫生所等基层医疗机构,操作设备和提供影像诊断的专业人才稀缺。瞅准这个机会的还有柴象飞,他领导的汇医慧影与500多家基层医院建立合作关系。
体检行业,也富集健康數据,AI公司十分垂涎。2017年4月,万东医疗发布公告称,公司控股股东江苏鱼跃科技发展有限公司与俞熔签订了《股份转让协议》,将万东医疗总股本22%的股权作价逾16亿元,转让给俞熔。
俞熔是国内体检行业唯一的A股上市企业美年健康(002044.SZ)的董事长,也是实际控股人。
借着这一交易,万里云尝试把AI的能力输送到美年健康的平台上。美年健康现在有300多家门店。每天,这些体检中心都产生着海量的影像数据。
“未来体检机构门店和业务的快速成长,迫切地需要把AI生产力补充进来,和医生生产力形成更高效更准确的协作体系。”万里云CEO黄家祥告诉《财经》记者。在黄家祥眼中,万里云比大多数的AI医疗公司更有优势的地方,就是在医疗数据和应用场景上,股东们在技术能力和资金上也会持续不断地予以支持。
这看上去很好,但在现阶段,训练AI是当务之急,需要更多的阳性病例来更快地训练提升AI影像的能力,主要还得通过医院端的数据来完成。为医院解决最痛点的问题,也是敲开医院大门的一种方式。
如,中国的癌症发病人数全球第一,约占22%。从科研角度,医生可以从丰富的病例数据中获得研究发现,高质量的研究成果可缓解中国的癌症压力。
然而,医院积累的绝大部分患者病例,都只记述诊断和治疗过程,具体治疗效果并无记录。这个工作本来应该做随访完成,即定期联系曾在医院就诊的患者,了解患者病情变化并指导患者康复。
但实际上,无论国内还是国外,医疗科研中的随访都是一件困难事,医疗资源很紧缺,随访往往被后置乃至停滞了。
“所有医院的医疗数据都有缺陷,这是医院面临的很大问题。”零氪科技CTO罗立刚向《财经》记者介绍,现在他们为医院提供电话随访服务,帮医院管理出院之后的患者,并提供病例数据整理的全套服务,“就是修路,帮医院把数据之路修好”。
现在合作医院的肿瘤数据源源不断地汇入云端,接下来可以考虑如何运用这条路做商业化。双赢的局面是,这对医生和医院产生科研成果大有裨益;对企业来说,能产生科研成果,就有机会产生辅助诊断的AI技术。
从此案例可见,找到合作医院有时也挺容易,关键是抓住痛点。
“大数据是早晚延伸的趋势,打破医院的围墙,一定要讲究互联互通的应用。”这是北京大学肿瘤医院信息部主任衡反修的判断。
中国政府承诺,推动政府健康医疗信息系统和公众健康医疗数据互联融合、开放共享,积极营造促进健康医疗大数据安全规范、创新应用的发展环境。为此,在2016年6月发布《关于促进和规范健康医疗大数据应用发展的指导意见》,规划健康医疗大数据产业体系,在2020年初步形成,并强调“健康医疗大数据是国家重要的基础性战略资源”。
言下之意,既要积极开放共享,又要健全安全保障体系。
现在,大医院已设置网络安全数据领导小组,一般由院长任组长,信息部主任担任副组长,承担数据安全责任。对于数据安全,国家卫计委前副主任金小桃曾表示,个人的健康医疗信息属于隐私保护范围,要依法严格管控保护,绝不能公开或泄露。
解决方案是,对个人数据进行“脱敏”“去标识化”,去掉对个人隐私产生影响的内容,才可以进行大数据的挖掘分析。不过,在理论上还是有漏洞,凭借单一的脱敏医疗数据难以识别患者,但如能获得多个源头数据,聚合后多种数据信息相互重合、印证,便可能造成身份识别,进而导致个人信息权和隐私权受到侵害。
一些国外公司瞅准中国人口众多、数据丰富,也纷纷寻找中国合作伙伴,参与医疗大数据的开发。中方对此往往比较警觉,有些医院出于安全考虑,直接拒绝了国外公司伸来的橄榄枝;相对开放的医院,即使与外方进行合作,也会小心地做出限制条件。如不能把医疗数据传送到境外或者外资公司的云服务器上。
政府层面对信息安全也很警惕,从官员的讲话中时有表露。2017年10月12日,天津市委常委张玉卓到一家医疗AI企业考察时说,“健康医疗数据作为国家基础性战略资源,不能完全交给IBM Waston这样的国外公司,我们应该有本土企业掌握这样的先进技术,利用宝贵的数据,为患者造福。”
“我们不会去碰数据,数据是你们的,不是我们的。”英特尔公司医疗和生命科学集团亚太区总经理李亚东在一次业内论坛上,对着台下的众多医院管理者称。
即便拿数据给国内的合作者,也是小心翼翼,况且由于在此方面法规尚不完善,使得医疗系统对新玩家们敬而远之。
“对我们的合作方,我最担心的是数据的安全。”上海交通大学医学院附属瑞金医院普外科主任医师胡伟国称,即便有合同约定,仍然很担心,“这些数据如果泄露了,还是要追责到我们”。
参照《信息安全等级保护管理办法》,原则上三级甲等医院核心信息系统定级不低于国家信息安全等级保护第三级,即“三级等保”。
这是国家对非银行机构的最高级认证,属于“监管级别”,直接由国家信息安全监管部门进行监督、检查,认证需要测评内容包含了信息保护、安全审计、通信保密等在内的近300项要求,十分严格。
“三级等保”系统一旦发生数据泄露,“相关责任人就有可能坐牢”。北京冠鼎科技有限公司总裁周一民告诉《财经》记者,“三级等保”信息系统受到破坏后,会对社会秩序和公共利益造成严重损害,或者对国家安全造成损害。
在上海市儿童医院院长于广军看来,现有医疗数据的安全规定,过于笼统,缺少细则,缺乏针对性和可操作性。如规定说泄露信息造成损害,情节严重、违反国家法律法规的,依法追究其法律责任。
但哪些信息不能泄露?缺少界定。
美国的健康保险流通与责任法案(HIPAA),是一个强制医疗健康信息保护的主要法案,较好解决了个人隐私保护的问题,备受中国医疗界推崇。哈佛大学统计系教授刘军分析,该法案明确了医疗大数据的“红线”,研究者和企业拿到医疗数据之前,“要填好多表,過很多关”。
国内合法使用医疗数据的界限模糊,令北京大学中国卫生经济研究中心主任刘国恩十分为难,每当研究需要,他去找地方统计局、医保局要数据,都是几经周折,对方才拿出数据,还会小心翼翼再三嘱咐不要泄露数据。
刘国恩也害怕自己一不小心触碰红线,同样,诸多深入其中的企业也是战战兢兢,如履薄冰。
刘国恩呼吁,一定尽快把法律的红线划清楚,“哪怕划了以后,比以前的空间显得更窄一点,但要让业内知道这是红线”。