运用大数据等手段加强疫情的溯源和监测,这是对大数据作用的肯定,也是对互联网界的一个要求。
手机已经成为
另一张“身份证”
2018年我国移动通讯普及率是112%,全球是106%,扣除一人多号的情况,仅计算独立移动通讯用户的普及率,我国是82%,接近发达国家的水平,移动互联网的普及率高于全球的平均水平。而且中国实行手机用户实名制,从手机用户就可以识别持有人的身份。
手机可以关联持有人的位置
一般手机在待机的时候,用户会从一个小区移动到另一个小区,这时手机要不断接收基站发出的测量信号。因为用户可能是在移动的,而蜂窝半径又比较密,因此,更新的时间要比较快。目前的更新速度是秒级,可以说具有实时性。手机定位主要是利用基站,定位精度目前是一兩百米,5G基站更密,定位精度就更高。
全球导航卫星+数字地图
可提升定位精度
当然,除了基站定位以外,用全球导航卫星和数字地图也可以定位。现在的智能手机占比能够达80%以上,都具备全球导航卫星的接收能力,定位的精度一般达数十米。数字地图公司可以用一些方法来扫描街道,定位精度甚至可以到每一栋楼。根据某数字地图公司的大数据地图,可以溯源武汉春节前将近500万人到了哪些地方。
国际上通常用一种叫SEIR的模型来分析疫情的传播。它将人群分成四类,I\E\S\R。I就是已经感染病的人群,E是密切接触者,S目前是健康的,R是运算结果康复的。中国的学者提出了一种改进模型,增加了P和Q,P是疑似人群,Q是确诊人群。现在我国也在利用这样的模型分析来计算传播走势。
目前,中国的修正模型,考虑了政府的采取措施和大众对于防疫的意识,利用电信大数据,可以把流入流出的一部分人也考虑进去,可以使得这个模型更精确。
基于卫建委+交通+工信数据查找密切接触者
我们把卫健委、交通系统、工信部门的数据组合起来,可以找出密切接触者。比如说,卫健委可以知道确诊患者的姓名、身份证号,交通部门可以给出这个患者近期乘坐过的航班、车次数据,工信部提供所涉及航班、车次中人员的手机号码。根据手机号码,地方政府可以找到密切接触者,这是从官方渠道进行查找。实际上平台也可以开放,便于近期有出行经历的人群查询平台查出所坐的航班和车次上有没有确诊患者,这样就可以很好地发现密切接触者。
电信疫情大数据平台
用于个人自证无疫区行程
通过手机定位,是可以知道这个用户是不是来自疫区,或是到过疫区,但是这种数据形式不能直接提供给街道、小区和乡镇,出于对隐私保护的考虑,工信部统筹三家运营商,提供了用户行程的服务,限本人查询。有了查询结果,就可以向当地的用工单位、街道、小区来证明自己没有到过疫区,这就是自证。据了解,目前已开放查询上千万人次。
各类大数据在疫情防控中的作用不同
除了电信和互联网公司的大数据以外,事实上还有其他大数据在这次对抗疫情中发挥了重要作用。
电力大数据帮助把握复工趋势
国网电力杭州公司,依据1000多万条数据收集,开发出大数据分析的算法,能够很好地知道某一住家中有没有居家隔离的人,有没有独居的人,社区以此来判断是不是做有针对性的服务。
利用电力大数据,也可以知道复工状况。根据用电量,广东2月14日用电量已经是非疫情时期的60%,可以简单推算出复工率约60%。温州,属于疫情比较严重的地方,用电量和复工率均只有10%左右。可以说通过电力数据可以比较宏观地掌握复工的趋势。
医疗大数据助力智能诊断
对于新冠肺炎的确诊,除了核酸检测,CT也是重要的判断根据。利用大数据,结合人工智能技术,可以把CT照片还原成一个“三维的肺”,更容易判断是否有纤维化、毛玻璃状表现。同时,还可以根据医疗的经验,开发出感染肺炎患者的CT影象大数据分析评价系统,这些CT照片可以放在系统上进行分析,帮助医生进行病灶判断。
物资大数据优化医疗紧缺物资的生产组织与调度
海尔开发了疫情医疗物资信息共享资源汇聚平台,一方面连接780多家医院,另一方面联系有需求的社区,以及能生产这些医疗物资的500多家企业。
湖北有一个医疗物资需求平台,是由志愿者开发的,它“爬取”网上的数据,按城市医院类别分类,登出需求、运输和联系方式。
四川也开发了防控应急物资的管理系统,把物资的入库、调度、审批、库存、日常消耗需求汇总在一起,提高了应急物资配置的调度效率。这些都是很好的实践。
大数据接下来要如何发力
除了现有的成果,大数据还要在接下来的一段时间里继续为疫情防控输出力量。
相关数据的融合将能得到更有价值的结果
这次疫情也是在考验联防联控协调调度机制,考验包括跨部门大数据的协调能力。应推广线上专项排查APP,不用手写登记,用手机扫描身份证,测量体温,数据自动联网。同时,可以记录下来现在到药店购买发烧药、咳嗽药的人的实名数据,辅助防控排查。另外公交卡、网约车的数据也要能充分结合起来。
大数据协力企业复工
随着复工复产的开展,人员流动不可避免。但是人员流动密集又有风险,企业面临两难。杭州采用一种绿红黄三色的健康码管理方式,区别用户是不是接触过确诊患者、疑似患者,是不是来自重点疫区,以及隔离时间长短,以此对不同人群分类管理。健康码连接到云端,运用大数据手段进行数据匹配,查出不实信息。
大数据与隐私保护
有些人认为大数据是双刃剑,无法很好地做到隐私保护。实际上,目前电信的大数据只限于疫情的管控,疫情结束以后,不会再保留有关的原始数据。特别要注意的是,除了国务院卫生健康部门依法授权的机构以外,其他任何单位和个人,不得以疫情防控,治病防治为由,未经被收集者同意收集用户的个人信息。有一种方法很值得推广,就是建立疫情大数据分析调试平台,使原始数据可用不可见。
卫健委、交通运输部、公安部、工信部等可以上报数据的样本,帮助疫情大数据分析调试平台来调试算法和程序,一旦调试好程序,再下发到相关部委,在相关部委的各自范围里运行并产生结果。最后向上汇报的结果已经不是原始数据了。通过这种手段,不改变数据的归属所有权和存储位置,使用了不含敏感数据的分析结果。
大数据的应用需要有法律保证
《传染病防治法》规定,有关部门要报告疫情和监测,但是没有明确哪一级地方政府有权收集当地运营商跟疫情有关的数据,也没有明确政府应该开放什么数据,应该公布什么信息。所以,建议尽快出台《传染病防治法》的实施细则,要明确省市政府对疫情防控数据的收集权限和政府各个部门,以及相关企业提供疫情防控有关数据的责任。
(本文根据邬贺铨院士的公开演讲整理而成,未经本人确认。)