苑苏文
一张巨大的由算法引擎织成的细密的网,是口罩、核酸检测与隔离之外,中国阻止新冠病毒复制传播的另一大利器。到了新冠病毒肆虐的第三个年头,这个数字防御长城已趋近完善。在有14亿人口的中国,每个人都能通过智能手机调取一张健康码。这是在红黄绿间变化的二维码或条形码,三种颜色在后台由大数据算出,提示持码人不同的感染风险状态。
毫无疑问,用以检测每个人健康风险的“底层数据”,涉及大量个人隐私。但政府相关部门及企业人士都保证,对于这些隐私信息,企业仅提供技术支持,并签署了严格的保密协议。大数据已成为国家战略,自2021年9月1日起施行的《中华人民共和国数据安全法》,也为数据的安全上了一道“紧箍咒”。
健康码的第一行代码已经写进了历史,更准确地说,它已经成为中国国家博物馆的馆藏。玻璃柜里的那行代码,创建于2020年2月13日晚8点34分,是浙江省健康码引擎的开端,并在40个小时后上线测试,这是全国第一个省级健康码,脱胎于几天前的杭州余杭区健康码和杭州健康码。
2020年2月4日,余杭区就提出探索复工复产时疫情防控的数字化方案,“全人群覆盖+全流程掌办+全领域联防”。公开报道显示,依托于支付宝、钉钉、阿里云的技术力量保障,2020年2月5日凌晨5点,诞生了余杭健康码的第一个版本,在以小时计算的迭代升级中,健康码在24小时内推广至杭州,又在几天内推广至浙江省。防疫新理念“病毒式”传播,一周之内已经落地超过100城。到了2月15日,国务院办公厅电子政务办指导支付宝、阿里云加速研发全国一体化政务服务平台疫情防控健康码系统,加速了健康码走向全国。
各地在健康码探索中,并不全都依赖“互联网大厂”。在杭州往西南1650公里的贵州省贵阳市,云上贵州大数据(集团)有限公司(下称“云上贵州”)承担了贵州健康码的开发。从2020年2月13日到2月18日,云上贵州团队只用了6天便完成贵州健康码的全省上线。
云上贵州技术开发部副总经理万永波带领团队完成贵州健康码的开发,他告诉记者,在开发健康码的前两天,他和团队成员通宵达旦地与贵州省大数据发展管理局、省政府办公厅、卫健委和以公安厅为主的贵州省疫情防控领导小组社会防控组(简称“社防组”)等部门沟通,收集需求。“白天去各个部门,晚上回来汇总需求,由领导统筹方案,第二天白天再去汇报”。
调研工作结束后,就是紧锣密鼓的部署开发,既包括应用系统的部署,也包括数据收集的部署,其中,数据收集采用了最原始的方式,派人去各政府单位“驻点”。
“信息流转非常难,我们纯用人力去跑,派了很多人到大數据局、办公厅、卫健委和公安局去驻点,拿到他们的数据之后传回公司。”万永波的数据处理团队有6个人,3人分为一组,12小时工作制,两班倒,“只要那边数据来了,这边就马上处理入库”。
能在几天之内将政府数据全部聚拢,得益于贵州省的数据发展战略。2014年,“云上贵州”注册成立;2016年,贵州省成为首个国家大数据综合试验区,并成立了省大数据发展管理局,其致力于打造“一云一网一平台”,等到了2020年,已经拥有了打通政府各部门“数据孤岛”的基础。
在2021年12月29日,国家发展改革委等部门下发通知,加速推进国家“东数西算”工程,启动建设全国一体化算力网络国家枢纽节点,节点共有8个,分别是贵州、甘肃、内蒙古、宁夏,以及京津冀、长三角、成渝、粤港澳地区。西部发展大数据,有成本低的好处。记者获悉,贵州健康码的开发和运营,至今仅投入不及东部某省该项目投入的1/10。
等到疫情过去,健康码的使命并不会结束。只要维持核心的数据状态,持续将各方面数据打通,就能实时监控每个人的健康状态,如果没有疫情,这些新的机制和经验,也可用在其他应急事件上。
疫情阴霾下,健康码的后台服务器是永不停歇的大脑,不断计算着每个人的健康状态。贵州数据宝网络科技有限公司产品研究院院长李可顺告诉记者,每个人的健康状态以字节的方式存储于健康码的服务器中,并随着防疫政策和疫情形式的改变不断刷新,当居民出示健康码时,只是从后台调取这个状态,并显示为不同颜色的二维码。
二维码于20多年前由日本人发明,随着移动支付的兴起,成为近几年移动设备上最流行的编码方式,它比传统条形码能存更多的信息。李可顺指出,大多数城市选择不同颜色的二维码展示居民健康状态,目的是为了保护隐私数据安全。“健康码的小程序一般依靠微信或支付宝等第三方平台,只显示二维码可以保证隐私数据掌握在政府手上,不易泄露”。
健康状态经由哪些数据判定?李可顺介绍,健康码背后包括四大数据,第一是公安部门的户籍信息;第二是自己申报的健康数据,比如体温及当前症状;第三是行程数据,既包括通信管理部门协调运营商提供的手机信令位置,也包括铁路和航空交通出行数据,以判断是否到达过风险地带;第四是由卫健疾控部门提供的就诊信息,判断是否与确诊者有交集。
贵州省大数据管理局应用推广处处长洪浩告诉记者,在贵州健康码的运营过程中,主要关注重点人群,其中包括通信管理局推送来的与确诊者或密切接触者的“时空伴随”人员、社防办排查推送的高风险地区入境人员,以及卫健系统推送的确诊人员或密接和次密接。重点人群被分成高风险人员和中风险人员,获得这些人员信息后,健康码会响应,并与省社防办联动,开启进一步的排查和处置。
防疫变得越来越精细化。过去,中高风险区域往往以城市为单位,通信管理局将有过这些风险区轨迹的人员悉数推送来,人数众多。但现在提出了“时空伴随”概念,风险范围进一步缩小。“时空伴随”主要靠手机信令来定位,它的规则是,在方圆800米的范围内,与风险人员的手机信令共同停留大约10分钟时间,就会判定可能会有接触,会被标记为风险人员的时空伴随人员。
李可顺指出,尽管目前各地数据已共享至全国统一平台,但仍是以省为单位在服务器后台分析数据。在重点区域,则不断通过刷新,更新每个人的最新动向与健康状态。刷新频率和当地是否存在疫情传播风险有关。“就像我们刷网页,刷新是耗流量的,就得花钱,所以如果没有疫情刷新就慢,如果在重点区域就会不断刷新,监控人员流动可能带来的风险。”他指出,像是上海浦东机场这类出入境人员较多的地方,每人信息的刷新应该“特别快”。
在大多数地方,除了要亮健康码,还需要亮出行程卡。行程卡是由工信部推出,基于运营商的基站数据,判断人14天内的行程,如果有城市存在中高风险区,城市名称上会用星号来标识。“目的就是为了更精准地定位。”李可顺说,疫情之下,健康码给人员流动提供了保障,让人们能安心复工和通行于公共场所。“健康状态掌握在政府手里,假如有感染风险,马上就能定位到此时此刻的位置,然后再进行网格化的处理,有一整套响应机制和流程。”
在健康码推行初期,各地单独立项制作健康码,信息采集标准也有所不同,因此难以达成互认。李可顺指出,主要是各省份单独立项制作健康码,标准和数据使用维度都不同,甚至在后台留存的居民健康状态,也使用不同的字节去记载,这令各地相互转码也很困难。
在2020年上半年,各省份健康码数据没有共享平台。洪浩回忆,2020年3月前后,贵州省联系了人员来往密切的广东和浙江,进行了数据定向交换。到了2020年下半年,国家设立了“全国一体化政务服务平台”,各省份就将数据上传至国家的平台上,推送更新内容也是每日一次。
为实现各地的健康码信息互通互认,国家还制定了统一的数据采集标准,其中既包括数据采集的类型和维度,也包括数据字段的标识,以便数据互通。万永波介绍,贵州健康码上线之初到现在,已经经历了150多次迭代升级。其中包括增加了核酸检测预约登记功能、疫苗接种查询功能,以及健康码和行程卡共同显示。
近些天来,一些地方进行全城核酸检测时,健康码崩溃,引发热议。“据我了解,某地的健康码之所以崩溃,是因为核酸检测系统的查询量并不能承载健康码查询的并发量,导致核酸检测系统查不出数据了。为了避免这种情况,我们贵州健康码使用了中间库。”万永波说,将核酸检测分离为独立的系统,检测数据收集后,将会被传递到中间数据库,当健康码用户需要查詢核酸结果,再连接到中间库去读取,“在这种情况下,假如核酸检测系统宕机了,也不会影响健康码系统的正常运行”。
万永波还介绍,为了减少服务器宕机时的影响,他们在服务器集群采用了“高可用”形式,即将几十台服务器建立成为集群,这其中若出现一台或多台服务器宕机,并不影响整体集群的使用。另外,他们还在联通和移动两个节点分别部署了健康码后台,当一个节点出现故障,能够迅速切换到另一个节点。根据最新的压力测试,贵州健康码的核酸检测系统,每秒能完成1万人的核酸检测,“一分钟就是60万,完全能承受贵阳市的800万人口”。
不过,尽管如今各地数据已经打通,但在核酸检测方面,仍不能做到异地同时查询。其中一个原因,与国家信息平台数据更新速率有关。这意味着,当你到达新的地方,此前的核酸检测报告有可能无法同步在当地健康码上,仍要按照当地政策重新检测。
随着健康码系统的愈发完善,疫情防控也将愈发精准。根据相关政策,国家要求不能以区县以上为单位赋码,要精准赋码,避免“一刀切”。如今,风险区的划分也越来越小,多以小区为主。不久前在上海,甚至将一家占地面积20多平方米的奶茶店划为中风险地区,被成为“史上最小”,与之一墙之隔的理发店都可以正常营业。
但健康码仍有漏洞。对于不使用智能手机的儿童和老年人,目前采用登记为同行人的方式,如果老人单独出门,则使用打印的纸质二维码。李可顺说,目前业内正在研究公路交通中以车为主的通行码,加强来自风险地区的道路管控。另外,广西等地,已经推出不需要联网即可查询的健康码,“类似于缓存机制。”他说,健康码小程序会有个定期轮询个人健康码状态,存在手机,联网时查后台实时健康码,断网时直接提取缓存的健康码。
李可顺说,未来健康码还将可能富集更多功能,比如绑定银行卡进行支付,以及在医院就诊。等到疫情过去,健康码的使命并不会结束。“我们做了这么多底层数据的工作,肯定是有用的,有价值的。”他说,只要维持核心的数据状态,持续将各方面数据打通,就能实时监控每个人的健康状态,如果没有疫情,这些新的机制和经验,也可用在其他应急事件上,“比如抢险救灾,再比如追踪资产和逃犯”。
◎ 来源|中国新闻周刊(有删减)