喻国明 何睿
摘要:文章在对健康信息大数据的来源和分类的基础上,从学术研究和实践应用两个方面,分别阐释了大数据在健康传播与调查研究以及对个人、组织、社会等层面的可能影响。文章对如何运用非结构化的、大规模的、动态化的大数据进行有效健康传播、实现科学化健康管理的问题亦有提及。
关键词:
大数据 健康信息 健康传播
由中国人民大学舆论研究所、国家癌症中心和中国健康中心合作进行的中国癌症健康信息调查中,北京、合肥两地试调查的数据显示,经常用计算机上网的被调查者,有76.3%的人表示会上网获取健康信息;经常使用手机和iPad等移动终端上网的被调查者中有68.8%的人有搜寻健康信息的经历,但满意度和可信度并不高,其中网络健康信息的信任度仅有32.9%。[1]
因此,如何利用众多的健康信息成为亟待解决的问题。不单单是一般民众,对于政府或盈利组织、医疗机构、社会系统来说,如何运用医疗健康信息的大数据实现健康管理的目标,如何利用大数据带来的重大机遇与积极影响,也是十分必要且重要的。那么,在健康传播领域,大数据究竟会给我们带来什么呢?
一、健康信息大数据的内容来源
从目前来看,组成健康信息的大数据的内容主要来自以下几个方面:
1. 电子病历和电子健康档案等数据库。主要记录个人健康状况、疾病状况、就医史及有关疾病案例的症状、治疗信息等。在我国,电子病历和电子健康数据库尚处于建设阶段,将于“十二五”末基本建成。
2. 医疗和健康信息网站,提供医院、医生信息查询,医患咨询、门诊预约、就医经验分享等信息和服务,它通常依托于医院或专业从医人员。
3. 社交网站健康信息。由政府、机构或个人发布的与健康相关的内容,并包含个人的健康行为、健康信息使用等情况。由于发布者多元化,信息质量难免参差不齐。
4. 移动终端发布的个人健康信息或行为数据。完整的数据应当包括时间和地点信息,因此,这一数据也由于移动技术等的出现而较为容易获得。
5. 健康、医疗物联网。指将所有跟病人有关的系统如医生、护士、药品、器械等,系统地按照一定的标准和管理规范进行有序管理。借助于物联网技术,通常利用远程技术实现,如“移动医疗”、远程无线健康监护平台等。
二、健康信息大数据的内容分类
以上信息纷繁庞杂,从大数据使用和挖掘的角度上看,我们可以按照数据的性质和内容对其进行分类,以期更好地探究这些健康数据的有效利用。如从健康关系中最重要的一方——一般个人来看,这些数据可以归为三类。
1. 个人社会基本属性类。通常指一般人口统计学特征,包括年龄、性别、职业、地区、受教育程度、职业、财产状况、联系方式、健康状况等等。这类信息是针对人群分类的重要维度,它们往往与个人的健康行为和健康认知有关,如城市和农村、不同年龄段的人群的健康意识可能有较大差别,而用户的健康状况直接决定着其对健康信息需要的迫切性和目的性,因此人口统计学特征是数据挖掘和实行健康管理的重要对象和内容。
2. 健康兴趣、需求与使用行为类。使用大数据分析可通过个人健康感知、危险感知体现出来,包括与健康相关的生活习惯,如平常吸烟、生活习惯混乱等,如常读的医药类书目、接触的健康类节目等。
3. 人际、组织或社会关系类。网络上的健康信息关系诸如个人与他人的互动、关系网、朋友圈等。在社交媒体上,转发、@、评论都是一种互动关系:“每一个用户都是一个网络中的节点……如何利用用户的关系网络实现更有效的信息发布,是大数据时代媒体用户关系管理的独有课题。”[2]
三、健康信息大数据的应用可能性
健康信息大数据为我们提供了形形色色的信息,结构化的数据和数据挖掘对健康信息的研究和实践都将产生巨大的影响。在理论研究上,有助于健康调查与健康传播进行的各个过程;在实践上,则会对社会各层面带来巨大的影响。
(一)对健康传播与相关研究的影响
1. 对健康信息传播的影响:更精确地把握受众与媒介。一方面,海量数据使得健康信息用户面对海量信息时无所适从;另一方面,结构化、归类的大数据在某种程度上可减少或消除虚假信息,提高信息质量。对健康传播媒介来说,大数据也提供了科学了解、把握受众的可能性,通过健康信息受众的基本情况、需求偏好、信息使用行为与关系数据进行归类,可以实现健康传播的高效性。
2. 对健康信息调查的影响:具有时空跨度的方法与效果。大数据也对健康信息调查提供了一定的参照与提示。一方面,亟待使用大数据分析视角来看待和处理庞杂的健康信息;另一方面,也为健康信息调查提供了可供对照的方法工具,贯穿于调查研究整个过程中,从数据搜集到数据处理,以及结果的验证都提供了有意义的参照。另外,利用大数据本身进行受众分析也成为可能。由于一般受众调查通常具有短期、自我报告的主观性,且难以反映文化、社会背景等深层次的原因与关涉;而电子病历、社交网络、个人健康历史记录等记录的数据则更能反映持续的、具有时间空间跨度的真实情况,个人关系网类型、兴趣、感知等,也更能反映其心理和社会文化层面的内容。
(二)对社会各层面的影响
在应用层面,健康信息大数据对不同的群体和社会层面产生了不同的影响。
1. 个人层面:健康信息用户、健康专家。有研究者认为,大数据的发展将使个性化医疗成为可能。[3]健康专家或医生能够根据健康信息用户的各类数据,提供适合个人的健康信息或治疗方案,设定个性化的体检套餐等,此外,也可根据个人的疾病史和生活习惯,提供疾病预防的建议。而测序技术的发展和普及,也提高了获取更多人、物种的DNA信息和建立基因库的可能性,个体全基因组信息的获取,也有助于实现个性化诊疗服务。[4]
此外,利用大数据来研究健康恢复、患者间行为、医患间行为也是值得关注的话题。[5]
2. 组织层面:健康产品服务商,健康组织或医院,政府。对于药品、器械等与医疗健康产品的生产商或服务商来说,分类化的大数据能够帮助他们按照消费者需求进行有效和精准的广告营销,提供高质量的、个性化的产品服务,并适时接收到使用者的反馈,减少消费者流失率。
对于政府健康部门而言,普及健康信息、建立健康保险系统、开展健康工程等也有赖于对民众健康信息的搜集,对健康信息大数据的分析与挖掘能够有效地与民众进行沟通,增加实施的有效性。
3. 社会层面:预测功能和“动态化的健康信息时空地图”。(1)预测:大数据的核心功能。有学者认为,大数据最核心的科学问题是预测。目前学术界主要关心两类预测问题,一是趋势预测,二是缺失信息预测。[6]前者是对不确定的未来信息的科学推测,后者是通过预测反推缺失的那部分信息。美国人利用健康信息大数据来防治流感,他们通过患者自我报告等信息,来预测可能的流感疫情爆发,并提醒同一社区的人避免接触表现出流感症状的人。医生也可了解流感在不同州和地区流感扩散的程度,有效预防流感疫情的蔓延。
因此,利用大数据预测疾病,尤其是传染病,是十分有益的尝试。此外,与生活方式相关的疾病,也可通过大数据进行预测。
(2)“动态化的健康信息时空地图”。健康信息大数据在整个社会,乃至全球的层面上,表现为提供了一种动态化的、结合时间空间的行为分析工具。有学者称之为“大数据视角的行为科学”。用它来分析健康数据,就意味着不仅在空间上——通过移动终端和应用,[7]且在时间上——持续的自然状态的记录,都能够充分理解人类的健康行为。通过长时段的健康行为可以洞察人们的自然模式(他们倾向做什么)。也就是,大数据记录的就是人们的生活本身。[8]
从这个层面上说,大数据改变了人们认识健康信息的视角,为人们从更加完整的、社会结构式的层面重新审视已有的信息提供了多种可能性。在此基础上,人们进行行为调整,反过来又会作用于信息记录,因此行为与数据之间处于动态的、持续的相互的联系之中。
四、健康信息大数据面临的问题与讨论
虽然大数据为健康信息的应用提供了诸多可能性,然而也不难发现其中存在的问题,这些问题阻碍其积极影响的发挥。
1. 健康信息数据质量及真实性。海量数据尤以网络为最大信息来源。在每天更新、五花八门的健康信息中,有些信息的真实性往往难以辨别。有研究者对微博上转发率较高的健康医疗信息进行分析发现,专家对被调查微博信息的认同率均值仅为25%,远远低于普通用户对信息高达90.24%的认同率。因此,针对健康信息的质量问题,亟待构建医疗健康信息质量评价标准和指标,建立健全科学合理的信息质量评价体系。[9]
此外网络的匿名性,诸如微博僵尸粉等的大量存在,也会影响用户属性和关系数据的真实性。虽然在大数据的海洋里,其他数据会稀释不真实的信息,但总体上会影响信息质量,带来信息计算时的误差。现在也有些从数据中剔除不良用户的办法,但不断有新的问题出现而影响数据质量。
2. 健康信息数据挖掘技术的难度。在拥有海量数据之后,首先遇到的难题是数据挖掘分析工具的专业性,这往往需要有计算机背景的人才。其次,最大的问题在于如何运用它。“我们进入了所谓的大数据时代,但大数据的定义不在于数据之大,而在于真的能够把有史以来人类产生的所有活动都变成数据,并且在输入到系统中以后,你能对这些数据进行深度的整合、分析、挖掘、加工,并在这之后,去发现一些什么样的心理模式,能够产生什么样的价值”,[10]而如何将数据挖掘和分析工具与医疗、传播等专业信息结合,并进行深度的解读,是值得探讨的问题。
参考文献:
[1] 中国人民大学舆论研究所.北京合肥居民癌症健康信息调查报告[R].尚未公开出版.
[2] 陈娟.媒体的用户关系管理应建立基于大数据的管理理念[J].中国传媒科技,2013(1).
[3] 姚志洪.医疗卫生信息化10大视点[J].医学信息学杂志, 2013(1).
[4] 冯海超.透视美国大数据爆发全景[J].互联网周刊,2013(1).
[5] 宗乾进,袁勤俭,沈洪洲.国外社交网络研究热点与前沿[J]. 图书情报知识,2012(6).
[6] 周涛.复杂网络的新挑战:如何从海量数据获取信息[J].电子科技大学学报,2013(1).
[7] Burton, Scott H; Tanner, Kesler W; Giraud-Carrier, Christophe G; West, Joshua H; Barnes, Michael D."Right Time, Right Place" Health Communication on Twitter: Value and Accuracy of Location Information [J].Journal of Medical Internet Research, 2012,14(6).
[8] 胡泳.移动大趋势与社会变迁[J].新闻爱好者,2013(1).
[9] 齐娜,宋立荣.医疗健康领域微博信息传播中的信息[J].质量问题科技导报,2012,30(17).
[10] 胡泳.移动大趋势与社会变迁[J].新闻爱好者,2013(1).
(作者单位:中国人民大学新闻学院)