华 珍,孙向东,宇传华
(1. 武汉大学健康学院,湖北武汉 430071;2. 中国动物卫生与流行病学中心,山东青岛 266032)
社会网络分析(Social network analysis,SNA)主要研究群体的内在或外在关系,无个体属性。在流行病学中,Eames发现隐含的网络结构在确定疾病动态方面至关重要[1]。吴洋丽等[2]利用社会网络方法发现,不同地区布鲁氏菌病传播的异质性与羊群活动网络有关;另有学者认为,不同网络参与者对病原体传播所起的作用也不相同[3]。网络模型揭示了暴发的潜在传播结构,特别适用于规划有关疾病的干预措施[4]。凭借这个特点,社会网络分析逐渐应用到兽医流行病学领域。兽医流行病学领域已有的社会网络分析应用成果,对了解该领域的研究现状、面临的问题以及进一步研究方向具有一定的借鉴意义。本文使用内容分析法,从研究主体、研究病种、数据获取、软件应用、指标计算以及数据验证等多个角度,对社会网络方法在兽医流行病学领域的研究现状与反映出来的问题进行较为系统地分析。
社会网络就是社会行动者及他们之间关系的集合。也可以说,社会网络是由多个点(社会行动者)和各点之间的连线(代表行动者之间的关系)组成的集合。用点和线组成的网络,是社会网络的形式化界定[5]。在兽医流行病学研究中,点代表动物、屠宰户、经纪人、养殖场等,线表示他们之间的接触、调运和贸易关系等。
社会网络有三种描述方法:一是使用G = {(ni,nj)}的集合表示元素组及其相互作用,G表示网络的名称,(ni,nj)是构成网络节点对的集合,如图1-a。二是社群图,由点(代表行动者)和线(代表行动者之间的关系)构成,用箭头表示方向;网络可以是二值的或多值的,其中用“1”和 “0”表示关系的有无,为二值网络;网络中社会行动者的集合表示模,研究一个集合行动者内部各个行动者之间的关系网络叫做1-模网络,如图1-b为1-模二值有向图。三是用N·N的矩阵表示网络中节点对之间的连接情况,最常用的是邻接矩阵,行和列都代表相同的社会行动者,并且排列的要素相同[6],如图1-c。
图1 分别用集合(a)、社群图(b)、邻接矩阵(c)表示4个点组成的简单网络
社会网络分析不仅可以通过不同方式对关系数据进行可视化处理,也可以利用诸多参数对关系数据进行量化。例如,其中心性和凝聚子群分析,强调了哪些对象和关系对于维持网络连接最重要,类似在传染病中找到传染源和传播途径,从而使其在流行病学疾病建模中得到应用[7]。网络的主要参数介绍见表1 。
本研究以“社会网络分析(Social network analysis) 或 社 会 网 络(Social network)”“兽医学(Veterinary medicine)或动物(Animal)”为关键词,在CNKI(中国全文期刊数据库)和PubMed数据库中检索并整理相关文献。检索日期为2000年1月至2017年12月。样本中不包含会议论文,仅限于在学术期刊中发表的研究论文,最终获得有效样本62篇,其中CNKI 3篇、PubMed 59篇。
表1 网络参数及其含义
本文的研究维度及简单的操作化定义如下:(1)发表年份:指论文公开发表的时间;(2)研究主体信息:主要指论文作者的姓名、国别、专业背景等;(3)病种:论文中涉及的流行病的类别;(4)软件应用:网络数据分析中使用的软件;(5)其他方法:指研究中涉及的社会网络方法以外的其他统计学方法。
本文以论文全文作为分析单位,利用Excel 2016,基于研究目的、专家意见、参考文献编制内容分析编码表,再由两人分别记录文献信息并录入计算机,最后进行对比。利用Cronbaeh's α系数[10]作为信度指标进行检验,发现编码信度为0.85,说明数据具有较高的信度。属性数据使用IBM SPSS 20进行分析,关系数据使用UCINET 6.3进行分析。
3.1.1 国家分布 文献的发表年份和第一作者国别可以反映出不同国家研究学者对社会网络方法接受和利用的快慢,也是判断国际交流的重要指标。在搜集的62篇文献中,共有14个国家的学者对社会网络进行了相关研究。其中,发表论文数量前6位国家的最早研究年份、论文数及占比见表2。最早将社会网络方法利用在兽医流行病学领域的是英国学者(2005年)。截至2017年12月,发表研究论文数量最多的前3位国家依次是美国(15篇)、英国(11篇)和澳大利亚(7篇),占论文总数的53.22%,而阿根廷(2010年)、瑞士(2011年)和泰国(2016年)等国家仅各发表1篇,呈现出不平衡现象。大部分国家应用起步较晚且产出有限,说明兽医流行病学领域的社会网络方法仍只被少数国家学者所掌握,大部分国家学者对社会网络方法的关注度和利用度不高。
3.1.2 年代分布 统计发现,论文数量最多的年份是2015年,共10篇,其次是2017年和2013年,各9篇(图2)。总体来看,社会网络方法的发展速度与规模呈上升趋势。然而同样是流行病研究,最早将社会网络方法应用在艾滋病的研究发表于1994年[11],而兽医流行病学的相关研究最早发表于2005年。这也反映出社会网络方法在兽医流行病学领域的发展速度较其他学科滞后。
表2 发表论文数量前6位国家的有关信息统计
图2 年度发表论文数量变化趋势
3.1.3 学科间合作 在兽医流行病学领域,通过合作易于将社会网络方法落到实处。统计数据显示 :5人及以上合作者的文献占59.68%,反映出主体间以合作为主(表3)。但因未区分作者的专业背景和供职单位,仍不能很好地反映跨学科和跨机构的合作情况,不能体现各学科和机构之间的交流情况。进一步分析发现,同一机构、同一专业完成的论文数为13篇,占20.67%,同一专业、不同机构作者合作完成的论文数为10篇,占16.13%,不同机构、不同专业合作论文数为39篇,占62.90%。这充分说明社会网络方法在兽医流行病学领域跨学科、跨专业合作成为主要方向。
表3 研究主体间的合作情况
3.1.4 国际合作 对参与研究者进行国别分类发现,具有国际合作的论文数为33篇,占总数的53.23%(表4)。由此可见,社会网络方法在兽医流行病学领域的国际交流比较普遍,这利于社会网络方法在兽医流行病学领域的发展。通过深入分析可知,社会网络方法在兽医流行病学中的应用是以不同国家、不同机构间的合作为主要趋势。进一步对不同国家学者参与的论文进行分析发现,网络规模(Size)位于前5位的分别是美国、澳大利亚、中国、英国、法国。对点度中心性进行测度,整个网络的中心势为43.23%,美国的点度中心性最高,说明其在网络中占据最中间位置,并将其他边缘国家联系在一起。进一步利用UCINET软件绘制出网络图(图3)。图中正方形表示国家,箭头发出者为第一作者所在国家,在研究中处于主导地位。图形的大小反映节点度数的高低,即图形越大,节点度数越大,提示国际交流越多,反之图形越小,国际交流较少。度数较大国家处于网络中间位置,将不同国家联系起来构成了一个网络,表明这些国家起着信息交流的桥梁作用。瑞士(Swit)与挪威(Norway)、加拿大(Canada)与尼泊尔(Nepal)彼此之间有交流,但与网络内部没有联系。
表4 协作国家数量分析
分析研究的疾病类别可反映研究者所关注的方向,同时也提示此类疾病的风险程度。通过内容提取发现,在案例回顾性中,研究高致病禽流感(HPAI)文献数量最多,其次是口蹄疫、马流感。HPAI自2003年出现以来,不断在东南亚蔓延,2015年在越南和中国流行[12],且病毒已发生变异,无有效药物和疫苗控制。2001年2月,英国发生了全国性口蹄疫大流行,使1/8的家畜被杀 ,给农业、旅游和乡村度假业以及其他相关行业的发展造成了严重影响,这场疫情使英国财政部损失了27亿美元,据估计,同时导致旅游业和其他农村工业损失数十亿英镑[13]。澳大利亚,一个以前没有出现过马流感的国家,在2007年暴发了马流感[14],澳大利亚赛马业可能因此损失数十亿美元[15]。由此可见,研究者主要将影响大的疫情作为研究方向。这一方面是社会需要,研究者希望借助社会网络找出疫情流行的主要关键节点,从而对关键节点进行严格监测;另一方面也是研究需要,高影响力事件的研究使得研究意义和价值明显扩大。
图3 国家间协作情况网络图
传统研究以社会事实范式为主,为避免变量间的影响,将研究对象孤立为个体,从而避开个体间的群体属性,弱化群体之间的关系。社会网络则以群体为研究单位,数据收集前需确定一个网络及网络边界,然而大多数网络并没有明确界限[4]。在数据来源方面,由于养殖场往往没有登记,也没有记录家畜或家禽的活动情况,因此这些地区的数据收集通常是不完整的,而贸易方面的数据则大多不为人知,而且可能会因市场波动或流行病的出现而突然改变[16]。完整、高质量数据的获取仍是兽医流行病学研究的一个主要挑战。涉及数据分析的56篇文献中,有29篇论文数据来源于官方数据或公司的收集;有25篇文献数据来源于问卷调查和访谈,另有2篇文献数据由资料估计获得。虽然国家和社会组织提供了部分数据,但数据的质量和数量仍较有限。利用社会网络方法建立疾病的预测模型,需要一定质量的数据作为支撑,这就要求相关部门在监管动物养殖、调运、贸易等的同时,做好数据、信息的登记工作,从而使精准的网络预测模型建立成为可能。
社会网络分析的一个关键要素是软件,包括UCINET、R和Pajek等。归纳检索到的文献,可分为理论方法分析、综述回顾性研究、实证性研究。前两类研究共计8篇,未涉及数据分析,另有3篇文献未具体介绍所使用的分析软件。故对剩下的51篇文献整理社会网络分析使用的软件,发现R软件占41%,UCINET软件占37%,Pajek软件占6%(图4)。可见,研究者倾向使用R软件数据包来实现数据分析。UCINET虽是社会网络分析的专用软件之一,综合性强,但为收费软件,主要分析静态中型数据,灵活性不高[17]。Pajek是一款Windows平台的免费软件,主要用于复杂网络,但未提供源代码,友好性不强[18]。而R作为一个综合性的软件,凭借其代码开源,并且软件包的开发和更新及时,使其在网络分析上应用普遍。
图4 不同社会网络分析软件使用情况所占比例
指标研究分析发现,研究者的研究层次和角度并不一致,从方法学的理论分析到社会网络的描述和建立,最后到疾病预测模型的建立,研究深度不断提升。Calistri等[19]介绍了社会网络在流行病突发事件的预防和控制系统中的应用。Ribeiro-Lima等[20]利用具体的网络特征参数,对网络大小、中心性、凝聚性等进行了描述。Duncan等[21]建立了 SEIR (Susceptible-atent-infected-resistant)模型,模拟牛接触网络和匹配网络的疾病传播比例,对比预测感染动物数量。
社会网络建立后,关系数据也需要其他方法验证。研究者主要进行点层次属性数据的检验,如T-test、卡方检验、Kruskal-Wallis秩和检验、相关分析、logistic回归分析等方法。未涉及到点-关系混合层次数据和关系-关系层次数据的假设检验,说明研究层面还是以点层次为主,关注的是单一关系,未将各种网络结合起来对比分析,如调运网络、贸易网络、饲养网络,说明社会网络方法的研究仍需进一步深入。
对社会网络分析的使用,各国学者的重视程度并不一致,出现了较不平衡现象,高产出主要集中在英、美两国。在整体趋势方面,社会网络分析领域的研究在发展速度与规模上呈现出总体上升趋势,但其发展轨迹并未呈现出明显的直线发展态势,而是表现出起伏交替的发展特征。虽然2013年后社会网络有所发展,但产出仍较其他学科少,可见发展速度滞后和缓慢。
社会网络研究主要通过跨机构跨专业合作完成为主,在国际交流方面较为充分,使得兽医流行病学领域社会网络方法的研究形成了国际不同学科之间的交流体系。各国合作虽比较分散,但因美国、澳大利亚、中国、英国等主要中间国家的存在,使研究在各国之间构成了一个比较集中的网络。可见生物安全不只关乎一个地方、一个国家的命运,同时需要各国之间的协作,跨学科、跨国家的合作研究成为主要趋势。
研究者将研究重点放在对社会影响较大的疫情上,这与社会需求和研究需要有关,它们需要发现疫情流行传播的特点,找出重要节点,做出风险分析,并为其他学科的研究做准备。
数据的获取对兽医流行病的研究仍是一个挑战。国家相关部门应加强禽畜养殖、运输、屠宰、进出口等数据的登记。对各级相关人员进行数据采集的规范化培训,并定期进行反馈汇总,由专人登记入库,便于后期数据的提取和分析。
社会网络的发展离不开应用软件的开发,UCINET软件作为专用软件,仍以教科书式的方式存在,而现在R软件的使用热度却超过了UCINET,这主要软件的开放性及友好性等特点。建议在软件选用时,可根据不同的软件和数据特点,将多个软件结合起来使用。
社会网络分析方法在兽医流行病学的应用逐渐实现了从理论分析、实证研究到模型建立的转变,但仍局限在利用网络观念和测度来研究个体网络,缺乏对整体网络动态模式的研究。研究应进一步加强整体网络的动态分析,发挥社会网络的可预测性作用。
在使用其他方法的数据验证上,主要以分析点层次数据为主,网络分析单一,研究也有待进一步深入。这也与研究数据的可获得性、养殖产业中人员的配合度、网络的复杂程度有关,研究方法也有待进一步完善。
本文深入探讨了社会网络的应用成果状况,并结合文献,具体分析了该方法应用的主要热点、趋势以及存在的问题。社会网络方法虽在兽医流行病学领域起步晚,但研究深度已完成了从理论研究到网络分析及应用的过渡;兽医流行病学领域的社会网络分析的研究指标仍局限在通过利用网络基本概念和测度来研究个体网络,缺乏对整体网络动态模式的研究。因此,社会网络方法在兽医流行病学领域的应用还很有限,需要通过加强理论与实际的结合,构建网络时空模型,控制关键点,从而为疫病监测和防控做准备。