彭安芳 裴 雷
(南京大学金陵学院化学与生命科学学院 南京210089) (南京大学信息管理学院 南京210023)
我国省级疾病预防控制中心门户网站质量评价*
彭安芳 裴 雷
(南京大学金陵学院化学与生命科学学院 南京210089) (南京大学信息管理学院 南京210023)
运用Baidu、Google和Ahrefs作为主要数据源和检索工具,采集除西藏、港澳台、新疆建设兵团以外的我国省级疾病预防控制中心门户网站的相关数据,从网站域名质量、架构与功能、信息资源质量等方面进行评价,指出中国省级疾病预防控制中心门户网站建设现状及其存在的问题并提出相应对策。
省级疾病预防控制中心;门户网站;质量评价
信息保障与信息服务是我国疾控预防控制体系的重要组成部分。2005年国家发布的《关于疾病预防控制体系建设的若干规定》[1]明确指出,国家疾病预防控制中心(CDC)肩负着建设公共卫生信息网络、疫情报告及健康相关因素信息管理、健康教育与健康促进、疾病预防知识普及等责任。自2000年国家疾病预防控制中心组建之日起,各级疾控门户网站陆续建设,到2005年约84%的省、32.26%的地州建成门户网站[2],到2009年约94%的省建成门户网站[3],目前全国除西藏外各省区均建成了疾控门户网站。疾控门户网站承担着权威信息门户的责任。疾控门户网站应该“建设成为一个权威的知识库,一个在疾病预防和控制领域的专业化信息发布和服务的网站,承担着专业指导、国际信息交流、传播疾病预防和控制知识、发布公共卫生和流行病形势和权威信息的任务”[4]。本文以我国省级疾控门户网站(除西藏、港澳台、新疆建设兵团外)为研究对象,从域名质量、网站架构与功能、网站信息资源质量等指标对其进行了相应分析。
2.1 网站质量统计研究
在网站质量统计研究中,主要利用网站排名、网络用户流量、用户在线访问时间或浏览网页数量等统计指标评估网站的运营状况和潜在价值,其中,典型代表是Alexa的健康网站排名[5]以及美国疾病预防控制中心的Digital Media Metrics系列监控和研究报告[6]。Alexa是Amazon下属的全球知名网站评估排名机构,它主要通过网站的全球排名和区域流量排名、用户黏性、用户个体特征、用户区域分布、流量来源、检索入口词、入链分布、站内流量分布、相似网站、网站反应时长等指标评估网站。Digital Media Metrics报告对美国疾病预防控制中心网站的内部信息和网页使用、移动网络用户、社会网络工具应用效果、跨语种使用以及抽样用户调查的满意度进行了持续评估和跟踪,用以改良其网络信息服务。在网站使用评价中,统计对象包含页面浏览量及其月度分布、用户点击热点词、热门频道、内部和外部的检索词分布、有影响力的入链分布以及邮件主题和邮件用户分布情况;在移动网络用户使用中,主要统计了移动用户访问量和移动用户应用程序的开发使用情况;在社会网络工具应用评价中,则统计了12种社会网络工具的使用量和使用效果,包括专题栏目和控件、内容联播、在线视频、智慧卡数据交换、Facebook、Twitter、播客以及疾病预防控制中心应用工具集Widgets等。
2.2 网站质量层次指标研究
在网站质量层次指标研究中,国外的疾控门户网站评价多集中于信息质量或可用性评价[7],系统的评价研究方法还不多见。我国原卫生部2006-2007年开始对全国卫生系统网站、部直属单位网站及直属医院网站进行绩效评估。中国疾病预防控制中心信息中心也开发了由信息发布、公共服务、公众互动、网站设计和用户体验5个1级指标、18个2级指标构成的省级疾控网站评价指标体系,在2006年、2007年对河北、贵州、广东、福建、新疆、安徽6省、自治区疾病预防控制中心网站进行了试验性调查,提出了《各省、计划单列市疾控中心/中国疾控中心直属单位网站评估指标体系》;2008年开展了疾病预防控制行业网站评估,撰写了46份专题报告;2009年、2011年对各省、计划单列市疾控中心网站进行了持续评估[8-9],2009年以后则对疾病预防控制中心网站的用户体验进行了深度研究[10]。通过研究和实践,形成一套相对成熟的指标评价方案。此外,王景文[3]、曹彦[11]、周然[12]、李莉[13]、李海燕[14]、李诺[15]等通过对国家或地方疾控门户网站的架构与设计分析,也提出了相应的疾控网站要素分析和评价方法。
2.3 网站质量链接分析与计量研究
链接分析法主要通过对网页间链接的数量、类型、集中与离散分布、变化特征等内容进行分析,用于网络信息资源评价和网络信息挖掘等领域。自1996年Mc Kiernan提出Sitation的学术研究术语后,评价视角的网络链接方法不断发展。2000年以后,Thewell将其规范化并广泛应用于大学网站评价和政府网站评价领域,国内邱均平、孙建军等将其引入后也开展了广泛的实证研究,链接分析被认为是评估网站影响力和网站信息质量的重要方法和工具[16]。在医学研究领域,姜吉栋等[17]对国家健康平台展开研究,崔雷等[18]应用链接分析法评价医学网络资源的可靠性等。综上所述,在疾控网站评价领域,国内主要还依赖于指标评价和等级评价,客观评价的采用并不多见。
3.1 域名的用户可识别性
首先是域名权威性。一般网站域名后缀以.org、.gov以及.edu等命名的网站,垃圾信息或者不良信息较少,相对具有较高的信息质量和权威;而对于.com等门槛较低的域名,信息质量良莠不齐。美国各级疾病预防中心均属于政府编制,均以.gov为后缀;中国疾病预防控制中心属于事业单位编制,后缀应为.org,但目前国内的域名设置以.org命名的仅5家,其余多以.com、.cn或.com.cn为主,达23家,约占网站数量的77%,见表1。
表1 域名设置情况
其次是可识记性和名称规范性。一般易识记的域名为简短拼音或字母组合,与网站内容具有相关性,多采用地域缩写、行业缩写或相关特证词描述。中国省级疾病预防控制中心网站中,有29家的域名均含有“疾病预防控制中心”(97%),反映了行业特征;有27家在域名中反映了地域特征缩写,有两家通过二级域名反映了地域特征。在反映地域特征的命名中,一般为“地域名+疾病预防控制中心”字样,但地域名的采用并不规范,导致湖南、海南与河南,山西与陕西等拼音相近省份的域名几乎完全一样,不利于自然识记。
3.2 域名的网络可识别性
网络可识别性可以通过搜索引擎提供的域名权重或相应的分析指标构成,也有将域名权重作为网站排名的一项参数加以统计的(如googleScore),其值与域名注册时间、链接质量等相关。通过百度
的BDR值和Google的PageRank值的分析,我国省级疾病预防控制中心网站整体水平中等偏低,在BDR值中80%以上的网站为1,PageRank值均在5~6之间,区分度不大,整体质量偏低。
4.1 功能定位与模块类型
根据国家公共卫生信息网络建设的相关规划,疾病预防控制中心网站具有信息公开与发布、公共健康信息监控与业务信息系统、专业信息服务与咨询以及面向公众的在线业务服务等4大功能,见表2、表3。在实际建设中,我国省级疾病预防控制中心网站主要涉及5类功能模块、24项信息模块,其中有省市公共健康信息管理系统与办公自动化系统采用后台控制,门户并未显示。
表2 省级疾病预防控制中心门户网站功能模块(N=29)
表3 省级疾病预防控制中心门户网站功能采纳情况
续表3
注:信息模块采纳率=完全具备率+基本具备率x0.5。
4.2 功能模块
按电子政务的信息发布、业务系统、信息交互和在线服务4个阶段划分,从现有省级门户网站评测结果来看,一般具备信息发布功能,整合部分业务系统,具有一定的信息服务和信息交互功能;但在线服务功能和数据系统功能采纳普遍不够,对网站信息资源的深度加工和组织还不够。从总体看,我国省级疾病预防控制中心网站面向机构专业业务的机构网站功能明显强于面向公众服务的门户网站功能,存在重业务支持、轻信息服务的问题。
4.3 信息模块完备性
功能评价的区域表现,网站功能较完备、网站架构总体比较理想的有上海、浙江、北京、吉林和广东。具体而言,信息发布与信息公开比较完善的有北京、上海、安徽、河南、广东、广西和贵州;数字疾控和业务系统比较完善的有上海、江苏、浙江和江西;信息服务与咨询比较完善的有浙江、陕西和云南;业务服务比较领先的是北京、广东、浙江和吉林;而重庆、辽宁、内蒙、青海等省市门户网站功能亟需进一步完善。
5.1 评价指标
网站信息资源质量,反映在信息利用层面,主要是信息量,信息更新速度,网络辐射面(链接数)、网络影响力(反向链接数量,Inbound Links)以及搜索引擎对网站信息质量的整体评价。尤其是搜索引擎评价,如百度的BDR值和谷歌的GoogleScore,一般包含100~200项影响因子,对质量评价比较客观;但由于其赋值一般介于0~10之间,所以区分度不大,不宜直接采用。本文采用反映信息量的网页总量(WP)、时效指数(CI)、网络使用因子(WUF)和网络影响因子(WIF)4个指标描述,见表4。
5.2 评价基本情况
采用Google和Aherlfs作为检索工具,分别以site:,link:以及组合检索方法获得相关数据。通过如下调整增强数据质量:第一,网页和链接数按连续5日检索结果的几何均值为统计值(仍存在异常数据);第二,反向链接来源中有链接工厂的数据为消除垃圾链接后数据。同时,应该指出由于链接动机的差异以及检索工具搜检范围的局限,测度数据值存在一定冲突。通过测算和分析,综合表现信息资源质量较高的有北京、上海、浙江、安徽、云南等省市。从统计结果看,网站内容比较丰富的有云南、湖北、浙江、安徽等;网站更新较快的有上海、云南、广东、广西等;网站辐射能力较强的有新疆、湖北、广东、浙江等;网站影响因子较高的有北京、湖南、福建、广东等,见表5。
表4 网站信息资源质量分析主要指标及其内涵
续表4
表5 省级疾病预防控制中心门户网站信息资源质量分析
注:数据为搜索引擎索引值,小于网站真实值。
虽然国内省级疾控中心门户网站的信息资源已经具有一定规模,但与国外相比在数量和质量上仍存在巨大差异:平均网页数量仅为美国疾病预防控制中心的1/6(剔除异常数据后约1/30);更新网页数量约为美国疾病预防控制中心的1/120;链接数量约为1/50;外向链接约为1/80;反向链接约为1/1 000;WIF值约为1/15。
6.1 概述
除了域名质量、网站架构和链接分析,用户使用相关数据也是反映网站质量的有效数据,如日均访问独立IP流量、网页停留时间、域名搜索量以及SERPs点击率等指标。限于技术手段,本文难以分别阐述。从目前已有的评价对象看,我国省级疾病预防控制中心门户网站质量参差不齐,整体水平不高,亟需进一步加强规范和指导。
6.2 省级疾病预防控制中心门户网站质量现状
第一,网站域名缺乏统一规划,整体域名质量偏低,在域名后缀、域名命名等环节需要进一步规范,目前国内命名较为规范的仅北京、黑龙江、青海和重庆;而在域名使用中,在百度权重(BDR值)中大部分属于最低的1分,公众主动从百度搜索引擎获取相关信息的导入流量较低,意味着公众将疾控网站作为公开信息源的比例不大,主要是疾控业内人士浏览网站。第二,门户架构和功能设置上,主要停留在信息发布与公开层面,面向业务的系统整合、面向公众的在线服务提供功能较弱,大部分没有快速适应当前公众信息获取平台移动化的趋势。第三,从内容和链接分析看,一是网站内容以行政事务性信息为主,面向公众的公共健康信息、公共健康统计数据不多,公众可获取信息不丰富;二是网站更新速度和网站内容质量整体偏低,原生信息少,科学信息少,外部链接低;三是链接质量不高,出链中原卫生部、中国疾病预防控制中心占据了30%以上的链接,入链中存在部分链接隐患,或存在隐形链接,或被链接工厂与垃圾链接挟持。
6.3 省级疾病预防控制中心门户网站质量改进策略
第一,国家应该尽快明确疾病预防控制中心的机构属性及其网站建设和维护的责权归属,出台统一域名规划、功能定位和体系框架以及细化和具体的网站建设指导意见,建立网站建设指导和审批制度。通过规划、指导、评估、反馈,建立专门化的网站建设和维护机构以及可伸缩的技术框架,对于外包的技术服务商实施严格的评估和考核。第二,加强数字疾控、移动疾控和智慧疾控建设,推出面向市民智慧卡的在线业务服务。公共健康信息是公众的信息福利,应加强业务的推送与定制服务,主动跟踪、推送相关服务;加强公众联系,开发数据采集、信息发布的快速响应系统;依托移动通信网络推送疾病预防控制信息;加强重大疾病预防控制信息的大数据分析和预警机制,提升在线服务效率。第三,加强网站管理,严格监控,持续评估和改良。我国省级疾病预防控制中心网站大都经过了1次升级与改版(个别省份从未升级),而美国疾病预防控制中心推出至今已经经过了5次升级与改版,并且建立了长效的网站评估和改良机制,长期监控链接和用户使用行为。
总之,我国在“十三五”期间应加强疾控信息资源长效管理机制的创建,优化面向公众的在线服务,推出更多的优质健康信息资源,深入开展信息交互、共享与服务体系的建设,提升公共健康网站质量。
1 中国疾病预防控制中心网站.关于疾病预防控制体系建设的若干规定[EB/OL]. [2014-08-31].http://www.chinacdc.cn/n272442/n272530/n272907/n272952/6298.html.
2 苏雪梅,李海燕,万明.省、地市、县级疾控中心门户网站建设引导方向和评估研究[J].预防医学情报杂志,2006,(3):319-322.
3 王景文.省级疾控中心门户网站建设调查研究[J].中华医学图书情报杂志,2010,19(11): 15-17, 77.
4 李海燕,苏雪梅,万明.中国疾控中心新版门户网站建设思路及相关问题探讨[J].预防医学情报杂志,2005,(6):32-36.
5 Alexa[EB/OL].[2014-03-15].http://www.alexa.co m/siteinfo/www.cdc.gov.
6 CDC Digital Media Metrics[EB/OL].[2014-03-15]. http://www.cdc.gov/metrics/index.html.
7 Tian H, Brimmer D J, Lin J M, et al. Web Usage Data as a Means of Evaluating Public Health Messaging and Outreach[J].Journal of Medical Internet Research, 2009, 11(4)11.
8 张群,侯琳,陈强,等.2009年中国疾病预防控制中心网站用户体验测试研究[J].医学信息学杂志,2010,31(3):32-36.
9 张群,万明,陈强,等.2011年省级疾病预防控制中心网站评测[J].医学信息学杂志,2012,33(10):22-26.
10 张群,万明,陈强,等.中国疾病预防控制中心网站用户体验研究[J].医学信息学杂志,2013,34(12):11-15.
11 曹彦.疾控系统网站建设的几点思考[J].中国医疗器械信息,2007,(6):64-67.
12 周然,邹晓东,马晓江.河北疾控中心网站的构建[J].医学信息学杂志,2008,29(7):48-49.
13 李莉.论我国地方疾病预防控制中心网站的建设[J].中国预防医学杂志,2004,5(1):80-81.
14 李海燕,苏雪梅,万明.中国疾控中心新版门户网站建设思路及相关问题探讨[J].预防医学情报杂志,2005,(6):32-36.
15 李诺.疾病控制类公益网站的7C评价与建议[J].中国卫生信息管理杂志,2007,4(2):7.
16 黄贺方,孙建军.基于链接分析的网站评价实证研究——以四大门户网站为例[J].情报杂志,2011,30(1):74-77.
17 姜吉栋,彭洁,赵辉.国家人口与健康共享平台网站评价——基于网站链接分析法[J].农业图书情报学刊, 2013,25(3):50-53.
18 张晗,郭文,崔雷.链接分析法评价医学网络资源的可靠性研究[J]. 医学情报工作,2005,(6):31-34.
Quality Evaluation of Provincial CDC Portal Websites in China
PENGAn-fang,
SchoolofChemistryandLifeSciences,NanjingUniversityJinlingCollege,Nanjing210089,China;PEILei,SchoolofInformationManagement,Nanjing210023,China
Using Baidu, Google and Ahrefs as data sources and search tools, the paper collects relative data of provincial CDC websites in China except of Tibet, Hong Kong, Macao, Taiwan, Xinjiang Production and Construction Corps, then carries out evaluation from following aspects: quality of website domain name, architecture and function, quality of information resource. The current status and existing problems of provincial CDC websites construction in China are pointed out and the corresponding countermeasures are put forward.
Provincial CDC; Portal website; Quality evaluation
2014-11-04
彭安芳,硕士,助理研究员,发表论文多篇;通讯作者:裴雷。
国家自然科学基金项目“融合范式视角下的链接分析理论集成框架及其实证研究”(项目编号:71273125)。
R-058
A 〔DOI〕10.3969/j.issn.1673-6036.2015.02.002