张 坤
近年新信息技术的快速发展导致学术资源爆炸式增长,使用户面临的学术信息环境由信息不足转变为信息过载,这对用户获取有效学术资源造成很大困扰,进而对学术资源服务机构提出新挑战。新信息技术在为学术资源服务机构带来新挑战的同时,亦带来新机遇。受益于新信息技术,学术资源服务机构的重要服务载体——通用学术搜索引擎得到快速发展,国内外几大通用搜索引擎公司纷纷在其原有基础上推出了通用学术搜索引擎,如谷歌学术、必应学术、百度学术等,为用户获取学术资源提供了极大便利。通用学术搜索引擎依靠通用搜索引擎成熟的技术及特有知名度与影响力,逐渐提升了用户认知度和接受度[1],其重要性愈益凸显。但与此同时,新信息技术也推动了专业学术搜索引擎的发展,且专业学术搜索引擎凭借专业优势对通用学术搜索引擎的生存与发展形成巨大威胁。因此,为应对新信息环境造成的挑战,更好地满足用户需求和要求,并在与其他学术信息检索系统的市场竞争中占领一席之地,通用学术搜索引擎需不断进行优化升级。
服务满意度是用户对通用学术搜索引擎整个服务过程的评价和情感反应[2],是通用学术搜索引擎服务能力的重要衡量指标[3-4]。对通用学术搜索引擎用户服务满意度的关键影响因素进行识别与分析,可为通用学术搜索引擎服务能力评估及服务优化与创新等提供参考与依据,具有重要的研究价值。具体说,本文探讨如下问题:通用学术搜索引擎服务满意度影响因素体系具体包括哪些影响因素?体系是否可靠?哪些是关键影响因素?有何有益启示?为回答上述问题,本文基于改进后D&M模型,结合已有文献、用户访谈及通用学术搜索引擎的实际特点来构建通用学术搜索引擎服务满意度影响因素体系,然后利用灰色关联分析方法对专家评分结果进行计算分析,检验影响因素体系可靠性,识别通用学术搜索引擎服务满意度的关键影响因素,并据此提出优化建议。
学术搜索引擎(Academic Search Engine,ASE),指搜寻科技与学术信息的信息检索系统[5],是用户获取有效资源的重要途径。ASE一般可分为专业ASE和通用ASE两类,其中,专业ASE包括国外的Elsevier、Wiley、Web of Science(WoS)等和国内的中国知网、维普、万方、CSSCI检索系统、超星知识发现系统等;通用ASE包 括 国 外 的Google Scholar(GS)、Microsoft Academic等和国内的百度学术、搜狗学术、360学术等。现有知名通用ASE多是在原有搜索引擎基础上建立的[6],如GS是在国外知名通用搜索引擎Google的基础上建立起来的通用ASE,使用Google独特的算法,通过自动解析整个学术网站而非特定来源索引在网上查找各种学术资源[7],是科研人员搜索科学信息时广泛使用的工具[8]。国内知名通用ASE百度学术是在百度这一中国最大通用搜索引擎基础上拓展而来[9],能一站式为用户提供海量的,甚至比专业ASE更多更全的国内外文献[10]。目前,国内外围绕通用ASE的研究主要集中于通用ASE与其他信息检索系统的性能比较、通用ASE评价指标的有用性、通用ASE的系统优化、通用ASE的用户使用行为几个方面。
针对通用ASE与其他信息检索系统的性能比较,有研究发现,GS甚至比WoS、Scopus等专业ASE的覆盖范围更广,在对2009-2014年的调查数据进行统计分析发现,从GS中可以免费获取WoS收录文献的55%,并且GS通常会提供指向检索结果的免费链接,即使文档不能从出版商网站公开访问时也是如此[11]。研究进一步发现,在地理领域中,GS搜索到的结果数量高于WoS、Francis和GeoRef几个搜索引擎,尽管在内容上有很大重叠,但GS也有部分新颖之处[12]。在化学领域中,GS在搜索数量、搜索范围、操作习惯等方面比WoS也更具竞争优势[13]。
针对通用ASE评价指标的有用性,有研究认为GS在获取学术影响统计数据时非常有用,特别是在社会科学、人文科学这些学科中使用GS很有必要,它可以提供关于学术影响的全面信息[14];而且GS的表现相对稳定,即使在以往化学、物理等表现不佳学科,其覆盖范围也在快速提升,GS的使用可能会改变传统社会科学在引文分析方面处于劣势地位的局面[15]。研究进一步发现,除化学和物理领域的学科覆盖面经历一段时间的显著扩张后,GS的学科覆盖面正以稳定速度增长,GS比过去更适合用于评估和文献计量学研究[16]。但也有研究发现,GS创建的元数据不符合标准,既不可靠,也不可重现,它曲解了个人、商业机构和期刊层面的度量指标[17],而且GS在引文和内容链接以及文献计量学数据质量方面存在错误,尽管错误率比前几年小[18]。还有研究发现,GS中期刊收录覆盖面虽有所提升,但h指数过于集中且偏低等问题依旧突出,因此不适合用h指数来评价GS中发文量低但引用量较高的期刊[19]。
针对通用ASE的系统优化,有研究介绍了学术搜索引擎优化(ASEO)的概念,并提供了如何为一般学术搜索引擎,特别是Google Scholar优化学术文献的指导方针[20]。有研究提出学术搜索引擎优化(ASEO)是学术搜索引擎处理学术文章的关键要求,并提供了一个专注于期刊和学术论文搜索的新的专业搜索引擎[21]。还有研究介绍了如何通过在标题、摘要、关键词等方面选择恰当的词语来优化科技出版物在互联网上的可见度,并且给出了一个包含学术搜索引擎优化(ASEO)要素的例子[22]。
针对通用ASE的用户使用行为,有研究发现75%的被调查者使用过GS,感知有用性、感知易用性和忠诚度显著影响被调查者对GS的预期使用,而TAM模型可作为预测研究生使用GS的适用模型[7];科研人员的GS采纳行为受到信息资源质量、感知有用性、系统质量、界面可用性、感知易用性和态度的显著影响[23],而高等院校学生百度学术的采纳行为主要受感知有用性、感知易用性、主观规范、个人创新精神、忠诚度以及资料广泛性的影响[24]。
综上所述,当前围绕通用ASE开展的相关研究已形成丰硕成果,这些为本研究开展提供了很好的基础。但现有研究中仍存在着不足,首先,围绕通用ASE服务满意度影响因素主题的相关文献并不多,且已有少量研究中往往只涉及对通用ASE服务满意度影响因素和影响机理的探测与验证等方面,并未构建其影响因素体系和深入识别其关键影响因素,这揭示了相关研究存在“量”和“质”的不足。其次,已有研究多是对某个通用ASE进行针对性探讨,其研究重心在于“一个”而非“一类”,常见的如GS、百度学术等,这类研究多是从微观层面进行了更为具体的实证工作,其所得结论对某具体通用ASE的借鉴意义较大,但由于不同通用ASE之间具有差异性,因此,其结论对整个通用ASE而言意义有限。为填补现有研究不足,本文将构建通用ASE服务满意度影响因素体系,并对其可靠性和关键影响因素进行计算分析。
信息系统成功模型(D&M模型)是信息系统(Information System,IS)领域的经典模型,该模型已在诸多领域诸多情境的IS研究中被证实有效[25-26]。该模型提出IS的系统质量和信息质量影响用户对IS的满意度,其中,系统质量是IS本身的测度指标,用来衡量IS技术是否成功,信息质量是IS产出的测度指标,用来衡量IS语义是否成功[27]。Delone等[28]对D&M模型进行优化,提出IS的服务质量也会影响用户对IS的满意度,尽管过去他们认为服务质量仅是系统质量的一个子集,但IS的发展使他们认为需要从系统质量中提炼出单独的服务质量指标,并且该指标可能是衡量IS部门整体成功的最重要部分,如果评估方案中不包括该指标,则可能会错误衡量IS的有效性,即改进后D&M模型提出用户对IS的满意度受IS的系统质量、信息质量和服务质量3个变量影响。该模型同样被诸多研究证实有效[29-30]。据此,本文将通用ASE的系统质量、服务质量和信息质量确定为基本构面,并结合已有IS领域相关文献和通用ASE服务的实际情况,初步提出各构面所对应的影响因素,进而构建通用ASE服务满意度完整的影响因素体系。
针对系统质量和服务质量,Delone等[28]提出系统质量可通过适应性、可用性、可靠性、易用性和响应时长等指标来测量;服务质量可通过保证、同理心和响应性等指标来测量,其中“保证”指IS服务人员多大程度上具有做好本职工作的知识,“同理心”指IS多大程度上把用户的最大利益放在心上,“响应性”指IS多大程度上可以快速满足用户需求。根据通用ASE的实际特点可知,通用ASE的系统质量容易受到易用性、稳定性和流畅性等因素的影响,其中,通用ASE的“易用性”即IS“易用性”的体现,“稳定性”即IS“可靠性”的体现,“流畅性”即IS“响应时长”的体现。由于在通用ASE情境下不存在“适应性”和“可用性”问题,故将这两个指标删除。服务质量容易受到移情性这一因素的影响,通用ASE的“移情性”即IS“保证”和“同理心”的体现,而由于通用ASE服务质量构面下“响应性”所表征内涵与通用ASE系统质量构面下“流畅性”所表征内涵具有重叠,故对通用ASE服务质量构面下的“响应性”进行删除。针对信息质量,Miller等[31]提出信息质量可通过准确性、相关性、及时性和完整性等指标来测量;虞为等[32]提出百度学术可从全面性、权威性、时效性及免费性等指标来评估其信息内容。结合信息检索系统对信息查全率和查准率的要求,本文认为通用ASE更强调信息的准确性、相关性、全面性、权威性、时效性和免费性。其中,“完整性”与“全面性”所表征内涵、“及时性”与“时效性”所表征内涵有所重叠,故对通用ASE信息质量构面下的“完整性”和“及时性”进行删除。
由于通用ASE具有自身特殊性,可能会存在一些已有研究并未提及或已有研究提及但在通用ASE情境中并不成立的因素。为进一步保证所提取因素的可靠性,本文围绕基本构面,结合通用ASE的功能与特点,组织了两次面向资深用户(5年以上使用经验)和资深IS产品经理(3年以上工作经验)的深度访谈,以进一步补充和修正其影响因素体系。通过对访谈结果进行内容分析,在系统质量构面下提炼出容错性和安全性两个新变量,在服务质量构面下提炼出个性化这一新变量,在信息质量构面下提炼出丰富性这一新变量。但考虑信息质量构面下的“丰富性”与“全面性”,“相关性”与服务质量构面下的“个性化”所表征内涵有所重叠,故对通用ASE信息质量构面下的“丰富性”和“相关性”进行删除。经过补充修正,最终共得到3个基本构面和12个影响因素,进一步确定各因素的具体内涵,并据此构建通用ASE服务满意度的影响因素体系,见表1。
表1 通用ASE服务满意度的影响因素体系
邓聚龙1982年首次提出灰色系统理论[33],衍生出灰色关联分析方法,即用来研究随机变量之间相关关系的一种多因素统计分析方法[34]。该方法以“小样本”“贫信息”的不确定性系统为研究对象,通过从部分已知信息中提取有价值信息,从而正确认识系统运行规律并实现对系统的有效控制,其核心是根据各变量数据序列对应几何形状的相似度来判断各变量序列的关联度,即几何形状越相似,变量关联度越大,反之则越小[35]。由于用户对通用ASE服务满意度受多因素共同影响,各因素间联系不明确,且该方法已被多次应用于我国各领域关键影响因素的识别研究当中[36-37],具有科学性和广泛适用性,因此灰色关联分析方法用于本研究较为合适。
通过专家打分的形式对通用ASE服务满意度各因素的影响程度进行测评,共邀请9位IS领域的专家学者按照十级打分规则对所有影响因素进行评分(0~10表示影响因素极不重要→影响因素极重要)。其中,3位系从事IS相关研究5年及以上的科研人员,3位系从事IS工作3年及以上的资深IS产品经理,3位系使用通用ASE 5年及以上的资深用户,所得评分结果见表2。
表2 专家评分结果
各因素与通用ASE服务满意度的关联度表示各因素对通用ASE服务满意度的影响程度。根据灰色关联分析方法要求,本文将通用ASE服务满意度各影响因素的计算过程分为以下几步。
(1)确定无量纲化后的比较数据列{Xi}。由于不同专家对各因素的认知差异可能会导致数据量纲存有偏差,因此在进行灰色关联分析时,需进行无量纲化。本文通过离差标准化公式X*=对原始数据列,即专家评分结果(表2)进行无量纲化。X*表示转化后数据,取值为[0,1],Xik表示源数据,且1≤i≤12,1≤k≤9。为方便分析,对所得数据进行十分制转化后,得到最终的比较数据(见表3)。
表3 无量纲化后的数据
(2)确定参考数据列。本文将评分结果(表2)中各列的最大值视为原始比较数据列的最优值,并将其作为参考数据列{X0},据此得到{X0}={10,10,9,10,10,10,9,10,10}。
(3)计算求得参考数据列{X0}与比较数据列{Xi}的绝对差值|X0(k)-Xi(k)|,据此计算各因素的灰色关联系数ζi(k)。ζi(k)反映的是比较序列与参考数据列在某个具体节点(即曲线中各点)的关联程度值,可根据以下公式求得
其中,ρ表示分辨系数,取常规值0.5,据此逐一计算各因素的ζi(k)见表4。
(4)关联度排序。由于关联度曲线上的节点由许多零散节点聚合而成,因此需将关联度曲线中各点的关联度聚合为一个代表其整体的数值,即总体关联度γi。γi值越接近1,说明该因素与比较目标的关联度越高,越可能是比较目标的关键影响因素。根据公式求得各因素总体关联度γi,见表4。其中,1≤N≤9。
表4 灰色关联度
根据γi的排序结果可识别通用ASE服务满意度的关键影响因素。由表4可知,通用ASE服务满意度影响因素体系中所有影响因素的γi按照由大到小顺序排列依次是准确性(0.837)、移情性(0.743)、权威性(0.708)、免费性(0.708)、易用性(0.658)、流畅性(0.641)、时效性(0.628)、稳定 性(0.625)、 全 面 性(0.617)、 容 错 性(0.581)、个性化(0.579)、安全性(0.579)。在各基本构面中,信息质量对应影响因素的γi按照由大到小顺序排列依次是准确性、权威性、免费性、时效性、全面性;系统质量对应影响因素的γi按照由大到小顺序排列依次是易用性、流畅性、稳定性、容错性、安全性;服务质量对应影响因素的γi按照由大到小顺序排列依次是移情性、个性化。根据帕累托定律(即二八法则),任何系统中,约80%的结果是由该系统中的重要变量产生,而重要变量通常仅占少数,约占全部变量的20%。据此,本文将所有影响因素的γi计算结果中排名占前20%的因素视为关键影响因素,最终确定将γi值最高的3位视为关键影响因素。但由于权威性和免费性两因素的γi值相同,并列第三位,故本文将其全部视为关键影响因素。因此,通用ASE服务满意度的关键影响因素为准确性、移情性、权威性和免费性。
灰色关联度值一般可分5个等级,其中[0,0.3)为低,[0.3,0.5)为较低,[0.5,0.7)为中等,[0.7,0.9)为较高,[0.9,1]为高[38]。研究结果显示,本文所构建的通用ASE服务满意度影响因素体系中,所有影响因素的关联度都超过0.5,证实本文影响因素提炼的合理性和影响因素体系构建的可靠性。在所有因素中,4个关联度最大的因素中没有一个源于系统质量,说明在3个基本构面中系统质量对用户通用ASE服务满意度的影响较小,这和Wang等[39]、Stefanovic等[40]发现系统质量对用户满意度具有最大影响的结论不一致。原因可能在于,通用ASE的系统质量固然重要,但当前许多通用ASE都是在国内外知名通用搜索引擎基础上发展而来,其系统已相对成熟,基本都能使用户满意。以流畅性为例,根据访谈结果,该因素几乎是所有IS进行优化升级时都会考虑的,但经过多次改进后,其提升空间非常有限,进而可能导致用户感知不明显。研究还发现,在所有因素中,4个关联度最大的因素中有3个源于信息质量,说明在3个基本构面中信息质量对用户通用ASE服务满意度的影响较大,这启示通用ASE服务提供方需重点保障其提供的学术信息的质量。同时,本文识别出准确性、移情性、权威性与免费性4个关键影响因素,说明它们对通用ASE用户满意度的影响最为重要,是通用ASE服务提供方进行服务优化或创新时必须加以关注和改进的方面。这些指标的识别为通用ASE服务优化与创新提供了具体依据和明确方向。
(1)信息准确性对通用ASE服务满意度具有最重要影响力,说明通用ASE需全力保障输出信息的准确性。结合通用ASE的特性,其准确性主要体现于信息内容是否与客观实际相一致,即信息内容的准确度。新信息环境下,由于信息量大,信息质量高低不一、鱼龙混杂,且由于学术信息往往具有较强的专业性,不容易甄别,因此,获取准确信息成为用户搜索时所追求的重要目标。在此背景下,通用ASE提供的信息越准确,用户满意度可能就越高。对此,通用ASE可借助众人之智,建立成熟的反馈修正机制,激发用户上传版权范围内的可靠学术信息,而当有用户向系统反馈信息不实时,服务方应即刻对反馈信息进行标注、查实与修正,并允许其他用户对标注信息进行修改,甚至可以邀请相关学术领域的专业人士对其进行回答与修改,类似于知乎问答平台中的“邀请回答”。
(2)服务移情性对通用ASE的影响力位列第二,说明移情性是通用ASE需关注的另一重心。移情性即共情,体现于服务方对被服务方的理解程度,即通用ASE是否会在各个环节均能为顾客着想,并尽力满足其需求。显然,用户所感知到的通用ASE及其服务人员越为其考虑,其体验满意度可能就越高。对此,通用ASE需强化相关服务人员“用户为本”的服务意识,不仅体现于界面设计的友好性、系统使用的人性化、信息传播的交互性,还体现于用户服务的积极性与主动性。
(3)信息权威性对通用ASE服务满意度的影响力位列第三,说明用户更青睐具有权威性的信息来源。网络时代为用户共享信息提供了便利,但由于学术信息往往具有较强的专业性,导致用户间信息不对称性明显,加之用户个人认知存在差异,其输出的信息质量很多时候良莠不齐,甚至真假难辨。在此情况下,用户最省时省力省心的方式就是根据信息源来判断信息质量,即越是知名学者、官方机构等权威信息源提供的学术信息,就越容易被视为准确的,且越容易被用户采纳,用户体验满意度也越高。因此,通用ASE可通过建立相应激励机制吸引知名学者、权威人士、官方机构等“意见领袖”的加盟,并通过其特有的“名人效应”促进用户对其服务满意度的提升。
(4)信息免费性对通用ASE服务满意度的影响力位列第三,说明用户更希望在通用ASE中获取免费资源。通用ASE的受众以学生群体居多,学生群体往往没有收入来源,对免费资源更为敏感,因此通用ASE越容易获取免费学术信息资源,用户满意度可能就越高。对此,通用ASE一方面可考虑加强和部分高校、科研院所等机构的合作,实现非保密性学术资源的流通共享,并通过系统链接关联到部分合作机构的内部资源网站,从而获取免费资源;另一方面可通过建立适当的激励机制以促进用户个人主动进行版权范围内的资源共享。
此外,隐私问题是数字时代用户关注焦点[41],隐私忧虑、隐私关注等安全性因素已被证实在诸多情境诸多IS中都会对用户体验产生较大影响,但本文发现其对通用ASE服务满意度的影响最低。可能原因如下:一是由于使用通用ASE的用户多为科研人员,相较于其他人群,这类群体往往对各种风险都司空见惯,可能对各种风险都具有更强的“免疫力”,并且他们可能更能理解个性化服务的实现需要以信息披露为代价。二是受搜索内容本身特性所致,用户使用ASE过程中可泄露的信息主要是个人信息和学术信息,而个人信息披露几乎是用户使用所有IS都会面临的问题,因此用户对安全性的担忧可能主要源于学术信息搜索痕迹或内容的泄露,但这类信息一般并不会对用户产生很大负面影响,进而可能导致用户对该因素并未过度关注。三是由于本文数据搜集对象都属于高知群体,其信息素养和隐私保护素养相对较高,进而可能导致其对风险感知并不十分明显。
本文基于改进后的D&M模型,结合文献调研、用户访谈和通用学术搜索引擎的实际特点,构建包含3个基本构面和12个影响因素的通用ASE服务满意度影响因素体系,然后借助灰色关联分析方法,验证体系的可靠性,识别出准确性、权威性、免费性和移情性4个通用ASE服务满意度的关键影响因素,并据此提出若干优化通用ASE服务的策略启示。
本文贡献在于:(1)以往研究较少对通用ASE服务满意度影响因素体系和关键影响因素进行系统探讨和深入识别,本研究的开展在丰富现有研究“量”的同时,也填补了现有研究不足,完善了现有研究体系,不仅为后续研究提供了基础和思路,还将结论的适用性由“特殊”扩展为“一般”。(2)从改进后D&M视角对通用ASE服务满意度进行专门分析的研究很少被报道,本研究的开展不仅拓展了改进后D&M模型的适用场景,还对模型中系统质量、服务质量和信息质量的下位指标进行了扩充与细化,并对其影响程度进行了测算,进一步深化了改进后D&M模型的理论内涵。(3)已有类似文献在对关键影响因素进行识别研究时的方法趋同性较强,往往会用到层次分析[42-43]、DEMATEL[44-45]等方法,本文利用区别性的灰色关联分析方法进行计算分析,研究方法的结合使用及成功运用,在拓展该方法适用领域的同时,也为后续类似研究提供了方法借鉴。(4)构建通用ASE服务满意度的影响因素体系,为未来专用ASE及其他信息检索系统服务满意度评价体系的设计提供了指导与参考,也为通用ASE服务的优化和创新提供了目标与方向。特别是,识别出通用ASE服务满意度的关键影响因素,并提出针对性建议,为通用ASE服务优化与创新提供了具体思路。
本文亦存有不足。一方面由于视角的局限,本文从改进后D&M模型的系统质量、服务质量和信息质量层面来提炼通用ASE服务满意度的影响因素,可能会导致提炼的影响因素并不全面;未来研究考虑结合其他视角或使用扎根理论等方法对相关影响因素进行全面探测,从而构建更为全面的通用ASE服务满意度影响因素指标体系。另一方面本文采用小样本调查法,且在参考数据列设定、关键影响因素确定等方面具有主观性,可能导致研究结论稳健性不足;未来研究考虑扩大样本的规模与范围,并结合使用更大规模的问卷调查等研究方法,从而进一步提升结论的稳健性。