基于内容分析法的用户参与高校机构知识库的影响因素分析

2022-02-14 12:37陈欣悦北京大学信息管理系
图书馆理论与实践 2022年1期
关键词:类目知识库机构

陈欣悦(北京大学信息管理系)

1 研究背景

20世纪90年代以来,科学研究不断深入,文献数量急剧增长,科研人员对资源的需求也越来越大。然而,传统出版商对资源的垄断导致科研人员可免费获取的学术资源数量越来越少,重复的科研成果不断增多。因此,为促进学术资源的自由传播,开放存取(Open Access,OA)运动大规模兴起。机构知识库是OA资源的一个重要表现形式,主要提供机构科研成果的保存和转化、机构科研评价和合作等服务,对促进学术传播、资源共享等都有着重要的作用。

高校是机构知识库建设的重要主体,但目前我国高校机构知识库的建设情况却并不理想。一方面,已建立机构知识库的高校数量有限。截至2020年11月25日,据英国诺丁汉大学的机构知识库注册登记和服务站点Open DOAR的数据,我国登记注册的高校机构知识库只有6个[1];国内相关统计中,有50所高校加入了由CALIS发起的中国高校机构知识库联盟,但只有21所高校已建立机构知识库[2]。另一方面,已建立的机构知识库普遍存在利用率低、影响力小、用户基础薄弱等问题,如北京大学机构知识库自2015年建成以来,资源总下载量为10万次左右[3]。由此可见,找到影响用户使用机构知识库的因素,提高用户的参与度已成为我国高校机构知识库发展亟待解决的实际问题。

国内外很多学者对用户和机构知识库的关系展开了研究。左瑞玲[4]、冯坤等[5]分析了不同类型用户的信息需求,并建立了基于用户需求的高校机构知识库服务体系。还有许多学者通过问卷调查和访谈的方式调研科研人员对于机构知识库自存储行为的态度。如,胡海燕[6]在调研了我国机构知识库建设现状的基础上,分析了在教学和科研过程中用户的自存储需求,并据此构建了服务机制;Singeh等[7]根据科研人员对自存储行为的担忧提出相应的解决办法。总体而言,已有研究多采取定性研究方法来研究影响用户信息行为的因素,由于样本数量有限,其结果并不一定具有代表性和普适性。

鉴于此,本文拟通过内容分析法这一半定量研究方法,从相关文献中提炼出影响用户参与机构知识库的因素,通过科学编码和频率统计,构建影响因素模型,并据此提出提高用户参与度的建议,为推进高校机构知识库建设提供参考。

2 研究设计

2.1 数据获取与分析方法

2.1.1 内容分析法

内容分析法是一种半定量研究方法,通过对文献内容的分析,进行科学编码,并对编码结果进行深入分析[8]。具体而言,本研究将检索、搜集并分析高校机构知识库相关文献,从中提取出与用户参与有关的内容。与此同时,笔者会根据一定的理论确定类目和编码方案,计算每个因素的出现频率,从而构建用户使用机构知识库的影响因素模型。

需要说明的是,根据使用方式,用户可分为资源提交者和资源利用者。因此,用户使用机构知识库的影响因素可分为用户向机构知识库提交资源的影响因素和用户利用机构知识库资源和服务的影响因素。

2.1.2 数据获取

为全面、准确地获取相关文献,本研究采用了两阶段综述方法[9]。

第一阶段,使用数据库检索与机构知识库相关且提到用户使用的文献。文献来源包括中国知网、万方和Webof Science数据库。中文检索关键词主要包括“机构知识库”“机构库”“大学机构知识库”“高校机构知识库”“用户”“用户行为”“用户感知”等,英文检索关键词主要包括“Institutional Repository”“User”“User Perception”等,检索时间为2020年11月20日。剔除重复文献后,共得到初始文献90篇。

第二阶段,对初始文献进行筛选,使用纳入和排除标准以保证所选文献与影响用户参与机构知识库的因素这一研究主题具有较强相关性。纳入标准为:涉及机构知识库使用现状调研,以用户行为和用户需求等作为研究核心内容的文献;排除标准为:不涉及机构知识库或用户行为的文献、非学术性文献、综述性文献。最终得到可供进一步研究分析的文献77篇。

2.2 类目与编码

在内容分析中,确定分析单元,即实际统计的对象,是进行后续研究的基础。在本研究中,需要统计归纳用户参与机构知识库的影响因素,该内容可能出现在文献的任何部分,因此分析单元为整篇文献。

确定类目和编码方案通常有三个途径:数据、现有的相关模型和理论[10]。本研究首先依据已有理论模型开发出初步的编码类别列表作为一级类目,再通过开放编码的方式从研究数据中归纳出具体的影响因素作为二级类目。

2.2.1 理论模型

本研究根据研究目的和文献调研,选择使用与满足理论(Useand Gratifications Approach,U&G)和技术接受模型(Technology Acceptance Model,TAM)作为初步编码方案的理论模型。U&G由Elihu Kazt提出,主要关注用户使用/接触与满足等内容。在后续研究中,Stafford等[11-12]基于该理论,提出了用户满足于媒体使用的四个维度:内容满足,主要侧重媒体传播的内容本身;过程满足,主要侧重用户使用媒体时的真实体验;功利满足,主要指媒体满足用户自身需求的程度;社会化满足,主要针对用户使用媒体时获得的社交感受。TAM是研究个体对信息系统接受程度的经典模型,由Davis[13]于1986年在TRA、TPB等态度行为关系理论的基础之上提出,该模型认为用户的行为意愿(感知有用性和感知易用性)和行为态度影响着用户使用信息系统的行为。其中,感知有用性指用户认为使用信息系统能够为其提供利益的程度,感知易用性指用户认为使用信息系统的容易程度。

综合以上两个模型,本研究遵循“认知信念—行为意向—实际行为”的分析逻辑,认为用户参与机构知识库的行为主要受感知有用性(内容满足、功利满足)、感知易用性(过程满足)和主观认知(行为态度、社会化满足)的影响。同时,由于用户的不同身份导致其参与行为具有较为显著的差异,本研究分别构建了资源提交行为模型和资源利用行为模型。

(1)资源提交行为理论模型。在资源提供行为中,感知有用性具体包括资源的可用性和职业发展期望。其中,资源的可用性指提交资源的价值,以及它能否被较好地保存和管理;职业发展期望指提交资源的行为是否能为用户带来职业上的实际利益;感知易用性指系统易操作性,即机构知识库是否易于使用的;主观认知包括认知成本、认知风险和其他个人因素;认知成本指科研人员提交资源时的付出;认知风险指资源提交行为所带来的风险(见图1)。

图1 用户资源提交行为理论模型

(2)资源利用行为理论模型。在资源利用行为中,感知有用性包括资源内容和系统功能。其中,资源内容指机构知识库中可供利用的各种资源;系统功能指机构知识库提供的各种功能;感知易用性包括资源获取、系统可访问性和系统易用性;资源获取指用户获取资源的难易程度;系统可访问性指机构知识库被访问的可行性和难易程度;系统易用性指利用机构知识库各种功能的难易程度;主观认知即为个人主客观因素(见图2)。

图2 用户资源利用行为理论模型

2.2.2 编码方案

在理论模型的基础上,以实际数据为依据,归纳出具体的类别,形成二级类目。

(1)资源提交行为影响因素。资源可用性方面,Ratanya[14]的研究表明,由于自存储缺少同行评议的过程,不少科研人员对机构知识库中的资源质量表示怀疑,从而不愿意将自己的文章提交到机构知识库中。胡海燕[6]认为,用户需要一个稳定、永久、安全的存储地址,用来保存自己的智力成果,因此机构知识库提供的长期保存功能被众多用户所喜爱。冯坤等[5]的研究表明,由工作人员完成所有对资源进行分类、标引等管理工作会降低用户参与的积极性。因此,笔者将资源质量、资源管理和资源长期保存列为资源可用性的二级类目。

众多研究表明,职业发展期望是资源提交行为的重要促进因素,研究人员渴望自己的研究成果被更多的人看到,从而获得更高的引用率和知名度[15]。在机构知识库的自存储行为中,该因素表现为自存储资源能否在机构知识库之外的平台(如搜索引擎、图书馆目录)被检索到并排名靠前,即资源的可见度[16]。与此同时,将存储在机构知识库中的成果及其影响力纳入科研评价指标、绩效考核标准等也是自愿提交行为的重要动力[17]。因此,笔者将资源可见度和激励制度列为职业发展期望的二级类目。

系统易操作性方面,李武[18]的研究表明,操作流程是影响用户存缴的首要因素。即,简单规范的存缴流程可以提升科研人员的自存储意愿。Sonya Betz等[19]重点研究了界面设计和系统的交互性对用户自存储行为的影响,发现用户友好的设计有助于提高用户参与的积极性和持续性。因此,笔者将操作流程、界面设计和交互性列为系统易操作性的二级类目。

在认知成本方面,宋海艳等[20]通过问卷调查得出,提交方式会影响科研工作的成本,提交过程所需的时间和精力极大地影响了科研人员的自存储意愿。同样,用户自身具备的信息技能也是降低工作成本的重要因素。因此,笔者将提交方式、时间精力、信息素养列为认知成本的二级类目。

在认知风险方面,李麟[21]通过调研我国科研人员对科技信息开放获取的态度,发现用户不愿意提交资源的一个重要原因是担心自己尚未发表的成果会被修改、剽窃或影响后续发表。并且,大部分用户认为出版商会限制作者的自存储行为。因此,笔者将对提交资源的控制权和版权意识列为认知风险的二级类目。

其他个人因素中,许多研究都提到了学科背景、职称、专业素养以及用户对自存储行为的认识等因素对资源提交行为的影响[22]。因此,笔者将它们列为其他个人因素的二级类目。

综上所述,笔者构建了资源提交行为影响因素编码(见表1)。

表1 资源提交行为影响因素编码

(2)资源利用行为影响因素。资源内容是机构知识库提供服务的基础。据此,Ismail等[23]认为,资源数量、资源类型、资源质量和资源更新速度是能否吸引用户的关键因素。因此,笔者将它们列为资源内容的二级类目。

在资源获取方面,王超等[24]认为,良好的检索功能可以帮助用户全面、准确地获取所需资源,而免费的全文浏览或下载亦是提高使用率的重要因素。Omer[25]认为,信息组织程度,即分面导航和资源分类清晰有助于用户更为快速地获取资源。因此,笔者将检索效率、全文获取和信息组织作为资源获取的二级类目。

系统功能是用户是否会使用机构知识库的最直观的因素。根据众多学者的研究,针对不同用户的个性化服务功能和针对不同类型用户的层次化、丰富性服务功能是满足用户需求必不可少的条件[26-27]。曾艳[28]发现,用户对于机构知识库的基础性和交互性功能有较大的需求。Kamraninia等[29]阐述了系统功能整合性的重要性:与其他系统的融合可以为用户营造一个熟悉的、无处不在的环境,从而降低系统的使用难度。因此,笔者将个性化、交互性、丰富性、基础性和整合性列为系统功能的二级类目。

在系统可访问性方面,李静[30]通过分析用户的需求,得出访问途径、页面响应速度、系统稳定性是提高机构知识库使用率的基础。因此,笔者将访问途径、页面响应速度和系统稳定性列为系统可访问性的二级类目。

在系统易用性方面,李广平[31]通过问卷调查,发现便捷的操作、友好的界面设计和提供使用指南可以节省用户的时间,有利于提高用户使用机构知识库的意愿。因此,笔者将操作便捷、界面设计和使用指南列为系统易用性的二级类目。

已有研究显示,个人因素对用户的资源利用行为影响较小,主要体现在用户具备的信息素养和对机构知识库的认知程度上。因此,笔者将信息素养和认识程度列为个人因素的二级类目。

综上所述,笔者构建了资源利用行为影响因素编码(见表2)。

表2 资源利用行为影响因素编码

3 结果分析

3.1 内容分析结果

笔者逐一阅读和分析这77篇文献,提取其中与用户使用机构知识库相关的内容,并对每篇文献进行编码及统计(见表3、表4)。

表4 资源利用行为影响因素统计

3.2 结果分析与讨论

3.2.1 资源提交行为影响因素

从表3可以看出,在资源可用性方面,超过40%的研究提到资源质量和资源长期保存是影响用户提交资源的重要因素,资源管理的出现频率则不足10%。在数字化时代,数字资源能否长期保存一直为许多学者所担忧,因此资源的长期保存功能是机构知识库能否吸引用户提交资源的重要因素。

表3 资源提交行为影响因素统计

在职业发展期望方面,资源可见度被65.5%的相关研究提及,是所有因素中出现频率最高的,激励制度也达到了50%的提及率,可见科研人员对资源提交行为能否给自己带来实际的利益较为关注。

在系统的易操作性方面,操作流程与界面设计出现频率较高,这与认知成本中的提交方式和时间精力相呼应。而系统的交互性只有5.2%的研究将其视为影响因素。

在认知成本和认知风险方面,五个因素均被研究者较多地提及。其中,提交方式和版权意识出现频率最高,体现了用户对提交行为所带来的时间成本及版权风险的担忧。

其他个人因素方面,超过20%的已有研究认为其他个人因素中的学科背景和认识程度对用户提交资源有较大的影响,专业素养和职称则极少被提及。

综上所述,笔者删除了出现频率小于10%的因素,构建了资源提交行为的影响因素模型(见表5)。

表5 资源提交行为影响因素模型

3.2.2 资源利用行为影响因素

从表4可以看到,已有文献对资源利用行为的研究较为分散,大部分因素的出现频率均在10%~30%之间。

在资源内容方面,资源类型的提及率最高。这与机构知识库建立的目的——保存机构内部各类型资源有着密不可分的关系。目前的商业数据库大多只存储了公开发表的信息资源,缺少灰色文献,机构知识库可以很好地弥补这一缺陷以吸引用户。此外,资源的更新速度这一因素虽然出现频率较低,但这并不意味其不重要,只不过这是一个平台维持运营的最为基础的要素,因此该因素不具备研究价值。

在资源获取方面,全文获取的提及率最高,达到了35.8%。可见,在学术资源被各出版商垄断的情况下,开放获取是机构知识库的一大优势所在。而检索效率和信息组织也对用户的利用行为有着不可忽视的影响。

在系统功能方面,个性化、交互性、丰富性和整合性缺一不可。如今,信息系统的种类越来越多,在基础性功能相似的情况下,必须要想方设法提供更为人性化的服务才能吸引并留住用户。

在系统的易用性方面,操作便捷、界面设计的出现率较高,而使用指南则很少被研究者提及。究其原因,可能在于用户并不希望花时间去阅读长篇大论的使用指南,而是希望系统本身的功能设计足够简单、友好。

在个人因素方面,同样是认识程度和信息素养会对用户的资源利用行为产生一定的影响。

综上所述,笔者删除了出现频率小于10%的因素,构建了资源利用行为的影响因素模型(见表6)。

表6 资源利用行为影响因素模型

4 推动高校机构知识库建设的对策

本研究构建的用户使用机构知识库的影响因素模型在一定程度上反映了用户愿意或不愿意使用高校机构知识库的原因,可为未来高校机构知识库的建设提供一些参考。需要注意的是,影响因素模型是基于用户视角构建的,其主体为用户,而机构知识库建设的主体是高校图书馆或其他有关部门。因此,从对策的角度出发,部分个人因素需要进行转化。如,时间精力因素可直接转化为系统的易操作性,信息素养、版权意识和认识程度等因素可以通过培训和宣传推广提升,资源保存、激励制度、提交方式、版权问题和用户对提交资源的控制权则均体现在机构知识库的政策中。

笔者于2020年11月—12月,调研了我国42所“双一流”建设高校,发现其中建立机构知识库并能够正常运行的共13个,分别是中国人民大学、北京航空航天大学、北京理工大学、天津大学、大连理工大学、山东大学、武汉大学、中南大学、重庆大学、西安交通大学、西北工业大学、兰州大学和湖南大学。笔者使用前文构建的模型,从资源内容、资源获取、系统可访问性、系统功能、系统易用性、机构知识库政策、促进因素等方面对这13所高校的机构知识库进行了网络调研。结合调研得到的高校机构知识库建设现状,笔者提出以下几点建议。

4.1 资源建设角度

对机构知识库的资源建设而言,建设者可以从丰富资源类型、建立完善的审核机制、提升资源可见度和资源覆盖率四个方面入手。

目前,我国高校机构知识库的资源数量较少,且资源类型依然以已经出版的文献资源为主,缺少研究报告、实验数据等内容相对复杂的灰色资源。而这些灰色资源恰恰是机构知识库区别于其他综合型数据库的重要因素之一。因此,高校机构知识库需要建立完善的激励机制以鼓励用户提交研究过程中的各类型资源。当然,这些灰色资源由于没有发表,其中的观点或许会存在一些不足或瑕疵,从而影响了科研人员对机构知识库的态度和自存储的积极性。所以需要对其质量加以审核,如对收录资源的范围进行控制、成立同行评议小组对文献的内容和质量加以把关[28]等。

现存的全文覆盖率低的问题也与机构知识库开放存取的建设目标背道而驰。对此,建设者需要遵循“适度开放”原则,采取组合的开放访问策略,针对不同类型的资源,支持不同粒度、不同范围的开放访问[32]。

此外,我国高校机构知识库中的信息难以通过直接搜索题名在搜索引擎中找到,而搜索引擎又是用户寻找信息的第一入口。因此,高校机构知识库需要通过支持移动端访问、使用合适的网页标题及标签、向搜索引擎提交网站的所有链接、做好内容更新和平台bug修改、确保元数据标准化等方式[33]不断进行搜索引擎优化以提高资源可见度。

4.2 功能建设角度

对机构知识库的功能建设和服务开展而言,建设者需要深入调研用户需求,不断拓展服务深度和广度。

①提供教学与科研支持服务。如,以具体课程为单位,提供相关教学资源的存档服务;嵌入到科研的各个流程中,为研究者提供数据支撑。②提供个性化增值服务。如,通过个人主页展示研究人员的个人信息、将学者感兴趣的内容通过关联微信或发送邮件的方式推送给学者等。③提供社交媒体功能。如,建立不同主题的交流讨论区,允许用户发帖,供用户对某个具体的资源或某些学术问题展开讨论等。④提供数据分析与统计功能。如,作者/院系等的发文量分析、学科发展态势分析、高质量论文分析、与竞争对手的比较分析等。⑤实现与其他系统平台的互联互通。如,与学校内部信息系统进行融合,促使科研过程中的隐性知识在不同社区里流动起来,从而使用户更方便快捷地获取所需信息[34]。

4.3 系统建设角度

对机构知识库的系统建设而言,需要强化系统平台建设,提高用户友好程度。首先,针对目前存在的网页响应速度慢的问题,高校机构知识库需要其对系统服务器进行升级,强化服务器性能,并及时维护。

在界面设计上,高校机构知识库可通过统计数据分析用户最关注的核心内容,有选择性地进行页面布局。与此同时,也可以创造性地运用与机构相关的特色元素进行视觉设计,并采用微交互技术丰富网页的内容。

除此之外,可通过简化注册流程、设置默认格式、提供自动格式转换和拼写纠错功能、提供自动保存功能等方式对资源提交流程进行简化,从而帮助用户节省时间和精力。

4.4 政策制定角度

对于机构知识库的政策制定而言,需改变目前政策含糊不清的现状,完善机构知识库政策体系,提升用户提交资源的积极性。

建设者可以在机构知识库建设初期采用强制提交的方式,加深研究人员对机构知识库的认识与理解[33],待研究人员形成习惯后再转变为用户自行提交,并辅以相关激励措施。如,将机构知识库中提交的资源纳入科研评价体系,作为绩效考核和职称晋升的依据之一[28];将图书馆的服务方式,如知识服务费用的减免、查新优先权等作为用户主动提交资源的奖励[27]。

此外,针对用户对于出版商反对自存储行为,以及自存储行为会影响预印本后续发表等问题的担忧,机构知识库需要建立完善的知识产权保护机制。如,机构知识库可以通过联盟的形式代表个体科研人员与出版机构协商,争取作者对论文的自存储权利[18];提供主要出版机构的版权政策查询功能[35];建立反剽窃机制等[28]。

4.5 宣传推广角度

对于机构知识库的宣传推广而言,建设者需要针对不同的用户采取不同的宣传策略,扩大机构知识库的影响力。

在面向领导层的宣传中,需要将机构知识库所能带给学校以及师生的益处加以说明。在面向科研人员的宣传中,可采用学科馆员渗透式宣传策略,有助于快速、高效地与科研人员建立联系。如,在学院内部召开演示会或推介会,重点介绍机构知识库相对于传统出版的优势,并开诚布公地解答用户对于一系列不利因素的担忧。在面向学生的宣传中,需要通过更加丰富、有趣的宣传方式进行机构知识库的推广。如利用图书馆微信公众号、微博等新媒体对其进行介绍;通过制作微视频或举办知识竞答等活动吸引学生们的注意力;建立机构库代言人制度,即在不同学科内甄选有一定影响力的科研人员让其为机构知识库进行宣传,从而在学术圈内推广机构库[27]。

猜你喜欢
类目知识库机构
本期练习题类目参考答案及提示
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
一周机构净减仓股前20名
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
《中图法》第5版交替类目研究综述
黄三角、长三角、珠三角明、清及民国通志一级类目比较*