百度学术在武汉大学图书馆的应用思考*

2021-05-19 08:44:14程颖凃艳玲李云华
数字图书馆论坛 2021年2期
关键词:网址后台百度

程颖 凃艳玲 李云华

(武汉大学图书馆,武汉 430072)

百度学术于2014年6月上线,是百度旗下的免费学术资源搜索平台。它收录了包括中国知网、维普网、万方数据、Elsevier、Springer Nature、Wiley、NCBI等120多万个国内外学术站点,索引超过12亿个学术资源页面,整合了包括学术期刊、会议论文、学位论文、专利、图书等类型在内的6.8亿多篇学术文献[1],为科研工作者提供学术搜索服务。2015年百度学术发布“高校图书馆”计划[2-3],与高校图书馆开展合作,以提供连接用户和图书馆的知识发现服务[4]。如何应用百度学术,为科研工作者提供更好的学术资源服务,是高校图书馆需要思考的问题。

1 百度学术与国内高校图书馆的合作情况

百度学术的“高校图书馆”计划拟通过获取高校的学术资源数据,为高校图书馆提供定制的知识发现服务[2]。2015年百度学术与北京大学图书馆、中国高等教育文献保障系统(China Academic Library &Information System,CALIS)签署合作协议,三方在高校图书馆的信息资源建设、知识发现服务完善、学术评价体系创新等方面展开全面合作,以共同为中国高等教育提供更优质的科研服务[2]。2017年百度学术与武汉大学图书馆(以下简称“武大馆”)签署《百度武大AI图书馆合作框架协议》,将武大馆的学术资源与百度学术的资源进行整合[5]。百度学术不断面向学术机构开展合作,目前已与西安交通大学[6]、国家标准馆、全国地质资料馆等国内高等院校及学术机构建立了合作关系[7]。

高校图书馆通过与百度学术合作,将已购资源和自建资源与百度学术的元数据进行对接,将传统图书馆业务和互联网搜索产品进行深度融合及资源优势互补,为图书馆用户提供一个统一的文献检索入口,以及信息集成与推送服务。笔者于2021年2月调研了高校图书馆的网站,发现北京师范大学、哈尔滨工业大学、浙江大学、兰州大学、厦门大学等高校的图书馆均在其主页中嵌入了百度学术统一检索入口。其中,国内36所“双一流”大学A类高校有17家图书馆主页中嵌入了百度学术统一检索入口,占比47%。可见,百度学术在重要高校中也得到了一定范围的应用。

国内图书馆界对百度学术也进行了研究。笔者于2021年2月在中国知网中以篇名包含“百度学术”进行检索,获取25篇论文。这些论文大多从个体用户体验的角度研究百度学术[3,8-11],缺少高校图书馆与百度学术合作实践类的文章。本文以百度学术在武大馆的应用为例,介绍百度学术本地化的实践经验,探讨存在的问题,以期为其他图书馆应用百度学术提供参考。

2 百度学术在高校图书馆中的应用特点

通过对百度学术的测试、应用与分析,百度学术在为高校图书馆用户提供服务时主要具有以下特点。

(1)实现中文资源和外文资源的统一检索。国内公司的发现系统一般侧重于整合中文资源,整合的外文资源相对较少。百度学术通过与期刊方的合作[7],丰富了外文资源元数据,其整合的外文数据库包括Elsevier、Springer Nature、Wiley、Taylor & Francis、Gale、ProQuest、HeinOnline、EBSCOhost、Brill等知名数据库。武大馆在百度学术后台中筛选出的外文库共有140个。对于中文资源,国外公司的发现系统一般只整合了万方数据、维普网、超星电子图书等少数几个中文库。百度学术依托本土优势及品牌效应,相继与国内图书馆、标准馆、资料馆等资源机构合作[7],以补充百度学术的中文资源。百度学术整合的中文资源包括博看网畅销期刊数据库、人大复印资料、中国财经报刊数据库、国家哲学社会科学学术期刊数据库、国内标准、地质成果报告等。武大馆在百度学术后台中筛选出的中文库共有17个。百度学术共收录中外文学术资源总量逾2亿条,其中,中文资源超1.5亿条,外文资源超1亿条[11]。从总体上看,百度学术收录中外文资源比较齐全,实现了中文、外文资源的统一检索。

(2)提供更多全文获取方式。百度学术依赖百度搜索技术,在全网范围内收集和整理了更多的全文获取方式,包括网络免费资源、开放存取资源、PDF全文直接下载、在线文档分享平台下载、求助全文、单篇购买等。即使图书馆未订购数据库,用户也可能通过其他方式获得所需资源的全文,也可以从多种方式中选择最便捷的全文获取渠道。同时,百度学术数据量大,整合的免费资源及OA资源多,共计几十万个OA站点,提供1.2亿条文献级免费下载来源,使用户更易获取免费资源。

(3)提供快速稳定的检索服务。百度作为国内知名的搜索引擎技术公司,具有先进的检索技术。武大馆对百度学术进行长时间的系统测试,发现百度学术依托百度服务器IT系统,系统稳定,检索速度快,检索结果通常在1秒内呈现。而且,百度学术沿用百度搜索简洁的页面风格,检索功能简单、易用,符合中国用户的检索习惯。从武大馆应用百度学术后的用户反馈来看,相较于其他发现系统,用户普遍更喜欢和习惯使用百度学术。

(4)提供个性化的学术资源服务。百度学术对海量的学术资源进行大数据计算,提供研究点、学科、学者、机构等知识对象的可视化关联图,以及研究背景、研究动态、研究趋势等整个研究点的知识集成服务,并对用户的阅读习惯进行分析,提供用户个性化的论文推荐及热词推送的知识推荐服务。图书馆也可以定制本地百度学术的名称、LOGO图标,以及数据库资源和用户行为的统计,并调用百度学术API接口,以获取百度学术的资源检索及查找等增值服务。

3 武汉大学图书馆百度学术应用实践

百度公司在搜索业处于技术领先地位,又有丰富的教育资源。武大馆希望通过引入百度学术,将图书馆传统的学术资源与网络教育资源、其他机构的学术资源相结合,以深挖图书馆文献及服务发展的潜力。为推动百度学术本地化实践,武大馆成立了百度学术项目工作组,主要由3个部门组成。①资源组织部。主要负责项目整体组织、协调与资源管理,包括百度学术后台管理、数据库配置、与百度公司联系等。②咨询部。主要负责百度学术的检索与宣传,包括百度学术网站的检索、百度学术的宣传、培训、统计与用户咨询等。③系统部。主要负责百度学术的技术支持,包括IP地址配置、校外访问的配置、百度学术快速搜索入口的配置等。

3.1 实施流程

武大馆百度学术的实施流程主要分为十大步骤。①申请开通百度学术。图书馆与百度公司签署合作协议后,向百度公司申请引入百度学术,并提交申请资料。百度学术工作人员对申请资料进行审核,审核通过后为图书馆开通百度学术后台的管理权限。②用户管理。图书馆在百度学术后台配置管理员,将管理员分为资源管理员、统计管理员、网页管理员及系统管理员4种类型,各管理员各司其职。其中,系统管理员总管其他的管理员,以保障后台系统的安全。③配置机构信息。由系统管理员在百度学术后台配置本地机构的信息,包括本地百度学术的名称、IP地址及电子期刊导航的网址等。④筛选数据库。由资源管理员在百度学术后台筛选图书馆订购的商业数据库、OA库及网络免费库。⑤设置校外访问。由系统管理员设置校园网外用户访问百度学术的方法,并进行测试。⑥图书馆主页中嵌入百度学术快速搜索入口。确定图书馆本地的百度学术个性化名称,并制作本地LOGO图标。从百度学术后台的嵌框配置页面获取百度学术的嵌框代码,改编代码后,在图书馆主页中嵌入百度学术快速搜索入口。⑦在图书馆的其他系统中调用百度学术API接口。将API接口引入图书馆其他系统,可利用百度学术的资源检索、查找免费文档,查询被引频次的服务。如在EDS发现系统中调用百度学术的检索服务API接口,可返回百度学术前3条检索结果。⑧系统整体测试。图书馆配置完本地的百度学术后,主要由资源组织部、咨询部和系统部3个部门对百度学术进行全面测试,测试内容包括资源检索、全文获取、页面显示、资源关联等多个方面,并汇总测试中发现的问题,向百度公司反馈,并督促其修改。⑨百度学术正式上线。图书馆测试百度学术满足正式上线的条件后,制作百度学术宣传海报,发布上线通知,并开展百度学术的使用培训。⑩用户咨询与统计。咨询部负责解答用户对百度学术使用的咨询问题,并汇总用户意见,反馈给百度公司,并开展百度学术资源与用户访问的统计与分析。

3.2 后台管理

百度学术后台是图书馆管理百度学术的入口,图书馆通过后台可以对百度学术进行六大方面的管理。①机构信息管理。图书馆在此可准确配置机构的各种本地信息。②嵌框管理。配置本地百度学术的快速搜索入口,以生成本地百度学术的嵌框代码。③数据库管理。管理百度学术知识库中的各种数据库,以便在百度学术网站中实现各种资源的统一检索。④统计管理。配置本地资源分析数据,以及用户使用统计数据等。⑤接口管理。管理百度学术的API接口,以便其他系统可以利用API接口进行系统开发。⑥用户管理。对后台管理员进行分类,规定每类管理员的工作范围和工作职责,以保障后台的安全。

3.3 数据库筛选

筛选数据库是百度学术本地化实施的重点,也是百度学术日常维护工作的重要内容。通过筛选数据库,用户在百度学术中可及时发现图书馆已购资源,既方便用户下载文献,也方便用户选择是全网范围内检索还是图书馆范围内检索。武大馆制定了数据库筛选策略。①针对商业库,筛选原则是“精确”。选择商业库后,百度学术网站中的数据库名称后面会自动出现“武汉大学图书馆订购”字样,因此,勾选商业库务必精确。遴选时应将后台中的数据库描述信息与数据库商提供的信息进行精确比对,比对项包括数据库名称、数据库商名称、数据库网址、资源类型、资源数量、资源清单等。②针对OA及免费库,筛选原则是“全面”。OA及免费库为用户获取全文提供了便利,而且名目繁多,因此,选择此类数据库时应尽可能全面。首先收集和汇总这类库信息,一种可从SFX系统和EDS发现系统等相关系统中收集,另一种可从中国科学院OAinONE网等图情机构网站中收集,然后在百度学术后台中找到这些库并确定。而且,后台中这类库名称往往包含free、open、OA等字符,通过检索这些字符,也可找到一些OA及免费库。根据以上策略,在百度学术后台共筛选出数据库180个,其中外文库140个、中文库17个、OA及免费资源库23个。

3.4 实施效果

2018年起武大馆实施百度学术的本地化应用,在图书馆主页中嵌入了百度学术统一检索入口。2018—2020年武大馆百度学术的月度浏览量平均值为292 118次,月度浏览量峰值达646 095次;月度访客数均值为46 532人次,月度访客数峰值达80 397人次,月度访客数如图1所示。由于受疫情的影响,2020年上半年百度学术的访客数有所下滑,但从2020年9月开始,访客数开始回升。

武大馆主页中同时嵌入了百度学术和EDS发现系统的快速检索入口,将两者的访问统计数据进行对比发现,2018—2020年百度学术的访问统计数据均优于EDS发现系统。以访客数为例,百度学术与EDS的年度访客数对比的柱形图如图2所示,可以发现百度学术的年度访客数与EDS相比,具有较大优势。

图1 2018—2020年百度学术的月度访客数

图2 2018—2020年百度学术与EDS发现系统的年度访客数

从用户反馈看,武大馆用户在使用本地化的百度学术后反映百度学术系统比较稳定,检索速度快,界面清晰、易懂,符合中国用户的检索习惯。而且,百度学术数据量大,与武大馆EDS发现系统形成资源互补。此外,武大馆用户可以灵活地选择全网资源范围内检索,还是武大馆内资源检索,可更有效地定位武大馆已购资源。研究领域的可视化关联分析及论文推送等知识集成服务为用户了解整个知识点的研究态势提供了较好的科研体验。

4 百度学术在武汉大学图书馆本地化应用中存在的问题

从武大馆应用百度学术及使用情况看,存在一些问题,主要表现在以下方面。

4.1 后台管理功能简单

目前百度学术后台的管理功能较简单,如个性化服务的配置只有设置本地百度学术的名称和LOGO图标等少数功能,而不能定制本地百度学术网站的风格、检索功能、学科分类等。后台的管理员类型只有“机构管理员”一种选择,致使所有管理员拥有同样的操作权限,不利于百度学术系统的操作安全。百度学术提供图书馆的操作权限有限,如图书馆没有权限添加后台管理员,必须求助于百度公司技术人员添加。当图书馆发现后台中的数据库描述有误、网址链接失效等问题时,图书馆也没有权限修改,必须求助于百度公司解决,影响了问题处理的效率。因此,从百度学术后台的总体功能看,百度学术赋予图书馆的权限和功能较少,图书馆操作空间非常有限,主要就是筛选数据库。这种方式虽然能够加强百度公司对百度学术的集中化管理,减少图书馆本地维护的成本,但是,从图书馆角度,缺乏图书馆个体的灵活性和本地的适用性,使图书馆发现问题时往往因无权限而无法及时处理,必须依赖百度公司去解决问题。

4.2 数据库筛选较困难

百度学术后台的数据库众多,筛选数据库比较困难。造成数据库筛选困难的原因,一是后台中的数据库描述字段常出现空白、无效或不匹配等情况。如“数据库名称”字段常与数据库商提供的库名不匹配。二是后台知识库中收录的数据库不全。以外文数据库为例,武大馆有109个外文库在百度学术知识库中没有找到,外文库筛选总量占武大馆外文库总量56.2%。对于中文数据库,武大馆一共筛选了17个中文库,另有78个中文库在百度学术知识库中未找到,中文库筛选总量占武大馆中文库总量17.9%。从总体上看,百度学术数据库筛选率并不高,且可勾选的资源类型大多为图书和期刊,资源类型不够丰富,缺少法律报告、档案、视频及音频等类型的资源。

4.3 资源整合粒度不够

虽然百度学术整合了大量资源,但资源整合不够精细和完善。①“全部来源”中的网址整理杂乱。存在同一资源有多个网址的情况,如“软件学报”有3个网址,其中一个为“软件学报”官网,另两个为PDF全文下载。存在网址失效的情况,如IP网址失效较多,武大馆未购买360LINK产品,网址来源中却出现了360LINK链接,失效网址影响了百度学术的用户体验。此外,网址来源归类也存在问题,如“全部来源”中有些免费资源并未归入“免费下载”类型中。②需谨慎对待“求助全文”的法律问题。“求助全文”是百度学术为用户搭建的学术资源免费互助平台,在该平台中可向其他用户发出文献求助请求,等其他用户应助后可获取全文。商业库一般规定未经明确授权许可,用户不能将下载论文的全文公开传播,否则侵犯论文的著作权,因此,“求助全文”平台是否会带来法律纠纷,有待深思。③单篇购买存在安全风险。百度公司联合中国教育图书进出口公司共同推出了单篇文献购买服务,允许用户在百度学术中用网上支付方式购买Wiley、Cambridge、Talor等12家合作数据库商的1 300多万篇文献。网络支付方式会存在钓鱼网站、网上支付密码泄露等安全风险。

4.4 检索功能有待改进

百度学术的检索问题主要表现在两个方面。其一,检索功能较简单。百度学术高级检索中的检索选项少,如“出版物”选项中只有期刊和会议两种资源类型。“语言检索范围”选项中只有中文和英文两个语种。高级检索未提供布尔运算符的组配检索,也不支持二次检索、主题词检索、ISBN和ISSN号检索等其他检索方式。其二,分面检索功能不完善。分面检索提供的列举项有限,每个分面最多列举10个选择项,如“类型”分面中只列举了期刊、学位、会议、图书和专利5项,因此,用户无法查看这5项之外的其他类型资源。而且,分面检索内的各列举项间只能单选,不能多选,当用户检索交叉学科资源时,则无法同时选择多个学科。有的分面检索名称不规范,如“类型”分面中有“学位”项,但实际为“学位论文”;“领域”分面实际为教育部“学科分类”。此外,有的分面排序不符合图书馆本地的实际情况,如百度学术中的“领域”分面依据学科文献的数量进行排序,而未依据检索词相关度进行排序。

5 推进百度学术在高校图书馆中应用的建议

高校图书馆在应用百度学术中存在一定的问题,且高校图书馆对本地百度学术的管理功能有限,因此,高校图书馆需与百度学术在以下方面进一步加深合作,并被赋予更多的管理权限,以促进百度学术在图书馆的应用更加完善。

5.1 赋予图书馆管理员更多后台操作权限

对于百度学术后台功能较简单、图书馆管理员操作受限的问题,图书馆可以与百度学术在以下方面共同商讨以完善后台功能。①提供更多个性化的本地定制功能,以便图书馆可以根据本地情况自行定制图书馆的百度学术网站风格、学科分类体系、分面浏览、馆藏资源的深度分析,以及用户行为的深度分析等。②提供更多百度学术应用程序API接口,图书馆可以在OPAC、其他发现系统、特色数据库等其他系统中调用API接口,以便图书馆的其他系统也能够充分地利用百度学术的增值服务。③赋予图书馆管理员更多的后台操作权限,图书馆管理员就可以更有效地管理本地化的百度学术。如添加本地的百度学术后台管理员,设置管理员类型及操作权限,修改有误的数据库信息、维护无效的网址来源等。

5.2 规范数据字段,丰富数据来源

一方面,高校图书馆有专业的编目团队,可以充分利用其编目经验与百度学术在规范元数据方面展开合作。可修改不规范及易引起歧义的数据库描述字段名称,如将描述资源总量的“全部期刊数”字段名改为“资源总量”;可增加用于匹配数据库的字段,如增加“数据库介绍”“收录年限”等字段,以便图书馆更易筛选数据库;还可以将百度学术后台知识库中的数据设为全局描述和本地描述两种类型,图书馆可以修改本地描述,以便根据图书馆的实际情况修改不适用于本地及有误的数据。另一方面,高校图书馆可以上传馆藏纸本资源的书目数据及自建数据库的元数据,以实现图书馆更多资源的统一检索。也可利用其中文编目经验与百度学术在中文元数据整合技术方面展开合作,以加大百度学术中文资源的收录力度。

5.3 规范数据来源,保障网址有效性

高校图书馆可以与百度学术合作,以更好地梳理百度学术收集的各种来源,保障各来源的有效性和准确性。①整理所收集的各种来源,并将各来源准确地归类。合并各种重复来源,使各来源以唯一形式显示出来。②尽可能收集具有OpenURL、DOI等稳定网址的来源,这类网址可保持长期有效,能减少今后的网址维护量。③加强网址的监管,以保障各来源网址的有效性。在各网址接入百度学术之前,设定网址入库的准则,检测结果为有效的网址才被允许入库;在各网址接入百度学术之后,将网址监测纳入日常的监管范围,制定日常的网址扫描计划,并按网址的稳定性设定不同的扫描频率,对扫描出的失效网址进行清理。此外,高校图书馆还应注意百度学术提供的各种服务是否均在法律允许的范围之内,对于可能带来法律问题的服务不予采用,如可能侵犯论文版权的“文献互助”服务可不在高校图书馆本地化的百度学术中出现,以避免法律纠纷。

5.4 完善检索功能,满足用户需求

高校图书馆可运用其图情专业优势与百度学术深度合作,增强和完善百度学术的检索功能,以满足用户深层次的检索需求。可在高级检索中增加更多的检索选项,面向各种类型、各种语种的资源,并提供二次检索、布尔运算符组配检索、多字段检索、通用命令语言检索等多种检索方式。还可以借鉴商业数据库、发现系统和图书馆集成系统等其他系统的检索优势,使百度学术的检索功能不仅更符合用户的检索习惯,而且能更精准地检索出所需资源。在分面检索方面,可以增加一些分面类型,扩展分面的选项,并支持分面选项间的多选,以帮助用户更精准地限定检索范围。图书馆还可以根据本校的实际情况灵活地调整百度学术的分面排序,如将“收录”分面调整为根据本校对核心和索引的认可度来进行排序。

6 结语

武大馆与百度学术合作,在本地应用了百度学术,将图书馆已购资源与百度学术的资源进行对接,在图书馆主页提供百度学术统一检索入口,以为武汉大学师生提供快速、稳定的知识集成与推送服务。今后,高校图书馆可以与百度学术加深合作,将图书馆传统学术资源与百度学术的网络学术资源以及其他机构的学术资源进行深度融合与集成,形成资源优势互补。高校图书馆还可以利用员工的图情专业优势提高百度学术的元数据质量,完善检索功能及知识集成服务,以期给高校师生提供更好的科研体验。

猜你喜欢
网址后台百度
2023年6月全宅影音器材编辑推荐
本刊网址变更通知
Robust adaptive UKF based on SVR for inertial based integrated navigation
百度年度热搜榜
青年与社会(2018年2期)2018-01-25 15:37:06
后台暗恋
前台、后台精彩花絮停不了
风采童装(2016年2期)2016-08-02 09:18:38
百度遭投行下调评级
IT时代周刊(2015年8期)2015-11-11 05:50:22
本刊网址变更通知
百度“放卫星”,有没有可能?
太空探索(2014年4期)2014-07-19 10:08:58
本刊网址更改通知