魏瑞斌++郭一娴
〔摘要〕[目的/意义]从用户体验的视角对百度学术的功能进行分析,发现其优点和不足,为用户使用百度学术提供借鉴。[方法/过程]首先将百度学术的功能分为检索功能、检索结果展示和个性化服务3部分;然后选择不同的检索词进行检索,对检索结果进行比较分析;最后利用百度学术提供的相关搜索词,从用户检索角度,对17种图书情报学期刊的關联性进行了实证研究。[结果/结论]研究发现,①百度学术可以满足用户基本的学术信息检索需求;②百度学术为用户提供了较为丰富的筛选功能,便于用户从检索结果中查找所需要的学术信息,同时为用户提供了与检索结果相关的推荐信息;③百度学术的个性化服务可以满足用户对检索结果的管理需求,并为用户提供学术信息的推荐服务。
〔关键词〕百度学术;学术搜索引擎;用户体验
DOI:10.3969/j.issn.1008-0821.2017.05.015
〔中图分类号〕G2549〔文献标识码〕A〔文章编号〕1008-0821(2017)05-0089-09
Study on the Baidu Scholar based on the User ExperienceWei RuibinGuo Yixian
(School of Management Science and Engineering,Anhui University of
Finance and Economics,Bengbu 233030,China)
〔Abstract〕[Purpose/significance]The paper analyzed the function of the Baidu Scholar from the viewpoint of user experience and found its merits and demerits to help user using the Baidu Scholar.[Method/process]First the function of the Baidu Scholar was divided into three parts which were retrieving information,showing the search results and providing personal service.Second the paper analyzed the retrieval result using the different keywords.Third the paper studied the correlation of the 17 Library and Information journals based on the relative keywords from the Baidu Scholar.[Result/Conclusion]The main findings are that:①Baidu Scholar could satisfy with the basic information requirements.②Baidu Scholar could help user to find their academic information from the retrieval result and provide many information recommendation associated with the retrieval result.③The personal service of Baidu Scholar could satisfy the requirement to manage the retrieval result and provided the academic information recommendation for user.
〔Key words〕Baidu scholar;academic search engines;user experience
中国互联网信息中心发布的《2015年中国网民搜索行为研究报告》[1]显示,截至2015年12月,我国搜索引擎用户规模达566亿,使用率为823%;手机搜索用户数达478亿,使用率为771%。搜索引擎是中国网民的基础互联网应用,截至2015年,使用率仅次于即时通信。调查结果还显示,749%的PC搜索用户在工作、学习场景下使用搜索。近年来,几大搜索引擎公司竞相开展差异化竞争策略,主要是通过推出搜索体验升级的新产品。谷歌、微软和百度都先后推出了专门的学术搜索引擎,为用户提供学术性的信息服务。
国内外学者对学术搜索引擎已经进行了一系列相关研究。Jacso P[2]对Web of Science、Scopus和Google Scholar个数据源进行了比较研究;Falagas ME等[3]对PubMed,Scopus、Web of Science和Google Scholar的优势和不足进行了比较研究。陈家翠和谷玉荣[4]利用Google Scholar、EI和SCIE的作者检索功能,对它们的检索结果进行了比较分析。翟晓娟和许鑫[5]在介绍Google向学术领域的发展及存在的问题的基础上,阐述了在Google时代图书馆面临的困境和挑战。董文鸳[6]对国内谷歌学术的研究成果进行了文献计量分析,并指出的研究过程中存的一些问题。Peter J[7]从文献计量的视角,分析了微软学术搜索的优点和不足。赵蓉英和陈烨[8]对Google Scholar和Microsoft Academic Search进行了比较研究。笔者[9]曾利用微软学术搜索进行了信息检索领域研究成果的文献计量分析。
2014年6月初百度学术搜索上线。它是百度旗下提供海量中英文文献检索的学术资源搜索平台,涵盖了各类学术期刊、会议论文,旨在为国内外学者提供最好的科研体验。百度学术搜索收录了国内外学术站点超过70万家,如中文学术站点知网、万方、维普,外文学术站点ACM、IEEE、Springer等。其共计收录中外文学术资源总量逾2亿,中文超15亿,外文超1亿。据悉,百度学术是国内首个拥有亿级别索引量的互联网学术平台,其“一键直达”的检索功能是其它数据库不能比拟的[10]。目前,国内对百度学术的相关研究成果还很少,笔者在CNKI的期刊全文数据库中只检索到一篇相关文献。刘敏[11]对Google Scholar、Microsoft Academic Search、百度学术搜索和360学术搜索,从文献来源等4个方面进行了分析,指出了它们在学术信息容量等6个方面的优势与不足。
用户信息体验是用户在获取与利用信息产品(服务)过程中建立起来的一种纯主观的心理与感知,是用户对基于信息产品与服务的特性、功能、价值等所做、所想、所感的综合反映。从刘冰提出的“网络环境中的用户信息体验模型”看,用户信息体验包括技术功能体验、情感心理体验和将效用价值体验3个方面[12]。裴一蕾等提出了基于用户体验的搜索引擎评价指标体系[13]。本研究将在这些相关研究的基础上,从用户信息体验的视角的对百度学术进行研究,以期对百度学术搜索的功能及其应用进行一个较为深入的研究。
笔者认为,从信息检索的角度,百度学术的功能可以分为检索功能、结果展示和个性化服务3个方面(图1)。
11检索功能
百度学术有一般检索与高级检索两种检索方式。
一般检索只提供一个检索框,比较适合确定性检索。如用户已经知道论文标题,在搜索框内输入标题即可直接检索。
高级检索可以从关键词、作者、出版物(包括期刊和会议两种类型)、成果发表时间多个途径同时进行检索。它还支持多个关键词同时检索、检索词精确检索,用户可以限定检索词出现的位置(包括文章任何位置和文章标题)。它适合用户需求模糊的检索,或者是多途径的复合需求检索。
百度学术的检索界面与谷歌学术的检索界面基本一致,只是其高级检索不提供逻辑非检索。与CNKI、万方、维普等期刊数据库相比,百度学术不提供作者单位、支持基金、是否优先出版期刊等条件的限制功能。百度学术供用户选择的检索途径不是非常丰富,但已经能够满足用户检索学术文献的基本需求,而其对检索结果的筛选功能,又一定程度上弥补了检索途径所存在的不足。
12结果展示
笔者分别选择了用中文和英文两种语言进行了关键词检索、作者检索和出版物检索。对于不同的检索内容,百度学术给出的结果展示也有差异。
121关键词检索
笔者分别以“大数据”和“Big Data”为检索词,出现位置限定在文章标题。从图2看,检索结果中给出了标题当中包含“大数据”的文献信息。图上方给出了文献的3种类型,期刊、会议和学位。但从结果看,点击“学位”标签时,并没有看到相关结果。这表明,百度学术目前还不提供学位论文的检索。图2左边列出了这些文献按不同时间的统计结果,并支持用户更改时间范围来查看结果。百度学术还把检索结果按领域和期刊收录情况进行了自动统计。从本次结果看,大数据的相关论文分布的前10个学科包括计算机科学与技术、电子科学与技术、应用经济学等。其核心是指论文发表在SCIE索引、EI索引和SCI等索引数据库收录的期刊中。图右边给出了“大数据”的10个相关词,3种相关期刊和6位相关学者。这些关键词、期刊和学者都提供相应链接,用户点击之后可以快速转换到相应的网页。
用户还可以选择将搜索结果按照“相关性”、“被引频次”、“发表时间”3个维度分别排序,以满足不同的需求。检索结果中,用户可以看到每篇文献的题名、作者、发文期刊(或会议名称)、摘要、关键词、论文被引频次等信息。论文标题、作者、发文期刊(或会议名称)和关键词都有相关链接,用户可以很方便地查看相关的信息。它还提供了论文的不同版本,有些是指向知网、万方等信息源,用户可以通过这个指引来获取原文;有些是可以提供免费下载的信息源,用户既可以点击链接可以直接下载原文,图2关键词“大数据”在百度学术的检索结果
也可以直接点击后面的免费下载来获得原文。用户如果对文章感兴趣,还可以将其收藏到百度学术提供的“我的学术”。如果作者想引用目标文献,直接点击引用,还可以在弹出的窗口(见图4)选择不同的引用格式(GB/T、MLA和APA)。这个功能既方便了用户撰写论文时列举参考文献,又在一定程度上提高了其参考文献信息的准确性。但笔者在检索过程中也发现,有些文献的参考文献格式并不完全准确,因此用户利用这一功能时仍需认真核实。另外,用户还可以将检索到的文献信息导出为BibTeX、EndNote、RefMan和NoteExpress这4种文献管理软件对应的文件格式,便于对文献信息进行管理。
从图3看,用英文词检索的结果与中文词有一定差异。不同之處是图的右边只有10个相关词,没有提供相关期刊和作者的信息。其检索结果中,有一些文献的全文的语言都是英文;有些文献的全文是中文,只是其标题和摘要是英文。谷歌学术的检索结果也是类似的情况。图3关键词“Big Data”在百度学术的检索结果
122作者检索
笔者分别以“武夷山”和“Ronald,Rousseau”为检索词进行了作者检索。作者为“武夷山”的检索结果一共有2 430条记录;如果加上检索词为“中国科学技术信息研究所”,其出现位置为“文章任何位置”则检索结果只有20条记录。如果用户想了解中国科学技术信息研究所武夷山发表的文献,那么前者给出的结果太多,遴选起来比较困难;后者给出的结果又太少,只是其研究成果很少的一部分。笔者还发现,在前者的检索结果当中,有些文献的作者并不是“武夷山”,题名为“武夷山不同海拔植被土壤易氧化碳”、“武夷山风景名胜区景观生态评价”,其作者的机构分别是“武夷山风景名胜区管理委员会”和“福建武夷山国家级自然保护区管理局”。同其它搜索引擎和文献数据库一样,百度学术在处理“作者同名”问题没有太好的改图4引用链接的对话框
善。这个问题的解决只能靠用户自己对检索结果进行甄别。
从图5和图6看,检索结果右边有一些差异,图6右边有10个“相关热搜词”,而图5没有。从图6看,右边给出的词语与作者的相关性并不强,大部分词语与作者本人的研究领域基本没有交集,这此词语的实际意义并不大。笔者输入“Ronald,Rousseau”,但检索结果中,作者为“R Rousseau”的文献也可以检索出来。另外,尽管笔者使用“精确检索”,但检索结果中出现了“DM Rousseau”的文献。从中可以看出,检索结果并不十分准确。图5作者“武夷山”的检索结果
笔者点出图5和图6左边提供的时间统计结果、领域统计结果和核心统计结果发现,其后面给出的数字并不十分准确。如图5左边给出2014年以来后面是110,但实际点击之后右边却只有25条记录。笔者点击多个标签,发现左边数字与右边记录数吻合的几乎没有。尽管这个功能非常好,但如果给用户提供的是不准确的信息,那么最好还是舍弃。
123期刊检索
笔者分别以“图书情报工作”和“Scientometrics”为检索词,进行了期刊检索,检索结果分别为69 600条和14 700条记录。记录数远远超过了检索结果中两种期刊的发文数量。
从图7和图8看,检索结果为用户提供的信息有一些差异,图7左边提供了相关热搜词、相关期刊和相关学者的信息,而图8没有提供。这两张图中,百度学术提供了期刊发文量和被引的信息(累積数和年度数),用户通过期刊的年度被引数据可以快速发现这其哪些年份被引的次数较多,其年度被引数据的变化情况。从图7和图8对比看,《图书情报工作》的研究领域是“图书馆、情报与档案管理”,这个定位是准确的。笔者在2014年3月16日检索时,《中国图书馆学报》、《情报学报》的研究领域是“科学技术史”;《图书情报工作》、《情报理论与实践》、《情报杂志》等图6作者“Ronald,Rousseau”的检索结果
期刊的研究领域是“战略、战役、战术学”。这些期刊研究领域的标注是不准确。但在2014年3月24日检索时,这些期刊的研究领域都修改成了“图书馆、情报与档案管理”。由此可以看出,百度学术结果处于一个不断优化的状态。检索结果中还存在一些明显的错误。如一篇文献的篇名是“编者的话”,其作者等信息是“武夷山-《图书情报工作》,2014,(8)-万方-所有5个版本”。点击相关链接时发现,指向维普的链接对应的是武夷山的王惠临在《图书情报工作》2006年第9期上的发表的文章,而指向万方的链接是武夷山在《情报学报》2014年第8期上发表的文章。尽管文章标题相同,但并不是同一篇文章。在用户对数据要求较高的情况下,这种检索结果是非常不理想的。图7《图书情报工作》的检索结果
笔者对比了一下《图书情报工作》在CNKI的发文量,在2005-2014年期间,百度学术2011年、2013年和2014年的发文量数据低于CNKI,而其它7年的发文量数据都高于CNKI。这反映出百度学术在数据更新速度要慢于CNKI,同时其数据的准确性方面也存在一定的不足。
13个性化服务
百度学术还为用户提供了一些个性化服务以满足不同用户的独特需求,如我的学术、订阅搜索等功能。
131我的学术
“我的学术”可以看作是百度为用户创建的一个“虚拟学术空间”。用户可以利用百度帐号、QQ号、微博等途径登录自己的“我的学术”,也可以通过注册新账号来建立“我的学术”。它主要包括“我的收藏”和“我的订阅”两种功能。图8《Scientometrics》的检索结果
“我的收藏”(图9)是面向历史数据的,其类似于E-learning、Endnote、Noteexpress等软件。用户可以像在电脑上建立文件夹一样,分类管理收藏的文献。用户完成检索之后,点击文献后面的“收藏”按钮,该文献的信息(包括题名、作者、摘要、关键词、发文期刊、页面范围、被引次数)就自动加入到“我的收藏”之中。用户还可以看到收藏文献的年度被引图,从而了解论文随时间变化的情况。在我的收藏中,用户还可以通过相关目标文献的链接,从知网、万方等信息源获取全文信息。图9百度学术中的个性化服务——我的收藏
“我的订阅”(图10)是面向未来数据的,其类似于RSS阅读器。用户完成检索之后,可以点击网页上面的“订阅该搜索”。这样百度学术就自动把与该搜索相关的文献信息不定期地向用户推荐。如果出现与用户搜索相关的新文献,它会自动弹出“消息提示”,这就减少了用户搜索的时间并提高了效率。用户登录百度账号后,在我的学术中选择“我的订阅”,即可查看已经订阅的信息。用户可以点击“我的订阅”下方的“添加订阅”,输入所需订阅的内容,即可完成订阅。用户搜索的文献也可以设定其来源,如北大核心期刊和SCI索引等。当用户想对某个领域、某个作者或某种期刊的文献信息进行跟踪时,这个功能方便实用、事半功倍。图10百度学术中的个性化服务——我的订阅
132搜索设置
百度学术还具有搜索设置、意见设置、帐号设置、链接全部产品等服务。搜索设置包括搜索框提示、搜索语言范围、搜索结果显示条数、输入法、搜索历史记录的设置。用户在利用百度学术过程中如果有相关意见,还可以通过意见反馈功能直接反馈。这既利于用户问题的解决,也有利于百度学术的进一步完善。在百度学术的页面,用户还可以直接通过点击相关图标,直接链到百度搜索、百度文库和百度百科等其它产品。
133信息安全
在信息安全方面,用户可能通过帐号设置功能,可以修改个人资料,修改密码,它还有用户提供了密保工具和密码管理功能。用户还可以将百度学术登录的帐号与个人微博、人人网、QQ号、飞信、微信和腾讯微博等帐号进行关联。用户通过手机、平板电脑等终端也可以方便地利用百度学术,管理自己的“我的学术”。这些功能满足了移动互联网环境下,用户对文献的管理和利用。
134用户中心
百度学术还为用户建立了一个用户中心。每个用户都会拥有一套属于自己的等级、经验和财富,它们是学术用户活跃、贡献和荣誉的见证。用户每天通过完成一些给定的任务,提升自己的经验值和财富值。随着用户在百度学术上的探索和成长,用户所拥有的经验值和财富值会逐渐增多,等级也随之增长;用户拥有的财富值还可在兑换商城兑换各种礼品。
2基于相关热搜词的国内图情学期刊的关联性实证分析当用户以期刊为检索途径进行检索后,检索结果会提供该期刊的10个相关热搜词。笔者认为,百度学术提供的期刊的相关热搜词是指用户在使用期刊名称进行搜索时,还使用了这些相关词进行搜索。根据期刊名称与这些相关热搜词之间的共现关系,可以从用户的角度来了解期刊发文的内容。
笔者选择了中文社会科学引文索引(2014-2015年)来源期刊目录中的20种图书馆、情报与文献学进行检索。检索结果显示,除《现代图书情报技术》、《情报科学》和《图书馆杂志》3种期刊外,其它17种期刊均可以看到10个相关热搜词。笔者在检索时还发现,在2015年3月12日和3月26日两次检索结果中的相关热搜词有微调。这反映出百度学术提供的相关热搜词在一定时段内相对稳定,但也会发生变化。
下面以3月26日的检索结果为研究数据。同时,为了保证可视化的效果,本文将17种期刊分为4种类型:图书馆学期刊、情报学期刊、图书与情报两栖类期刊和档案学期刊。图11、图12和图13是期刊名称与相关热搜词的共现图。图中的节点是期刊名称和相关热搜词。期刊名称与其相关热搜词之间形成的一条连线。
根据词期刊名称和相关热搜词的关系和词的中心度数值,可以将图11、图12和图13中的相关热搜词分为3种类型。
1)與两种以上期刊有连接的搜索词
图11中,“藏书建设”等;图12中的“情报学”等;图13中的“高校图书馆”等,都与两种以上的期刊有连接。对比3幅图可以发现,同类期刊的数量越多,这类词的数量也相对较多。图13中的档案学期刊只选择了《档案学通讯》和《档案学研究》,没有出现这类词。这些期刊可图11图书馆学期刊与相关热搜词的共现图
能发表与这些主题比较多的论文比较多,它们通常是图书情报学领域比较大众化的研究主题。因此,用户在检索这些期刊的时候,也经常检索这些研究主题。
2)与两种期刊连接的词
图11中,与《国家图书馆学刊》和《图书馆学研究》同时连接的有“中图法”;图12中,与《情报学报》与《情报理论与实践》同时连接的有“情报检索”和“情报研究”;图13中,与《档案学通讯》和《档案学研究》连接的有“电子文件”、“档案学”等。这类词只与某两种期刊连接。用户可能认为,它们所代表的研究主题在这两种期刊上发表的论文较多,它们是图书情报学领域较为深入的研究主题,研究成果的数量相对较少。
3)只与一种期刊连接的词
图11中,“图书馆”与“湖南图书馆”、“图书馆工作与研究”与“天津图书馆”、“图书馆建设”与“图书馆建设”、“国家图书馆学刊”与“中国国家图书馆”。除期刊名图13图书情报学两栖类期刊、档案学期刊与相关热搜词的共现图
称外,其它的词都是该期刊的主办单位。图11中,与《大学图书馆》连接的词有“文献检索课”等;图12中与《情报资料工作》连接的词有“公共图书馆”等;图13中,与《图书情报工作》连接的词有“竞争情报”等。这类词通常可以反映出某种期刊的一些个性化信息。从用户的角度看,相对于其它期刊,这些研究主题的论文在与其连接的期刊上发表较多。
3结论
与谷歌学术、微软的学术搜索等学术搜索引擎相比,百度学术推出的时间较短,占据了一定的后发优势,从功能设置等方面来看更适合中国用户的使用。
1)检索功能方面,百度学术与谷歌学术基本一致,界面风格简洁,降低了用户使用的难度。它可以满足用户对期刊和会议论文检索的一般需求。鉴于百度学术收录范围的广泛性,其“一键直达”的功能提高了研究人员学术信息检索的效率。
2)检索结果展示方面,百度学术提供多角度的排序、多途径的筛选和相关信息,便于用户从检索结果中找到满足其信息需求的文献信息。
3)个性化服务方面,百度学术为用户提供了一个虚拟的个人信息空间,满足了用户个性化的信息需求,并方便了用户管理其检索所得信息。
从技术功能体验、情感心理体验和将效用价值体验3个方面看,笔者认为,百度学术能够满足研究人员一般性的学术信息需求。尽管百度学术目前还存在一些不足,但随着时间的推移,相信其功能会不断完善,资源也会更加丰富,并且它为我们提供的学术信息服务也将更加贴心。
参考文献
[1]中国互联网信息中心.2015年中国网民搜索行为调查报告[EB/OL].http:∥www.cnnic.net.cn/hlwfzyj/hlwxzbg/ssbg/201607/t2016072654378.html,2017-01-19.
[2]Jacso P.As we may search-Comparison of major features of the Web of Science,Scopus,and Google Scholar citation-based and citation-enhanced databases[J].Current Science,2005,89(9):1537-1547.
[3]Falagas ME,Pitsouni EI,Malietzis GA,et al.Comparison of PubMed,Scopus,Web of Science,and Google Scholar:strengths and weaknesses[J].FASEB J,2008,22(2):338-342.
[4]陈家翠,谷玉荣.Google学术搜索检索性能的分析及评价[J].情报理论与实践,2007,(5):653-655.
[5]翟晓娟,许鑫.浅论Google向学术领域的发展及其对图书馆的影响[J].图书与情报,2008,(3):55-60.
[6]董文鸳.我国谷歌学术搜索研究综述[J].新世纪图书馆,2011,(9):43-45,52.
[7]Peter J.The pros and cons of Microsoft academic search from a bibliometric perspective[J].Online Information Review,2011,35(6):983-997.
[8]赵蓉英,陈烨.学术搜索引擎Google Scholar和Microsoft Academic Search的比较研究[J].情报科学,2014,(2):3-6,15.
[9]魏瑞斌.基于微软学术搜索的信息检索研究的文献计量分析[J].图书情报工作,2012,56(20):53-57.
[10]环球网:http:∥tech.huanqiu.com/news/2014-06/5019399.html[EB/OL].2015-03-26.
[11]刘敏.中英文学术搜索引擎的对比研究[J].图书馆学研究,2014,(24):29-35.
[12]刘冰.基于用户体验视角的信息质量反思与阐释[J].图书情报工作,2012,56(6):74-78.
[13]裴一蕾,薛万欣,赵宗,等.基于用户体验视角的搜索引擎评价研究[J].情报科学,2013,(5):94-97.