魏力更
大数据时代下高校图书馆的知识发现服务——基于超星发现、中国知网发现功能的研究
魏力更
(齐齐哈尔大学 图书馆,黑龙江 齐齐哈尔 161006)
在剖析大数据的价值及大数据给学者获取学术信息所带来的困扰基础上,对知识发现的含义、知识发现系统的机理和特征进行了探讨,对超星发现、中国知网知识发现功能的特色优势进行了案例分析.针对高校图书馆的知识发现服务提出了精准预判用户的知识需求,深度挖掘文献间的知识关联.为用户提供可操作的知识发现平台,提供学术趋势分析,学术产出评价及课题动态跟踪等深度专业咨询的发展策略和建议.
大数据时代;知识发现;高校图书馆;发现服务
随着云计算、物联网和移动通信技术的蓬勃发展,全球信息总量正以惊人的速度增长和累积,这意味着大数据时代己经来临.媒体频繁使用“数据洪流”来描述数据的急剧增长,而且该现象不仅出现在科学领域,同样也出现在社交媒体、商业和金融领域.维·尔耶·前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,引发了大数据时代的思维变革、商业变革和管理变革[1-2].庞大的数据量不仅以指数级速度增长,数据结构也变得愈加复杂.数据管理、数据存储和数据挖掘成为大数据时代信息技术发展的重大挑战.
信息时代万物数字化,大数据的重要性已成为行业共识,其潜在价值也引起产业界和学术界的高度关注.倘若能够更有效地组织和使用大数据,人类将得到更多的机会发挥科学技术对社会发展的巨大推动作用.大数据是一种基础性资源,人们可以通过数据的分析、开发和整合,发现新的知识,创造新的价值.
在大数据时代,对于海量数据的分析和管理是科研过程中的重要组成部分,人们需要从数据中发现未知的研究领域.然而,所产生的大量数据,能够被科研者利用的仅仅是冰山一角,大量数据没有被有效管理、分析和储存.科技工作者深受大数据所带来的困扰,很难快捷、准确地检索到所需数据资料[3].随着数据爆炸时代的来临,读者迫切需要一个可以简捷、快速获得所有知识的理想平台[4].图书馆作为一个面向大众的知识服务机构,急需研发先进的知识发现引擎,帮助用户挖掘正在发生什么,预测和分析将来会发生什么,以便积极应对未来的危机及挑战[5].
知识发现是从大量的数据集合中识别那些潜在的、有价值的知识的复杂过程,是一种广义的“数据挖掘”.它强调了知识是数据发现的最终产品.在当前高校图书馆的各类型信息资源激增的背景下,知识发现服务得到了广泛且迅速的推广和应用.近年来,国内关于知识发现系统的研究不断升温,各类型图书馆相继引入国内外的各种“知识发现系统”.知识发现系统深入分析用户潜在的知识需求,对信息资源进行充分的挖掘、关联和升值,实现知识价值再造.
知识发现系统引入先进的技术手段,如知识挖掘算法、索引规则等,对各类文献资源数据进行处理和分析,使得文献的揭示由表面信息深入到各类文献之间存在的复杂关系中,继而帮助用户发现潜藏在数据背后的信息[6-7].通过知识挖掘处理,展现给读者的文献资源是揭示各信息资源关联关系的立体知识体系.
知识发现系统的特征是基于海量的元数据中心仓储数据,在索引数据库中进行数据搜索,再通过对检索结果的相关度排序和分面导航等功能来帮助用户发现最适合的资源[8].同时检索词提示、纠错和可视化等Web2.0功能的融入与支持,有效提升了网络环境下的交互性用户体验.本文仅就超星发现和中国知网这两大系统的知识发现功能作以分析和探讨.
3.1 超星发现的相关功能
北京超星公司于2012年推出了超星发现系统.超星发现为读者提供了具备完善的知识挖掘与情报分析功能的知识发现系统.目前,该系统已在国内许多高校使用或试用.
3.1.1 巨大的数据资源“集成”目前,超星发现收录了1 348家图书馆的文献资源,为教育科研提供全面的专业服务.囊括了550万种图书,9 300万篇期刊文献,480万篇学位论文,1 200万篇专利,600万部视频等信息,而且数据每天在更新增长.海量的资源为科研工作者提供了系统、全面及权威的知识网络.
3.1.2 专业级强大词表库支持精准智能发现 超星发现系统中容纳了42万主题词表,8万同义词表,2 500万学术专业词库,3 500条学科分类表等内容.专业词表支持文献的规范标引、同义词匹配检索和智能检索,以提高检索的查全率和查准率.如输入“文化宫”,系统会同时检索“文化馆”、“俱乐部”等别名;输入“有色金属”,可查出其下位词有:贵金属、稀有金属等.
3.1.3 可视化的知识关联图谱 超星发现的可视化关系图谱功能便于发现知识、人、机构之间的相互关系.如检索“一路一带”,检索结果显示后,点击“可视化”按钮,则学术辅助分析系统显示:与“一路一带”关系密切的领域有丝绸之路、亚欧大陆桥等;与“一路一带”主题相关的最具影响力的研究者姓名;与“一路一带”相关的研究机构;在检索结果中点击某一篇学位论文的标题,可见“当前学位论文的作者”、“当前作者的导师”及“当前作者的师兄弟”之间的关系图谱,据此可挖掘同一导师下不同学生研究主题的相关性.
3.1.4 洞察全局的学术趋势分析 检索“供给侧”时,在“可视化”页面可见这一主题在图书、期刊、学位论文和会议论文等各类型文献的学术发展趋势曲线图,对此主题的学术发展趋势一目了然.
3.2 中国知网(KDN)的相关功能
新版中国知网也称为“CNKI知识发现网络平台”(KDN),其于2012年9月正式上线为读者服务.KDN利用知识管理的理念,实现了知识汇聚与知识发现,结合搜索引擎和全文检索等相关技术来达到知识发现的目的.KDN平台提供了多种检索发现手段,如优先出版、引文关联和检索结果的多项分组排序等.
3.2.1 KDN资源覆盖的范围 从资源类型上来说,KDN涵盖了期刊论文、学位论文、会议论文、重要报纸、专利、标准、科技成果、词典和古籍等各类资源.从语种上来说,不仅包含中文资源,还包含丰富的外文文献.
3.2.2 指数检索 在KDN平台的一框式检索中,“指数检索”提供关于某一主题的免费数据分析服务,通过直观形象的图形反映某一主题在过去一段时间里的研究发展趋势,读者可快速发现和追踪学术热点.例如:检索“数据素养”,可显示该主题在1981—2015年间的研究发展趋势图,该年度被引频次最高的热点文献,该主题的最早研究文献、最新研究文献和经典文献,该主题的学科分布情况,相关主题词等,用于进一步扩大检索.
3.2.3 学科专业图书馆 在KDN主页中,设置了“学科专业图书馆”栏目.这一栏目将知网收录的所有文献资源分成168个学科数字图书馆和3 000多个子专业数字图书馆.读者根据自己的研究领域,选择进入某学科馆,即可检索本学科全部文献内容.例如:点击“材料科学”学科馆,可显示该学科的12个专业馆、学科相关领域、学科院士、学科博导、学科工具书、学科研究热点、学科论坛、学科国家级和省部级课题等内容,形成材料科学学科较完善的知识库.
3.2.4 知识元检索 在KDN主页中设有“知识元”栏目,包括查工具书、数字搜索、表格搜索、图形搜索和概念搜索等检索项目.在此可以任意检索概念、数字、表格和图形等知识元信息.例如:(1)查工具书.知网工具书库收录了汉语词典、专科词典和百科全书等8 000余部工具书,可供查找字、词、百科知识和图谱等各类知识.(2)概念搜索.可查找某一学科的所有名词术语的解释.
3.3 两大系统的分析结果
超星发现和中国知网两大系统以其各自的特色为读者提供了不同广度和深度的知识发现服务.二者从不同角度把分散在不同载体上的内容,按照知识本来的脉络整理出来,形成知识网络,以方便读者使用.值得一提的是,超星发现系统在可视化分析方面功能较为突出,其“学术辅助分析系统”进行数据分析后,通过可视化来展示各个知识点之间的关联,更容易帮助读者发现新的知识.中国知网则对于学科领域内各种知识信息的关联、揭示和整理以及各种知识元的深度搜索方面占据优势,为获取全方位的学科信息提供了方便.可见,不同的知识发现系统对知识挖掘的侧重点不同.目前,国内产出的知识发现系统已有多种,如万方的“中国学术搜索”,重庆维普的“智立方发现系统”等,用户如果能综合利用各种发现系统,势必会获得更全面、更满意的检索效果.
在大数据时代,图书馆需要研究更加有效的方法进行大数据挖掘,对用户的知识需求应该有更周到的服务.图书馆需深入挖掘各类知识资源所隐含的数据价值,并以读者个性需求和大数据科学分析结果为依据,为读者提供高效和满意的个性化知识服务[9-10].
4.1 与时俱进,精准预判用户的知识需求
在网络环境下,读者对个性化知识的需要与日俱增.这种知识往往不是一本期刊或一本书所能提供的,更多是针对某一个问题的解答,需要综合来自各种文献的信息.读者正在变得越来越“懒惰”,他们希望得到直接的答案,而非一堆链接.知识发现平台需要更聪明、更智能地去理解用户想要做什么,提供给用户更准确的结果.
4.2 深入挖掘数据价值,提高知识发现效率
适用大数据技术的图书馆可自主研发个性化的深度知识发现平台,或考虑引进成熟的大数据分析产品.知识平台的建设一方面需要包涵充足的资源,另一方面要加深文献标引和文献间知识关联的挖掘,为科研人员提供可操作的知识发现平台.同时,应充分考虑到数据对象的多样性.随着图书馆大量非结构化数据的涌现,图像、视频和音频等多媒体数据挖掘价值非常大.
4.3 基于知识发现系统为用户提供深度专业咨询
图书馆应努力提供与教学科研紧密相关的知识支持,尤其是全面保障高校重点学科、精品课程信息资源的统一整合、深度搜索和权威咨询,提高学科服务水平.利用超星发现、中国知网等系统发现有价值的知识信息,加上馆员特有的分析挖掘能力,图书馆可开展各种深度信息服务.如为学院及学者开展个性化服务:学术趋势分析、课题综述、课题动态跟踪及提供学术产出评价等,开展嵌入式学科服务.运用网络级知识发现系统,基于特定需求分析海量数据,挖据潜在的学术信息,将使图书馆为教学科研提供细颗粒度的高度粘合和个性化的服务成为可能.
[1] 钟文一.大数据时代下的图书馆数据挖掘和情报分析研究[J].教育观察,2014(9):88-91
[2] 韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37-40
[3] 陈丽冰.读者服务视角下的图书馆资源发现服务[J].情报资料工作,2012(4):66-70
[4] 殷翠芬.高校数字图书馆信息资源管理的问题及对策[J].图书馆学研究,2008(3):74-75
[5] 张正.数字图书馆用户研究[J].图书馆,2004(1):46-48
[6] 廖志江.知识发现及数字图书馆知识服务平台建设研究[J].情报科学,2012(12):1849-1853
[7] 刘江玲.面向大数据的知识发现系统研究[J].情报科学,2014(3):90-92
[8] 李俊,黄春毅.关联数据的知识发现研究[J].情报科学,2013(3):76-80
[9] 李伟,赵卫利,刘冠群,等.知识库和知识发现技术在知识服务方面的应用[J].现代情报,2009(7):180-182
[10] 李佳.基于知识发现的图书馆个性化知识服务研究[J].图书与情报,2013(5):100-102
Knowledge discovery service of university libraries in the age of big data——Study of discovery service function basedon Superstar Discovery and CNKI
WEI Li-geng
(Library,Qiqihar University,Qiqihar 161006,China)
Based on the analysis of big data value and scholar's troubles for getting academic information,discusses the meaning of knowledge discovery and the mechanism and characteristics of knowledge discovery system,the special advantages of knowledge discovery function of Superstar Discovery and CNKI are analyzed for case studies.The development strategies and suggestions are put forward for the knowledge discovery service of university libraries,these suggestions are the depth professional counseling about accurate pre judgment of the user's knowledge needs,depth mining knowledge association among literatures,providing users with actionable knowledge discovery platforms,providing academic trend analysis and evaluation of academic output and subject dynamic tracking.
the age of big data;knowledge discovery;university library;discovery service
1007-9831(2016)11-0045-04
G254.9
A
10.3969/j.issn.1007-9831.2016.11.012
2016-08-09
魏力更(1964-),女,黑龙江双城人,研究馆员,从事数字资源的开发与利用等研究.E-mail:xiexiejiao123@126.com