国外知识可视化研究的现状与启示——基于Citespace和Vosviewer的知识图谱分析

2015-12-05 12:13黄春娟
大学图书情报学刊 2015年4期
关键词:知识库检索可视化

陈 萱,黄春娟

(南京工业大学,210000)

随着知识经济时代的到来,现代社会的知识量剧增,人们接收、理解知识的速度越来越落后于知识更新的速度。人类迫切需要一种可以帮助其快速理解知识,掌握知识和传播知识的手段和方法[1],于是一个新兴的研究领域——知识可视化应运而生。知识可视化是信息可视化技术发展与应用的新阶段,其主要目的是应用视觉表征来促进群体知识的传播与创新。2004年,国外学者正式提出了知识可视化的定义,2005年我国学者赵国庆对知识可视化的理论基础、研究框架和发展趋势进行了探索[2],随后图情领域又掀起知识图谱的研究热潮。知识可视化、知识图谱为知识的处理、分析、表示、传递和服务提供了新的思维方式和工具方法,在计量分析和信息检索等热点研究领域得到了广泛应用,日益成为图情界关注的热点。本研究在对相关研究文献进行知识图谱分析的基础上,探索了国外知识可视化研究的发展现状,以期为国内知识可视化的研究和应用提供参考与借鉴。

1 数据与方法

本研究在Web of Science(WOS)平台进行检索,检索时间为 2014年底,检索策略为 TS=“knowledge domain visualization”or“ knowledge mapping”or“ mappingknowledgedomain”or“knowledge visualization”,对检索结果进行人工筛选后共检索到799篇外文文献。

CiteSpace[3]是由美国 Drexel大学陈超美教授开发的、用来对共现网络进行可视化分析的Java应用程序,可以有效揭示特定研究领域的热点、趋势及其发展演进。本研究利用CiteSpace来对国外知识可视化研究的知识基础、研究前沿进行可视化分析。VOSviewer[4]是由 Nees Jan van Eck 和 Ludo Waltman开发的一款免费软件,被广泛应用于各类“共现”分析,本研究采用VOSviewer来对国外知识可视化研究论文的摘要进行内容分析和结果展示。

2 结果与分析

2.1 研究热点与研究维度

摘要是作者对论文的研究目的、方法、结果、结论的简要概括,对一定数量的文献摘要中的词组进行频次统计和共现分析,可以较好地挖掘特定领域的研究热点。同时,特定领域的高被引文献是该领域的重要研究基础,通过对高被引文献的内容分析,可更好地了解知识可视化研究的发展脉络和研究背景。本研究首先通过Vosviewer对文献摘要进行分析,然后利用Citespace对高被引文献进行共被引分析(结果见图1和图2)。

结合对图2中高中心度文献的内容研读,可以发现国外的研究主要包括2个研究维度:技术实现维度、心理认知维度、知识管理维度。

2.1.1 技术实现维度

技术实现维度主要从可视化的技术、方法和工具等方面开展研究,这一维度的代表性关键词位于图1的左下方,如algorithm,data mining,knowledge discover,interface,cluster 等等。Shneiderman B[7]于1996年将可视化技术引入到信息检索的过程中,是信息可视化的早期经典论文,被引频次达到了15次。他将数据分为一维数据、两维数据、三维数据、时间数据、多维数据、树形结构数据和网状结构数据等类型,对各类数据的可视化检索和操作的研究论文进行了综述。他认为成功的可视化信息检索首先要有一个实用的高级用户界面,可以以图解的形式对检索结果进行概览、调焦、过滤、抽取和细节展示。

Card S 等人[8]1999 年主编了一部著作——Readings in Information Visualization:Using Vision to Think,这部著作被引频次达到了31次。书中不仅收录了信息可视化领域的经典文献,还对这些文献的研究主题进行了分析,并对信息可视化的前沿研究工作做了介绍。作者尤其关注用可视化来发现知识内在关联、使用交互式的图形来拓展思维的论文。这部著作是信息可视化的经典著作,同时也为知识可视化研究提供了技术和理论基础,是目前知识可视化领域被引频次最高的文献。

2001年,Chen C等人[9]提出一种基于引文网络的知识可视化方法,不仅通过高被引文献来获得知识结构,还通过低被引文献网络来发现潜在的研究主题。他选择了2个案例进行了验证,证明该方法不仅可以揭示潜在研究主题与主流研究领域的联系,还适用于知识追踪和知识管理。2003年,KatyBorner等人[10]介绍了可视化技术在图示学科领域结构、支持信息检索与聚类中的应用情况,回顾了知识域可视化的历史,并对其一般流程和常用技术进行了介绍(包括新兴的交互式数据分析和信息可视化技术),进而采用多种工具、算法和数据来源对知识域可视化的研究文献进行了可视化分析。研究发现知识域可视化研究的主要研究热点包括引文分析、文献计量、语义学研究、可视化研究、自动索引、学术交流等等。Chen C和KatyBorner的工作不仅为知识可视化提供了理论和方法依据,还相继推出了可视化分析的工具——Citespace和Science of Science Tool(SCI2),广泛用于科学文献的分析与知识发现。

2.1.2 心理认知维度

心理认知维度的研究主要关注人们对视觉表征的认知过程和内在机制,这一维度的代表性关键词位于图 1的右侧,如 study,performance,evidence,task,questionnaire等等。Snodgrass J等人[11]1980年调查了219个志愿者对260幅图片及其名称的认知过程,通过名称一致性、图片一致性、熟悉程度和视觉复杂度这4个规范化变量来将图片对于记忆和认知的影响进行量化,探索了人类认知图像和认知文字过程间的区别和联系,为以后的研究提供了定量的依据。1987年,Jill H等人[12]对图表描述形式和文字描述形式做了界定,然后通过几个实例来对比了图表描述和文字描述的效果,分析了图表描述比文字描述效果更好的原因。研究认为,图表表述比文字表述更有效的原因并不是比后者包含更多的信息,而是由于图表表述更便于理解和使用。该文献不仅证实了在解决问题的过程中图表描述更有效,还提出了用图表来进行知识表达和获取的研究框架。这两篇文献通过实验和案例证明了视觉对于认知的促进作用。

Warrington E等人[13]于1984年对4位单纯疱疹性脑炎的病人进行了临床观察,发现这些患者存在视觉识别障碍的同时,听力理解能力也存在不同程度的削弱,而且他们对视觉刺激物有着选择性识别障碍:识别静物的能力部分得到保留,但识别生物和食物的能力却被严重削弱。他们对视觉识别能力和语义理解的关系进行了讨论,认为疾病影响到人的认知能力后可能进一步影响人的理解能力。Sheridan J等人[14]1993年也报道了一个单纯疱疹性脑炎患者的选择性视觉识别障碍,这位患者同样是识别动物和食物的能力远远弱于识别静物。研究发现虽然患者对于特定对象已有足够的知识,但看到后却难以检索和运用这些知识,因此造成视觉识别障碍。而且对于这类难以视觉识别的物体,他同样存在听觉理解障碍。视觉和听觉识别障碍让他失去了部分语义理解能力。一些功能障碍性疾病会影响人类的视觉识别和听觉能力,进而造成语义理解困难。这两篇文献通过病历研究证实了视觉认知能力受到损伤会引起理解能力的下降。

2.1.3 知识管理维度

知识管理维度的研究注重知识的共享、转化、传播和利用,这一维度的代表性关键词位于图1的左 侧 上 部,如 knowledgemanagement,decision making,communication等等。1995年,野中郁次郎和竹内弘高[15]出版了《The Knowledge-Creating Company:How JapaneseCompaniesCreate the Dynamics of Innovation》一书,他们认为日本公司不断创造新知识并用于生产产品和改进技术,其成功正是由于它们的创新能力。该书介绍了日本公司如何将隐性知识转化为显性知识,进而将知识用于生产新产品和提供新服务的过程,并且选择本田、佳能、松下等公司做了案例研究。这部著作是知识管理领域的重要文献,也为知识可视化的兴起提供了理论背景。

2004 年,Eppler M 和 Burkard R[16]提出了知识可视化的定义,他们认为知识可视化领域研究的是视觉表征在改善两个或两个以上人之间知识创造和传递中的应用,知识可视化是指所有可以用来建构和传递复杂见解的图解手段。这篇文献标志着知识可视化正式成为一个新的研究领域[17]。

2.2 研究前沿

关键词是作者对论文研究内容的高度概括和提炼,关键词词频较高说明该关键词所表征的研究方向得到了研究群体较多的关注。因此,高频关键词可以反映特定研究领域的研究热点。除关键词词频统计和共现分析外,CiteSpace还有膨胀词探索(Burst Detection)功能,可将标题、摘要等字段中频次增长率较高的词(Burst Term)从大量的主题词中探测出来,膨胀词及其共现关系可以揭示特定研究领域的研究前沿。

本研究利用CiteSpace对2011年至2013年的118篇知识可视化研究论文的高频关键词和膨胀词进行了可视化展示(见图3),并结合文献内容分析来识别近3年来国外知识可视化研究的热点与前沿。图3中圆形的节点是高频关键词,三角形的节点是膨胀词,节点间的连线表示各词间的共现关系。图3反映了当前国外知识可视化研究的4个前沿研究主题:知识库与知识服务平台的构建、知识可视化在教学中的应用、知识可视化的心理认知机制、知识管理与决策支持。

2.2.1 知识库与知识服务平台的构建

表征这一研究主题的高频词和膨胀词有knowledge-base、visualization-tool,ontology,visualontologies,information-processing,system,algorithms等等。随着知识量和用户需求的快速增长,如何提高人们获取、利用知识的效率是迫切需要解决的问题,构建可视化的知识库与知识服务平台有利于人们对知识的检索、分析、理解和应用。

Li G等人[18]提出了一个知识服务平台的框架,平台的目的是通过多种可视化手段来促进见解、经验、态度、评价和观点的传播,平台包括知识获取、知识存储、知识分类和知识可视化等多种功能。

知识库的应用实践推动了知识可视化技术的发展,知识库的功能检测需要知识可视化技术的支持。Baumeister J等人[19]介绍了一些能让开发者交互、浏览和分析知识库的可视化技术,以便于发现知识库的缺陷和语义错误。他们描述了适用于知识结构分析的标准化的可视化方法,还介绍了一种半自动的可视化技术。Bera P等人[20]构建了本体可视化系统来帮助人们了解特定知识领域的概念及概念间的关系,以促进人们更好地检索知识库,从而提高获取、利用知识的效率。他们还提出了本体可视化指南,并通过实验证明了指南的有效性。他们认为哲学的本体理论和认知理论可以让知识可视化更加有效,而且本体可视化指南还可以通用于其他学科领域的知识可视化。

2.2.2 知识可视化在教学中的应用

表征这一研究主题的高频词和膨胀词有visual-environments, cognition, memory, acquisition,education,design,visual-skills等。知识可视化可以展示知识的逻辑结构,更有利于人们对知识的学习、理解和记忆,因此知识可视化技术在教学过程中应用逐渐成为了研究热点。

知识构建和解决问题是学习知识的两个重要过程,Wang M等人[21]提供了一个计算机虚拟学习环境,设计了一个可视化认知工具,将思考和学习过程可视化,从而将解决问题的过程和知识构建的过程融合起来,帮助学生更好地学习、掌握、应用知识。可视化技术在教育领域的应用推动该了传统教学模式的变革,杜克大学的研究人员在2009年开始在艺术与建筑史的课堂上应用可视化技术,极大地促进了学生的学习和理解,他们还提出了“历史与文化可视化”的建议,以促进知识可视化在教学中的推广应用[22]。

2.2.3 知识可视化的心理认知机制研究

表征这一研究主题的高频词和膨胀词有perception, objection -recognition, vision, brain,categorization等。利用神经科学、心理学的理论与方法对知识可视化进行研究,以寻找人们认知过程中的客观规律,完善知识可视化的理论基础。

Eddy M[23]研究了苏格兰儿童如何在纸上对知识进行可视化,对他们的工具和技巧进行了分析。研究认为在启蒙教育中,空间素养在文本知识可视化中起到了重要作用。视觉工作记忆(visual working memory)指对非言语视觉信息的短时存储,是视觉信息接受进一步处理前的暂时存储[24]。Wood J[25]研究了客体信息在视觉工作记忆中的存储模式,实验证明视觉工作记忆有3个并行的核心知识系统,这一研究将视觉认知的心理学研究与生物学基础研究联系起来。

2.2.4 知识管理与决策支持

表征这一研究主题的高频词和膨胀词有decision-making,knowledge management,management,human capital,visual-analytics。知识可视化给知识管理带来了新的技术与方法,能让知识管理更有效率,更好地为科学研究与决策服务。

Brynne L等人[26]应用一种新的信息模型和可视化工具,来加强对各类临床用药数据和知识的利用,从而优化临床决策和医学知识管理。Chen L等人[27]对企业知识管理能力的演变进行了可视化展示,描述了企业知识管理能力随时间的变化情况,为知识管理能力的评价、规划和提高提供了有效的手段。

3 结语

本研究发现国外知识可视化研究已初步形成了三个研究维度:技术实现维度、心理认知维度、知识管理维度。技术实现维度主要从可视化的技术、方法和工具等方面开展研究;心理认知维度的研究主要关注人们对视觉表征的认知过程和内在机制;知识管理维度的研究注重将知识可视化应用于知识共享、转化、传播和利用。知识库与知识服务平台的构建、知识可视化在教学中的应用、知识可视化的心理认知机制研究、知识管理与决策支持是国外近几年的研究前沿。

知识可视化在图书馆馆藏资源建设、知识服务、情报分析与共享等方面都有广阔的应用前景。图书情报领域应积极引进知识可视化的理论、技术与方法,构建可视化的知识库和知识服务平台,实现馆藏资源组织、导航、检索和分析的可视化;引入心理认知的研究维度,加强对用户心理认知机制的调查和探索,注重用户对可视化效果的评价与反馈;探索知识可视化在知识管理和决策支持中的应用模式,促进知识的转化、传播与利用。总之,图书情报领域可借鉴国外的研究成果,从多个研究维度来深化知识可视化的研究与应用。

[1]王朝云,刘玉龙.知识可视化的理论与应用[J].现代教育技术,2007,17(6):18-20.

[2]赵国庆,黄荣怀,陆志坚.知识可视化的理论与方法[J].开放教育研究,2005,11(1):23-27.

[3]Chen C.CiteSpaceⅡ:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American Society for information Science and Technology,2006,57(3):359-377.

[4] Van N J,Waltman L.Software survey:VOSviewer,a computer program for bibliometric mapping.Scientometrics[J].2010,84(2):523-538.

[5]Roach J W,Tatem J E.Using domain knowledge in lowlevel visual processing to interpret handwritten music:an experiment[J].Pattern recognition,1988,21(1):33-44.

[6]Schröder O,Frank K D,Kohnert K,et al.Instructionbased knowledge acquisition and modification:the operational knowledge for a functional,visual programming language[J].Computers in human behavior,1990,6(1):31-49.

[7]Shneiderman B.The eyes have it:A task by data type taxonomy for information visualizations[C]//Visual Languages,1996. Proceedings. IEEE Symposium on.IEEE,1996.336-343.

[8] Card S,Mackinlay J,SchneidermanB. Readings in information visualization:using vision to think[M].Morgan Kaufmann,1999.

[9] Chen C,Kuljis J,Paul R J.Visualizing latent domain knowledge[J].Systems,Man,and Cybernetics,Part C:Applications and Reviews,IEEE Transactions on,2001,31(4):518-529.

[10] Börner K,Chen C,Boyack K.Visualizing knowledge domains[J].Annual review of information science and technology,2003,37(1):179-255.

[11]Snodgrass J G,Vanderwart M.A standardized set of 260 pictures:norms for name agreement,image agreement,familiarity,and visual complexity [J].Journal of experimental psychology:Human learning and memory,1980,6(2):174-215

[12]Larkin J H,Simon H A.Why a diagram is(sometimes)worth ten thousand words[J].Cognitive science,1987,11(1):65-99.

[13]Warrington E K,Shallice T.Category specific semantic impairments[J].Brain,1984,107(3):829-853.

[14] Sheridan J,Humphreys G W.A verbal-semantic category-specific recognition impairment[J].Cognitive Neuropsychology,1993,10(2):143-184.

[15] Nonaka I,Takeuchi H.The Knowledge-Creating Company:How Japanese Companies Create the Dynamics of Innovation[M].Oxford university press,1995.

[16]Eppler M,Burkard R.Knowledge visualization:towards a new discipline and its fields of application.ICA working paper#2/2004[R].University of Lugano,Lugano,2004,

[17]赵国庆.知识可视化2004定义的分析与修订[J].电化教育研究,2009,(3):15-18.

[18]Li G,Song X.A new visualization-oriented knowledge service platform[J].Procedia Engineering,2011,(15):1859-1863.

[19] Baumeister J,Freiberg M.Knowledge visualization for evaluation tasks[J]. Knowledge and Information Systems,2011,29(2):349-378.

[20] Bera P,Burton-Jones A,Wand Y.Guidelines for Designing VisualOntologiesto SupportKnowledge Identification[J].Mis Quarterly,2011,35(4):883-908.

[21]Wang M,Wu B,Chen N,et al.Connecting problemsolving and knowledge-construction processes in a visualization - based learning environment[J].Computers & Education,2013,68:293-306.

[22] Bruzelius,C.Teaching with visualization technologies how doesinformation become knowledge?.Material Religion,2013,9(2):246-253

[23]Eddy M D.The Shape of Knowledge:Children and the Visual Culture of Literacy and Numeracy[J].Science in Context,2013,26(2):215-245.

[24]李 鹏,沈模卫,郎学明,等.客体的视觉工作记忆研究进展[J].应用心理学,2007,13(1):3-10.

[25] Wood JN.A core knowledge architecture of visual working memory[J].Journal of Experimental Psychology:Human Perception and Performance,2011,37(2):351-387.

[26]Brynne L,Bresell A,Sjogren N.Effective visualization of integrated knowledge and data to enable informed decisions in drug development and translational medicine[J].Journalof Translational Medicine,2013,(11):1-11

[27]Chen L,Fong PSW.Visualizing Evolution of Knowledge Management Capabilityin Construction Firms[J].Journal of Construction Engineering and Management,2012,139(7):839-851.

猜你喜欢
知识库检索可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高速公路信息系统维护知识库的建立和应用
专利检索中“语义”的表现
基于Drupal发布学者知识库关联数据的研究
国际标准检索
国际标准检索