郭秋萍,廖建军
(郑州航空工业管理学院,河南 郑州 450015)
互联网的快速发展,形成了一个庞大的信息空间,打破时空对信息流动的限制,带给人们极大丰富的网络信息资源。但与此同时,海量信息的极度集聚,信息传播的无限扩散,使得这一信息空间变得纷繁杂乱,有用的信息资源隐藏在海量信息资源之中,零乱分散,难以辨识,信息载体形式各异,种类繁多,信息传播混乱无序,变化无常,无形地形成了信息空间的混沌状态。
在这个混沌的信息空间里,人们获取有用知识的难度大大增加,呈现出信息越丰富,知识越贫乏的状态,人们迫切需要解决的问题是网络信息空间的信息导航,即引导人们在海量信息资源里寻找到自己查找信息的工具或途径。Wordmap公司的行政主管Bill Hutchinson说:“如果没有地图,人们是不愿去不熟悉的地方旅游的。有很多人之所以迷失在因特网或局域网中,是因为这些网络没有给他们提供适当的指引。知识地图就是让人们清楚地知道他们处在知识海洋的什么位置,并指引他们找到查寻信息的正确路径。”
网络信息资源也称虚拟信息资源,是指以数字化形式存在、以电子多媒体形式记录、以计算机磁介、光介质以及各类通讯介质存储在计算机网络、通过计算机网络通讯方式传递、以计算机或电子终端方式再现的信息资源集合。简言之,网络信息资源就是蕴藏在计算机网络中并通过计算机网络而使用的各种信息资源的总和。目前,网络信息资源主要以互联网信息资源为主,它是互联网经济的产物。
1.混沌的网络信息空间
简单地说,混沌是原来系统、有条理的事物,经过过度合理或不合理的变动失去本来的面貌,使人们难以辨识。混沌现象不同于一般杂乱无章的混乱状况,混沌现象经过长期完整分析之后,可以从中梳理出某种规则。
信息空间的混沌现象表现在海量信息资源的存在形式、运动方式分散零乱、杂乱无序。网络信息空间是信息空间的一部分,网络信息空间混沌是由于信息空间是由一个个信息发布或接收平台和系统构成,每个单一信息发布或接收平台都有有效地信息组织和发布方式,信息资源呈现有序状态。但在庞大的信息空间中,信息发布或接收平台数量巨大,种类繁多,分布分散,杂乱无章,无形地形成了信息空间的混沌状态。在混沌信息空间中,当信息量很小时,其状态清晰明了,人们可以轻松自如地利用这些信息。而在信息空间被海量信息充斥的今天,其状态混沌杂乱,人们获取信息和知识的难度大大增加,如果能够采用有效的信息导航方法对这些信息进行组织和管理,就可以在一定程度上缓解网络空间的混沌表象。因此,网络空间的海量信息资源需要一份明晰的知识地图来导航、组织和管理。
2.网络探索者——搜索引擎
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户所要检索的信息展示给用户的系统。搜索引擎就像一位神奇的探索家,打开了网络空间的一扇门,门的这边是无数个充满求知欲的人,而门的那边是浩瀚无边的信息海洋,它能从杂乱的网络空间中开辟出一条清晰的检索路径。
随着互联网的发展,信息在网络上的传播速度迅速提升,网络空间中可以搜寻的网页变得愈来愈多,而网页的内容也变得良莠不齐,往往是花费了很多的时间却收获甚少,这使得用户获取真正有用的信息知识越来越难。所以,未来的搜索引擎将会朝着知识型搜索引擎的方向发展,以期为搜寻者提供更准确及适用的信息知识。
知识地图是一种非常好的表示知识关联性的方法,它通过直观的方式揭示知识之间的联系。
1.知识地图的概念
知识地图本质上是一种知识导航系统,是一种寻找知识源的向导,是一种帮助用户在合适的地方找到所需知识源的知识管理工具。这些知识源不仅包括固化在载体上的知识源, 也包括拥有丰富隐性知识的人。知识地图能够揭示知识单元之间的关系,在揭示知识单元之间关系的同时, 往往会发现以往所没有发现的新知识。因此,知识地图在海量信息面前可以帮助人们定位知识、发现知识并有效利用知识。知识地图具有以下功能:
(1)知识导航
作为一种实用知识管理工具,知识地图以一种可视化的方式标示知识源的分布,揭示知识单元之间的关联,刻画知识体系的脉络,提供查找知识的线索,使其成为人们查找知识、获取知识的导航工具,帮助人们更加方便快捷地获取知识。避免人们迷失在知识的海洋中。
(2)知识共享
知识地图通过揭示知识单元之间、知识单元与特定人之间、知识单元与特定事件之间的关系,将各种知识源直接或间接连接起来,可以按照某主题、某需求将相关知识源集聚,形成知识网络,构建知识体系,有效消除“知识孤岛”, 避免知识重复生产,重复存储,减少知识冗余,实现知识共享。
(3)知识挖掘
知识地图能够挖掘组织或企业中的隐性知识。由于隐性知识依赖于知识主体而存在,通过知识地图的引导找到拥有不同隐性知识的个体,并进一步的交流与沟通实现隐性知识的发现和挖掘,从而将这些隐性知识转化成为组织或企业的显性知识,有助于组织或企业的知识创新。
2.知识地图的构成要素
知识不是孤立存在的,知识单元之间都有显性或隐性的错综复杂的关系。利用知识单元之间的关联关系,可以将各知识单元像网络超链接一样建立起连接,清晰地展现知识单元间的关联,挖掘更多的隐性知识,提供更多的知识检索路径。在知识地图中,节点表示知识单元,知识单元是知识体系中最小的表示单位,节点之间的链接表示知识单元之间的关联关系。知识地图可由四大基本要素组成。
(1)知识单元
知识单元在知识地图中用知识节点表示,是知识体系中最小的表示单位,代表某一主题领域或某业务过程的客观知识点。一个知识单元还可以分解为多个子知识单元,进行更详细的描述。一组被连接的知识单元代表某一主题领域的知识集合或某一业务过程的知识流程。
(2)知识描述
知识描述提供知识节点更详细的信息,通过知识描述可以了解单个知识节点的内容、结构、使用条件等信息。
(3)知识关联
知识关联可用知识节点之间的连线表示,揭示知识单元之间的关联性。通过揭示知识关联关系,可以表征某一主题领域各个知识单元相互关系或不同领域知识单元之间的关联关系,可以描述知识体系结构,揭示知识演化过程。
(4)知识链接
知识链接提供知识单元在知识体系中的位置,揭示各知识单元的相关度和演变路径,用户在了解知识内容、类型和使用方法等信息描述后,可以通过知识链接找到知识单元的位置,可以进一步进行知识交流。
3.知识地图的可视化
知识地图可视化的实质是知识的可视化,知识可视化是指所有可以用来建构和传达复杂知识的图解手段。知识地图可视化就是在科学计算可视化、数据可视化、信息可视化基础上,应用视觉表征手段,促进群体知识的传播和创新,改善知识创造和传递的手段。
知识地图可视化的实现有赖于视觉特征的形式。视觉特征形式分为表层形式和深层形式,表层形式为色彩、线条和大小等材料因素;深层形式为线性结构、网状结构、环形结构和树形结构等。视觉特征形式丰富多样,主要有概念图表、思维导图、认知地图、语义网等,都是以图形符号和文字符号作为载体,整体上呈现为网状结构。
设计知识地图应重点加强知识点之间的关联,激发使用者的思考,变传统的被动知识查找为积极的知识探索,变静态的知识积累为动态的知识优化。而环型知识地图作为一种面向关联分析的启发式知识建构方式,它提供了实现相关网络信息资源导航的解决方案。
1.环型知识地图
环型知识地图模型是以信息检索的结果集来构建知识地图的。如图1所示,环型知识地图由长短不等的圆环弧段形成环型,弧段的长短可以表示其权重的大小。圆环弧段间的弧线连接表示相关性,弧线的粗细表示关联性的强弱。每个圆环弧段具有相应的标签提示,标签提示里有相应的超链接以实现知识信息链接。这样,圆环弧段对应了知识节点、弧线对应了知识关联、标签提示对应了知识描述、超链接对应了知识链接,形成了一个环型知识地图。
图1 环型知识地图模型
2.环型知识地图构建流程
环型知识地图的构建是一个动态、循环的过程,遵守知识地图的算法流程与原则。其核心问题是如何获取有效信息来构建知识索引库和可视化计算。具体的构建方法和顺序如图2所示。
首先,确定研究主题关键词,并通过搜索引擎从诸如博客、新闻网站等网络信息资源中检索出与研究主题相关的信息,构建知识索引库。然后根据检索结果集进行关联聚类,形成知识节点。最后根据知识节点的相关性参数,利用可视化引擎进行可视化分析,实现知识地图的可视化。
图2 知识地图构建流程
3.环型知识地图技术架构
根据环型知识地图的构建流程、搜索引擎和可视化技术,可以构建网络信息资源的知识地图导航系统,其体系技术架构主要由采集层、分析层、可视化层三个功能层组成,如图3所示。
(1)采集层
利用智能Spider从百度、Google等主流搜索引擎的搜索结果集或直接从互联网信息资源中采集可检索信息资源,对其进行主题相关度分析,根据不同的相关度,实现对信息资源的过滤与选取。把有效信息资源文本序列化后按一定格式暂存在服务器上,并由服务器转存到信息数据库,以便从中挖掘。
(2)分析层
分析层主要由文本元信息提取模块、文本分析器、索引模块和知识索引库四部分组成。用于分析发现信息资源中的模式、规则或趋势,实现从非结构化或半结构化的文本信息中提取需要的信息,以构建知识索引库。
(3)可视化层
通过知识分类、知识聚类、可视化引擎等手段,为用户提供经过聚类的有关联的知识地图,达到网络信息资源导航的目的。
图3 网络信息资源的知识地图导航技术架构
基于环型知识地图的网络信息资源导航系统采用三层体系结构的MVC模式设计实现。使用MVC模式可以实现客户、应用和数据之间的分离。客户端采用浏览器技术,以减少客户端的维护和配置工作。应用服务器端实现数据预处理和数据挖掘等应用功能,这将大大有利于集中管理和维护升级。数据库服务器端能够实现XML集成数据存储和用户个人信息存储。
本系统的搭建配置如下:
(1)客户端用户界面使用ASP.NET技术,实现界面的自然、友好、个性化的特点。
(2)应用服务器端以Windows 2003 Server+.NET 4.0 Framework作软件支持平台,使用C#作为主要的编程语言实现系统的数据采集和信息分析功能,并将相关度高的信息知识序列化为XML结构化文档存入信息数据库中。
(3)数据库服务器端采用SQL Server 2005,它不仅具有数据仓库功能,而且具有完备的全文检索功能。SQL Server 2005支持XML,可以在关系数据表中存储XML文档,也可以从关系式数据中产生XML文档,以实现对XML数据的集成;
(4)可视化引擎的开发采用Visual Studio 2010+Microsoft Silverlight4.0技术,Microsoft Silverlight是一种新的Web呈现技术,能在各种平台上运行。SilverLight提供了一个强大的开发平台,能够开发出具有专业图形、音频和视频的Web应用程序,借助该技术,系统将拥有内容丰富、视觉效果绚丽的交互式体验。
实验案例以某高校信息科学学院10位教师目前的项目合作情况为研究对象。通过本系统的数据采集、分析和可视化呈现,得到了如图4所示的项目合作关联环型知识地图。
图4 项目合作关联环型知识地图
考虑到个人隐私,图4中10位教师的姓名以字母代替,每一圆环段的大小与其项目数的多少成比例,如A教师所做的项目最多,E教师的项目最少。环中灰色透明的连线是他们的合作关系,虽然稠密复杂,但不影响对整体知识信息的了解。当鼠标选择圆环上的F教师时,其环段和关联线会高亮显示,以便查看关联关系。关联线的粗细代表了项目合作次数的多少。可以看出,F教师与A、B、C、D、J教师有过项目合作,其中与B教师合作最多,与D教师合作最少;当然也可以看到与E、G、H、I教师还没有合作过。圆环右侧是知识描述显示栏,在这里显示的就是F教师的一些基本描述。鼠标点击F可以知识链接到相关的知识资源网页。
至此可以看出,相比于网状、树状等其他类型的知识地图,环型知识地图更适用于导航各种复杂因素交织在一起的知识信息,知识节点之间的关联清晰明了、重点突出,也易于知识地图的扩充和修改。
本文介绍了环型知识地图模型在网络信息资源导航中的应用,并给出了环型知识地图模型、构建流程图以及基于环型知识地图的网络信息资源导航技术架构图,最后采用搜索引擎技术、Silverlight可视化开发技术搭建了一个实验系统。该系统能够将相关联的网络信息资源导航在一起,可以比在任何一个组织中获取的信息更能提供深入的洞察力。建立基于环型知识地图的网络信息资源导航方式,不仅能更好地扩展网络信息资源的内容,提升网络信息资源的知识发现服务,而且还有助于推动和构建大规模的知识搜索导航服务,帮助建立一个更为开放的网络空间,促使新的网络空间搜索模式的产生,实现增值性的网络空间信息组织。
[1]刘玉仙,顾 琛.混沌信息空间信息组织面临的挑战和机遇[J].情报科学,2004,(6):668-670.
[2]郭秋萍,任红娟.信息空间巴尔干化现象探析[J].情报理论与实践,2011,(12):111-116.
[3]张俊林.这就是搜索引擎:核心技术详解[M].北京:电子工业出版社,2012.
[4]李 丹,张会平.知识地图理论研究[J].科技情报开发与经济,2008,(9):130-132.
[5]苏 海,蒋祖华,伍宏伟.面向产品开发的知识地图构建[J].上海交通大学学报,2005,(12):2034-2039.
[6]宋绍成,毕 强.信息可视化的基本过程与主要研究领域[J].情报科学,2004,(1):13-17.
[7]潘旭伟,李 娜,沈铁伟,吴益民,傅丽君.基于Web资源的组织知识服务研究[J].图书情报工作,2012,(5):113-118.
[8]潘 星,王 君,刘 鲁.一种基于概念聚类的知识地图模型[J].系统工程理论与实践,2007,(2):126-132.
[9]廖建军,郭秋萍,李筱宁.基于垂直搜索的网络监督情报预警系统研究[J].情报理论与实践,2010,(6):121-123.
[10](美)莫洛尼.Microsoft Silverlight 4从入门到精通[M].马振萍,文 瑞,译.北京:清华大学出版社,2010.