王莹
摘要:计算机网络信息资源具有分布广、多样化、非线性、数量大、增长快的特点,文章以资源整合为切入点,初步探究了网络信息资源的供需途径和手段。
关键词:算机网络;信息资源;供需
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)21-0045-02
Network Information Resources Supply and Demand
WANG Ying
(Zhengzhou Financial Technician Institute,Zhengzhou 450013, China)
Abstract:Computer Network Information Resources has a wide distribution, diversity, non-linear, the number of large, fast-growing characteristics, the article as the starting point in the integration of resources, supply and demand initially explored ways and means of network information resources.
Key words: computer network; information resources; supply and demand
1 网络信息资源的界定
目前,信息资源已经成为一个跨学科的研究领域,主要涉及:计算机科学领域、信息管理领域、图书情报领域和社会管理领域。计算机领域侧重信息系统与技术的整合,也即“数据集成”,主要研究数据逻辑集成和物理集成的方法与技术。信息管理领域侧重信息系统业务流程与应用的整合。图书情报领域则比较侧重数字信息资源与服务的整合,例如,H.Peter指出图书馆信息资源整合利用应包括以下方面的内容,即“深网”挖掘(Deep Web)、较为合理的标注网络文献、门户网站为用户提供一些经过有序组织的数字信息资源入口,使得用户获取信息无需来回切换环境。社会管理领域偏重从合理配置资源入手,围绕用户信息需求和现有信息资源分布结构,采用有效手段配置网络信息资源,使得网络信息资源在空间上配置合理,提高网络信息资源的利用效率。此外,还有一些跨领域的学者,利用数学的、社会学的手段从对信息资源评价的侧面出发,研究了大量的信息评价模型,为信息资源的量化评定提供了科学依据。无论是计算机领域、图书情报领域还是信息管理领域,都不仅仅局限于某一个学科和领域知识,而是运用多学科的知识,综合多领域的成果来展开研究。这不仅为我们综合运用各领域的研究成果提供了便利,也为更有效地提高网络信息资源利用率提供了多种途径。
2 网络信息资源提供方式
1)官方网站。官方网站是指由某个组织或个人建立的最具权威性、公信力的网络站点。具备品牌形象的推广、信息政策的公开、新闻发布、产品信息、联系方式等功能。官方网站最突出的特点是发布的信息具有权威性,往往具有唯一性。官方网站上发布的信息代表的是该组织的意志,为公众提供最为准确的信息资源。如:政府部门招录工作人员,在其网站上发布招录通知、报名方式、招考流程等,都应字字斟酌,不能出现理解上的歧义,要体现唯一性和权威性。官方网站除了具备信息发布功能之外,有时候还会提供办公自动化(OA)平台的入口,提供给内部人员使用。个人的官方站点一般都由第三方机构负责建设和维护,由本人或其代理人负责发布信息,作为表述观点或自我宣传的平台。用户可以通过网页浏览器访问官方网站,获取机构或个人的最新、最权威的信息,使用相应的网络服务。
2)互联网门户。互联网门户全称为互联网综合门户网站,是指将不同来源的信息以一种整齐划一的形式整理、储存并呈现的网站,是互联网的重要入口之一。通常,用户可以根据信息地图、信息类型、信息来源、关键字词检索以及其他方式,来筛选并获取在网站内发布的所有内容。门户网站通常从不同的渠道来源获取有关信息,将这些信息复制并进行二次加工后到自己的网站上,成为自己的内容,而不是直接提供链接。构建一个门户网站需要用到的底层技术与构建其他类型的网站没有差别,但是门户网站有几个突出的要点。为了能够适应这些要点,也需要选用相对比较特殊的技术手段,因地制宜地进行建设。就如定义所说,一个门户网站需要从不同的其他消息来源跟踪并抓取信息,并将信息复制到自己的服务器上生成单独的页面。这些页面的版式不可以跟来源网站相似,而应该有自己统一的风格。这要求整个抓取过程,需要只抓取这个网页当中真正有用的那一部分信息,而忽略其他冗余信息。此外,门户网站的排版非常重要。信息的呈现方式不同、链接所在位置不同不仅会影响到信息的浏览量,以及所附带的广告价值,也会让读者对一个门户网站选取信息的方向形成自己的判断,进而推断出这个门户网站的倾向性。这跟报纸、杂志的排版其实是类似的道理。门户网站还应该允许用户以不同的方式检索并使用信息,因此信息架构是必须要考虑的问题。用户可以通过首页、专题页、频道页、列表页、搜索等方式来查找信息或信息的集合。通常,互联网门户网站都具备两类检索功能,一个是内部检索功能,用户可以通过输入关键词来搜索其中的内容,另一个是面向互联网的检索功能,这个面向全网的检索会和Google、Yahoo、Bing、Baidu等一些大型搜索引擎合作推出搜索业务。
3)专业数据库。专业数据库是指以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合,所存储的信息资源学科分类为同一学科,专门为某一领域提供服务。随着信息化程度的不断深入,各个行业通过引进和自行建设的方式逐步拥有了一定规模的数字化信息资源,并建立了规模不一的数据库。数据库系统的应用也迅速从传统的数据处理发展到基于空间和时间的信息处理、多媒体信息处理、工程数据库、办公信息库和基于Internet的数据库应用,使得数据库中存储的数据量急剧增长。一个完整的数据库服务系统包含前端Web服务器和后台数据库服务器两个部分,Web前端服务器负责生成界面并与用户交互,数据库服务器负责处理前台的请求,并且根据请求进行查询、修改、删除、增加等操作。数据库服务提供者依靠数据库管理系统(DBMS)实现对数据的管理,用户通过给定的方式来使用数据服务。对DBMS操作者而言,需要关注界面及资源导航模块、检索功能、资源整合模块、后台管理模块、底层技术等方面。目前国内比较常用的文献数据库有中国知网(www.cnki.net)、中国国家数字图书馆(www.nlc.gov.cn)、万方(www.wanfang.com.cn)、重庆维普(www.cqvip.com)等,行业数据库更多,如:中外专利数据库服务平台、河南省高校科技管理云服务平台(cas.rcloud.edu.cn)等。目前的主流数据库类型是关系型数据库,发展趋势为数据挖掘、海量存储、数据仓库、智能商务运算、高性能并发管理与控制。专业数据库的出现大幅度提升了人们获取信息和知识的能力,然而随着用户使用的数据库资源种类的逐渐增多,各个数据库资源描述和表达方式各不相同,同样的查询需求,用户需要频繁登录与退出各个数据库,在不同的数据系统中重复查找,这些无疑都增加了用户检索的时间,降低了其检索效率。
4)开放知识平台。由于互联网本身具有开放和自由的特性,人们迫切的需要一种更为便利的简单的方式获取信息资源,不再局限于官方网站、门户、数据库等传统媒介提供资源的途径,这种需求使得开放知识平台应运而生。开放知识平台旨在创造一个涵盖各领域知识的信息收集平台,强调用户的参与和奉献精神,充分调动互联网用户的力量,汇聚上亿用户的头脑智慧,积极进行交流和分享,从不同的层次上满足用户对信息的需求。这种开放性的平台强调自由内容、协同编辑,允许任何访问其网站的用户使用网页浏览器自由阅览和修改绝大部标签页面的内容,在政策上坚决拥护可供查证以及中立观点这两项要求。如:某一个用户创建了一个词条,可能其内容只有一个词—“计算机网络技术”,其他用户就可以编辑这个词条,或者加个单独的标签,专门对“计算机”进行编辑,写了一条“计算机促进了人类的发展”,第三个用户也可继续对其中的词汇进行编辑,如在“发展”上加一个标签,这样一来,每个标签都指向一个新的链接,用户点击相关标签就可进入新链接,很可能这个时候,第三个用户写的是“发展是硬道理”——这虽然背离了最初的主题,然而因为用户数量的巨大以及人们兴趣千差万别,因此各种词汇都可以被解释,很多观点都可以被表达。现阶段,网络开放知识平台最主要的用途是创建网络百科全书。据统计,英国的开放知识平台站点所收录的条目已经超过英国百科全书了。所以,可以预见的是开放平台以及相关新技术带来各种工具的发展是无可限量的,也会成为网络用户获取信息的主要渠道之一。
3 网络信息资源的获取方式
1)搜索引擎。搜索引擎是网络用户最为熟知信息检索系统,据CNNIC统计,截止到2014年12月份,中国网民搜索引擎用户规模达到52223万人,使用率80.5%,仅低于即时通讯类应用。一个搜索引擎由搜索器、索引器、检索器、用户接口4个部分组成。搜索器负责在网络中漫游并抓取信息;索引器负责理解和整理搜索器抓取的信息,并按照某种规则建立索引数据库,以备检索;检索器负责根据用户请求在索引数据库中检索相应的信息,同时还要按照设定的规则对检索结果进行排序;用户接口负责与用户的对话,即用户输入、结果反馈等。按照工作方式划分,搜索引擎可分为全文搜索、垂直索引和元搜索。用户在使用搜索引擎时,在用户界面输入要查询的关键词,然后搜索引擎在全网中或数据库中进行检索,并将查询结果反馈给用户,为了提高检索速度,大部分的搜索引擎提供商,会建立起自己庞大的缓存服务器,将全网用户搜索过的或者经过预读而抓取的信息资源存放在服务器中,并进行定时的更新,这样一来,即使目标服务器暂时中断服务,用户一样可以通过访问缓存服务器而找到所需要的信息资源,不仅提高了用户的检索效率,还保证了网络服务的可靠性。得益于搜索引擎用户规模的不断增长,他也逐渐成为重要的互联网入口,对用户的粘性更大。互联网虽然提供的信息资源越来越多,但因其开放性和自由性,信息内容的质量参差不齐,所以,未来搜索引擎将会朝着智能型的方向发展,以期为用户提供更为精准的数据。
2)专业检索工具。这里所指的专业检索是科学文献检索工具,使用对象为文化、教育、科研及其他专业技术人员。世界三大专业检索工具为《工程索引》(EI)、《科学引文检索》(SCI)、《科学技术会议录索引》(ISTP)。检索工具是相对于用户而言的,对信息提供者而言可以称为数据库。信息提供者通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使检索与存储所采用的特征标识匹配,使用户获取及利用信息资源。早期用户为了检索所需文献,不得不登录多个数据库并不停的切换,操作比较繁琐,专业检索工具出现后,对不同来源的数据库进行集成,实现跨数据库联合检索(一站式检索),大大提高了科研人员的工作效率。用户即可以采用默认的模糊查询也可以根据需求进行精准查询,比如由用户定义文献的主题、关键词、发表年份、文献类型等,当然这些专业检索工具往往都要收取一定的费用,或由用户直接支付或由一些公益性平台支付。高质量的检索工具在科学研究中,可以起到良好的引导作用,充分
利用专业检索工具不仅有利于科研人员掌握学科发展动态,也有利于其把握正确的研究方向,避免耗费精力走弯路和重复研究。
3)信息推送。信息推送,就是“web广播”,将合适的内容推送给合适的人,是一项有效减少信息过载的技术。推送(Push)技术通过自动发送信息,来减少用户用于网络搜索的时间,帮助用户高效率地发掘有价值的信息。对用户而言,信息推送是一种被动获取信息的方式,用户收到的信息即可是自己定制的,也可以是由信息推送者根据用户行为轨迹分析得出的结果而主动发送的,后一种情况有时候会有利于激发用户的兴趣,有利于挖掘潜在的用户,但有时也会变为“垃圾信息”对用户造成困扰,但不管怎么说,信息推送技术仍然是给用户获取网络信息多了一种选择。推送技术的主要优势在于,一是对用户的信息技术素质要求低,二是及时动态,三是推送信息的单位数据量小。除了处于发展初期的组织,一些比较大的门户网站和搜索引擎也会提供推送服务。推送技术的应用:RSS、广告信息群发、移动客户端推广等。
4)网站地图。网站地图又称站点地图,是网站中的一个页面,提供了一个网站中的所有链接,便于用户或搜索引擎找到网站内容。网站地图体现了一个网站内容自上而下的整体架构。许多用户都有这样的体会,当浏览一个网站的时候,因为页面链接太多,信息量太大而找不到所需要的信息,这个时候就可以访问网站地图,根据网站地图的指引,找到所需要的页面。所以,网站地图帮助改善用户的使用体验,而且网站规模越大效果越明显。对搜索引擎而言,网站地图可以优化搜索效果。
5)社交网络。社交网络(SNS)全称社会化网络服务,是基于互联网的一种在线社区。最初的社交网络由BBS、聊天室、新闻组的形式出现,随着博客、微博、微信等新的网络交流软件的出现,用户可以通过在网站上创建的个人主页来分享原创的或转载的信息。现在,用户有大量可以选择的社交网络服务,如:Fackbook、推特、微信朋友圈、QQ朋友网这些基于朋友关系的社交网络,可以使用户分享文字、图片、视频、链接等信息。也有百度知道、新浪iAsk、Yahoo Answers这些基于知识问答的社交网络,用户在网络上发起求助信息,由全网其他用户来回答,依靠众人的智慧来解决问题。因为社交网络具有“一传十、十传百”的特征,因此其用户规模迅速膨胀,不仅构筑了一个庞大的社会网络,还能为经营者带来无限的商机,同时为用户提供了一种更加自由的信息资源获取方式。
参考文献:
[1] 任吉刚,李晓红.信息资源建设与服务[M]. 呼和浩特:内蒙古大学出版社,2009:133-134.
[2] 田莉.我国深层网络信息资源的获取及保存策略研究[D].郑州:郑州大学,2013.
[3] 杨琼.网络信息资源管理[J].武汉理工大学学报:信息与管理工程版,2010(8):66-69.
[4] 陈光祚.因特网信息资源深层次开发与利用研究[M].武汉:武汉大学出版社,2002.