刘建辉,朱 蕾
(中国地质大学,武汉 430074)
当前,信息产生的速度正以几何级数形式增长,信息资源也随之以几何级数的速度增长,尤其是网络信息资源,较传统信息资源增长,更新速度更快,数量更大。在这种情况下,加强对国内外网络地学文献信息源的研究,掌握网络地学文献信息源的分布情况、规律和特点,为地学学科发展提供针对性的服务,成为高校图书馆学科服务人员的责任和义务,如对网上信息资源进行筛选、分类、鉴别和链接,制作专业网站,为用户在浩瀚无际的互联网信息海洋中采撷信息提供导航等,即通过引导用户快速、准确地进入特定网站,检索到所需的有效信息,以优化检索质量。
信息是指应用文字、数据或符号等形式通过一定的传递或处理,来表现各种相互联系的客观事物在运动中所具有的特征内容的总称。地球科学飞速发展,新理论、新方法、新技术层出不穷,相应地,地学信息源也日益扩大。地学信息资源涵盖了涉及地学的文献、知识、信息的所有方面。其中,学术文献信息资源是最常用、内容最丰富的一种信息资源。对国际地球科学发展趋势的分析表明,现代地球科学的概念与传统相比已经发生了巨大的变化,出现了“大地质”、“大资源”、“大国土”的理念。根据这一思路,将传统的地学概念进一步拓展,研究范围也进一步拓宽,主要包括2个方面:(1)从狭义的地质学向广义的资源科学拓宽,涉及范围包括地质、矿产、土地、海洋、水资源、环境、测绘等方面,逐步确立“大资源”、“大地质”的理念;(2)从单纯的以科学研究为主的文献信息,向科研信息和管理信息并重拓宽,从某种意义上看,更侧重于加强管理文献信息源的建设。
地学信息按出版方式不同分为:期刊、博硕论文、会议、专利、科技报告等等。Internet上免费电子资源十分丰富,如专业的搜索引擎、社区和论坛、免费电子期刊、免费电子图书、免费软件下载等等,其中有很多学术价值较高的地学资源。图书馆工作人员通过网络收集整理免费的电子资源,从中选择与地学有关的网站,专供用户浏览、下载。以此增加图书馆的虚拟馆藏,这对于缓解图书馆经费紧张,提升图书馆的服务质量,改善图书馆的服务模式有着深远的影响。
如何从海量的网络信息资源中选出具有专业学术价值的信息资源,是导航库建设过程中非常重要的一环,因此必须在遵循网络信息选择标准的前提下,建立严格的信息采集原则,并借助科学的信息获取方法和途径。信息采集原则应遵循:
(1)需求性。所谓需求性就是根据用户信息的需求来决策采集内容,信息采集要为教学服务、为科研服务、为广大师生服务。
(2)特色化。有特色才有生命力,在信息资源的收集中,要体现中国地质大学的办学特色。只有在文献资源的采集时特色突出,才能形成以地球科学为主,其他专业为辅的特色馆藏资源。既要区别于专业单一的图书馆,又要区别于其他综合型大学图书馆。
(3)系统性。系统性就是不是简单地将收集到数据堆砌、拼凑,而是按照导航库的基本框架系统地收集、组织、编辑、处理、存储地球科学领域中的信息。
采集方法主要包括随机累积法、专题累积法、使用评估和专家推荐法。随机累积法就是通过平时随机积累与分类,变一般资源为专题资源,增加其用途和价值;专题累积法就是设置专题,有的放矢、持之以恒地进行专项积累;使用评估就是让用户通过一段时间的使用对信息资源进行评价,信息采集人员通过统计分析后判断资源的利用价值,从而最终取舍;专家推荐法是由地学专家向图书馆推荐高质量的图书、电子数据库和免费网站。
利用数据挖掘技术对Internet上无序的地学信息采集和分类,使图书馆的信息资源更加丰富。数据挖掘包括数据抽取、数据分类、数据聚类和数据关联四个方面:(1)数据抽取是从无限庞杂的信息源中以多维的数据分析方法抽取与地学有关的信息数据。(2)数据分类是对网络中发现的相关数据进行分析、比较、识别、分类和整理,从大量的信息中剥离出与地学主题或子题类目有密切关联的数据。(3)数据聚类是将属于地学主题和子题类目的各种数据,或近似类目的数据进行分析比较聚类。(4)数据关联不仅将搜集到的有关地学各目录的数据分类取舍、聚类于相应的类目中,还要将有关联的其他学科的数据聚类于相应的类目之下,揭示边缘交叉学科的一些理论与地学有关理论的关联性,引导用户把学科理论的研究推向更深、更广。其中数据分析和归类是最为重要的步骤。
如果没有一个有效地工具,在网络中查找信息就如同大海捞针。网络搜索引擎为解决这一问题提供了非常有效地手段。网络搜索引擎包括:分类式搜索引擎和关键词搜索引擎。分类式搜索引擎的性能取决于如何获得网络信息和对已获得的网络信息怎样进行分类。关键词搜索引擎不是按主题来检索信息,而是用提供关键词的方法进行检索。这两种途径在地学信息采集中都非常有效,两者相互相成,为地学信息采集提供帮助。目前网上提供的搜索引擎不计其数,但任何一个搜索引擎只能侧重于某几个方面,难以面面俱到。以下是根据工作经验,介绍几种适合信息资源采集的学术搜索引擎:
(1)SCIRUS (http://www.scirus.com/).SCIRUS是由爱思唯尔科学公司(Elsevier Science)于2001年4月推出的、迄今为止国际互联网上最全面的科技信息专用搜索引擎。它以自身拥有的资源为主体,对网上具有科学价值的资源进行整合,集聚了带有科学内容的网站及与科学相关的网页上的科学论文、科技报告、会议论文、专业文献、预印本等。SCIRUS的检索界面友好,简洁方便。
(2)Google Scholar(http://scholar.google.cn/).Google scholar是由Google推出的免费学术搜索工具,可以帮助用户快速查找学术资料,包括来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和技术报告。Google Scholar在索引中涵盖了来自多方面的信息,信息来源包括万方数据资源系统、维普资讯、主要大学发表的学术期刊、公开的学术期刊、中国大学的论文、中国国家数字图书馆的馆藏图书以及网上可以搜索到的各类文章。
(3)INFOMINE (http://infomine.ucr.edu/).INFO-MINE是为大学教师、学生和研究人员建立的网络学术资源虚拟图书馆。它拥有电子期刊、电子图书、公告栏、邮件列表、图书馆在线目录、研究人员人名录,以及其他类型的信息资源40000多个。INFOMINE对所有用户免费开放,但是它提供的资源站点并不都是免费的,能否免费使用,取决于用户所在图书馆是否拥有该资源的使用权。INFOMINE共有12个数据库,其中包括地图和地理信息系统(GIS)数据库,物理、工程、计算机和数学数据库。
地球科学数据信息导航 http://esdip.llas.ac.cn/SPT——Home.php是2002年9月由中国科学院批准的中国科学院知识创新工程重要方向项目。该项工作的目的是为集成揭示国内外主要地球科学数据资源提供深入的导航服务,宣传和推介地球科学数据资源,积极有效地提高和促进用户对地球科学基础性数据的利用和共享。目前导航系统已经收集了5000余条国内外地球科学及其相关学科数据资源的元数据信息,并全部提供开放式服务。
国内著名的地学图书馆中国地质图书馆 http://124.42.30.4/ngds/.该库以中国地质图书馆馆藏期刊、图书为主要数据源,收录中文地球科学、土地科学及相关内容期刊、专著、汇编、会议论文集等文献资料。
国外著名的大学和科研机构有:哈佛大学地质系http://www-eps.harvard.edu/;澳大利亚地球科学http://earthsci.org/;康奈尔大学地质科学系 http://www.eas.cornell.edu/;耶鲁大学地质与地球物理系Department of Geology and Geophysics http://www.geology.yale.edu/;普林斯顿大学Princeton University Department of geosciences http://geoweb.princeton.edu/;华盛顿大学University of Washington Earth and Space Sciences(Geology,Geophysics,Geological Sciences)http://www.vsc.washington.edu/;斯坦福大学地球物理系Geophysics Departmenthttp://pangea.stanford.edu/GP/;斯坦福大学Geological&Environmental Sciences Department http://pangea.stanford.edu/GES/GES.html;斯坦福大学能源与资源工程系Energy Resources Engineering http://pangea.stanford.edu/ERE/;斯坦福大学地球科学学院SCHOOL OF EARTH SCIENCES http://pangea.stanford.edu/,等等。
专业期刊历来都是学术资源的重要来源,其网络版亦然。目前很多专业期刊都有网络版,在其纸质版本上一般都有其网址的介绍。其中由中国地质大学主办的《地球科学一一中国地质大学学报》是中国自然科学核心期刊,进入EI、CA,PX,CBST等世界著名国际检索系统。
国外的地学类专业全文数据库主要有:Geo-ScienceWorld数据库,它是由7家地球科学领域的顶尖协会共同建立的非营利型组织,现已出版32种地球科学领域相关的期刊文献。AGU(美国地球物理协会)是以地球科学为核心内容的跨学科的综合性研究站点,信息来源于世界上117个国家的38000余个科学家的研究进展和研究成果。外文文摘数据库主要有GEOREF,是由美国地质协会(American Geological Institute)编辑的地学数据库。它收录了1785年以来的北美地学文献和1933年以来的全世界地学文献,至1994年共计170万条,现年递增8万条文献。GEOREF收录的文献范围很广,包括期刊、会议录、图书、地形图和地质图、学位论文、报告、传记等,70%的文献来源于世界各国出版的4000余种期刊,2%的文献来源于会议录。
互联网上有许多高质量的学术网站和论坛。如:自然资源与环境Natural Resources&Environment http://www.snre.umich.edu/;中国国家地理 http://www.dili360.com/;中国地学网 http://bbs.geonet.cn/;地学探索 http://www.geology.com.cn/forum/;矿物记实杂志http://www.minrec.org/;极光 http://www.geo.mtu.edu/weather/aurora/;火山世界 http://volcano.und.nodak.edu/;中国地震科普网http://www.dizhen.ac.cn;化石网 http://www.uua.cn;地质与板块科学http://www.gps.caltech.edu/;试验岩石学 http://expet.gps.caltech.edu/;地质网 http://geology.com/;地球科学世界 http://geology.geoscienceworld.org/;地质与板块http://www.gps.caltech.edu/等等。
对采集到的资源按一定策略进行重组与发布,建立地学学科导航体系,提高资源的可用性。学科馆员可以建立专业的地学网站来组织、存储和发布采集到的信息,也可以利用一些成熟数据库商提供的工具组织和存储。如中国知网提供了机构馆工具,学科馆员可以建立地学专业机构馆,利用“文献管理和互联网信息挖掘”栏目为读者推送地学研究领域相关的学术网站,并可进行分类管理和利用。
当然由于网络资源更新速度快,不断有新的资源产生,也不断有过时的资源从网络上消失,因此,学科馆员要跟踪学科资源发展变化,及时更新资源链接及本地副本资源,保证信息的时效性。
[1]张显忠.“地学信息港”专业网站建设初探[J].图书馆学研究,2003,(6).
[2]常 青.农业网络信息资源的采集[J].情报杂志,2007,(9).
[3]马翠凤.地质图书馆的专题特色数据库建设[J].图书馆学研究,2006,(11).
[4]马 冰,刘洪光,金真针.国内外地学文献的信息源[J].地质通报,2009,(1).
[5]李 萍.网络信息资源的采集策略[J].科技情报开发与经济,2006,(8).
[6]付光宇,刘克伟.试论网络信息资源的采集策略[J].网络财富,2008,(9).
[7]谭建豪.数据挖掘技术[M].北京:中国水利水电出版社,2009.
(编辑:陆继玲)