网络化学化工信息资源的分类对比研究

2009-01-11 07:39宋玉梅
现代情报 2009年11期
关键词:虚拟社区搜索引擎导航系统

宋玉梅 孟 勇

〔摘 要〕从网络搜索角度,将免费网络化学化工资源分为化学化工资源导航系统;化学化工搜索引擎;各种免费数据库和化学化工虚拟社区、wiki社区、化学化工blog四大类,对同类资源的功能进行对比研究,给资源以定位,为广大化学及相关研究者利用免费资源做出引导。同时对于资源的独特分类也为网络化学化工资源的整合和建设提供参考。

〔关键词〕免费资源;化学化工;导航系统;搜索引擎;虚拟社区;wiki;blog;免费数据库

〔中图分类号〕G354 〔文献标识码〕A 〔文章编号〕1008-0821(2009)11-0053-05

Classification and Comparative Research of Internet Chemical RecoursesSong Yumei Meng Yong

(Library,Nanjing University,Nanjing 210093,China)

〔Abstract〕In view of network resources research,free-online chemical resources were separated into four groups:internet chemical recourse navigations;chemical search engines;all kinds of free chemical databases and chemical virtual communities(chemical wiki communities,chemical weblogs).Recourses with similar functions were also compared.The purpose of this article was to give a hand to chemical researchers and researchers in similar areas in searching network recourses.The special separation method was also as an example for internet chemical recourses integration and construction.

〔Keywords〕free resources;chemical;navigation;search engines;virtual communities;wiki;blog;free chemical databases

随着网络信息技术的迅猛发展,互联网为人们提供了大量的信息资源,其中互联网上的免费化学化工资源极其丰富,且其资源数量在不断更新增长。面这些庞大的信息资源,如何准确,快捷、有目的性的获取有效的信息对化学及相关专业工作者尤为重要。与此同时,化学化工网络信息资源的有序性和可用性问题也已成为化学化工信息资源建设的一个关键问题。如何将分布在不同地点、不同类型的化学化工信息资源进行合理地收集、组织与整合,进而形成一个统一的高效利用的数字资源环境,以便于化学工作者密切跟踪和了解国际上化学科学的发展动态, 是一项非常有意义的研究课题。本文将从网络搜索角度就当前Internet上的免费化学化工资源进行分类对比研究,以期为广大的化学及相关专业工作者更清楚的了解Internet上的化学化工信息资源,针对性的有效的利用免费资源做出引导,同时也为网络化学化工资源的整合和建设提供参考。

鉴于网络上部分信息资源IP段限制、费用昂贵等诸多原因无法获取,广大化学剂相关研究者热衷于对免费网络化学化工资源的检索,普通网络用户的搜索流程大致如图1所示。

本文将免费网络化学化工资源基于其表现形式归为4类:(1)化学化工资源导航系统,(2)化学化工搜索引擎,(3)各种免费数据库,(4)化学化工虚拟社区、wiki社区和化学化工blog。下面就这4个方面进行分类对比研究。

1 化学化工资源导航系统

网络化学化工信息资源导航系统也可称为网络化学目录系统,其主要特点是人参与了网络化学信源的发现、评估和组织。化学化工信息资源导航系统是目前网络上最为简洁和方便的免费网络化学信息资源,导航系统建设人员通过对相关网站信息进行深度搜索、细分和整合,呈现给用户一个清晰、有效、便捷的网址列表,可以极大的节省用户搜索时间,提高用户搜索满意度和对导航网站的依存度。化学信息资源导航系统最早出现于1993年,由美国印第安纳大学的Gary Wiggins教授主持创建,全称为Chemical图1 普通网络用户的搜索流程

Information Sources,其中作为资源导航的部分称为Selected Internet Resources for Chemistry(SIRCh)。目前该网站采用wiki模式,任何对其信息感兴趣且有合法目的的志愿者都可以通过E-mail从管理员那里获取ID以便对该资源导航上的信息资源进行修正和补充。目前Internet化学资源导航系统大多采用3种分类体系对化学资源进行分类:一是按资源类型分类,将化学化工资源按研究机构、电子期刊、电子图书、数据库、软件、专利、实验室、论坛、学术会议、参考工具等分类。二是按资源学科分类,将信息资源按无机化学、有机化学、分析化学、物理化学、生物化学、高分子化学、材料化学、应用化学、化学工程等分类组织。三是混合第一、二类的分类方法,这种分类方法在资源导航中较常见。国内外在Internet上较优秀的化学化工信息资源导航系统有:国外美国印第安纳大学的Selected Internet Resources for Chemistry、英国利物浦大学的links for chemist、英国shifield大学的chemdex、国内台湾国立交通大学的infochem、中科院过程研究所李晓霞主持的ChiN以及袁中直、肖信策划创立的chemdoor。表1中对目前主要化学化工信息导航系统界面功能的对比。

从表1中可以看出各大资源导航系统基本都以英语为界面,其中以中文为界面的chemdoor也支持英文字段的检索。SIRCh独特的资源组织方式比较适合学习化学信息学的用户使用,其收录的内容也比较权威经典,加上其现在使用wiki模式使其被更多人认识和参与其资源组织组建工作,因此有比较稳定的发展前景。Links for chemists导航系统的检索方式更为人性化,但其对于资源无相应描述,用户使用时不能直接了解资源。Chemdex中最引人注目的是将其资源按照国家分类,一目了然更利于用户在浏览时对资源的取舍、了解各国的化学化工资源现状。ChiN资源丰富、对资源介绍较为详细,且具有中英日3种语言、便于资源系统的推广,目前是中国惟一被Thomson 公司的ISI Web of Knowledge平台中的Current Web Contents (CWC)收录的化学相关网站。

综合性网络化学信息资源导航系统作为最早的面向网络化学信息检索的工具已经成熟,但由于这些系统长期维护的代价较高,系统规模受到局限。为此,建立网络化学文本信息索引,从资源导航进一步向化学信息的专业搜索引擎发展。

2 化学化工搜索引擎

ChemGuide是最早称为化学搜索引擎的系统(chemistry specific search engine),由德国FIZChemie Berlin于2000年推出在网上运行,当时的索引规模约100万页,仅包括德国、美国、英国、加拿大4个国家的网络化学资源,2008年该系统的界面进行了改版,自称“ChemGuide——Your search enginefor chemical information”。网络上最为著名的化学化工搜索引擎则是1999年由犹太裔工程师Yaron Rapaport创建的Chemindustry.com。2003年罗凌云、王旭艳等人对其资源特色给过详细的介绍。随着网络技术的发展,新的化学化工搜索引擎也在不断涌现,如英国的chemistryguide,google近年推出的google chemistry dictionary,yahoo的Yahoo chemistry dictionary 和由中韩合作新推出的chemindex。表2是对这几个化学化工搜索引擎检索功能的比较。

表2从语言、检索、显示结果、资源特点及资源数量对这几个化学化工搜索引擎进行了对比(由于响应时间受网络速度的影响,此处未作对比)。比较发现,这些化学化工搜索引擎检索界面非常简洁,都支持布尔逻辑检索,自然语言检索。Chemindustry和chemindex的性质比较接近,都是偏向于全球化工的搜索引擎。两者相比,chemindustry涵盖的资源更为丰富,就service分类而言,在chemindustry中分为17类,有不少于8 439个website链接,而在chemindex中则分为16类,有不少于5 383个website链接,但这两者并非包含关系,而是互补关系。Google chemistry dictionary(GCD)和Yahoo chemistry dictionary(YCD)中都是按照资源类型分类,GCD分为37个小类,YCD分为43个小类,两者比对资源也是互补的,具有优势的是GCD还给出相关分类中与化学有密切关系的资源比如business中的化学品和technology中的材料。Chemguide的界面非常简单,与其它搜索引擎不同的是,它还拥有非常强大的高级检索功能,但其缺点是没有该搜索引擎的相关信息,用户对其了解不能像其它搜索引擎一样有个明显的定位。Chemistryguide是相对比较专业性的搜索引擎,其定位是经过专业人员精心挑选过滤的专业性较强的搜索引擎网站,其首页中按照化学学科类别进行分类,同时搜索可以直接链接到免费数据库chemistry synthesis database,但其涵盖内容较少。可以说chemindustry和chemindex适合于化工研究者及化工公司使用,而GCD、YCD、chemguide和chemistryguide则是更具有化学知识普及及学术功能的搜索引擎。

由于化学学科的特殊性,化合物往往与分子结构相关联,文中列出的6个化学化工搜索引擎中都是局限在字段检索且受语言的限制,如果附带结构检索或与结构相对应的smile、inchi号检索,则其功能将更为强大,eMolecules(http:∥www.emolecules.com/)就是这样一个通过结构式、simle号或者是inchi号检索的搜索引擎网站。比如要搜索醋酸的性质,以往搜索引擎只能输入CH3COOH或者acetic acid或者乙酸。现在可以手动画出它的分子结构式,然后提交搜索。对于科研工作者来说eMolecules搜索方便且其搜索的精确度比用分子式搜索更高。它的原理是把化学式图像转换为文字,再进行搜索。2008年玆esearch informatio杂志还报道了宾夕法尼亚州立大学的David Robson等人研究的新搜索方法,通过该方法可识别具有不同名称、缩写和分子式的化合物。该小组正在创建的chemXSeer搜索引擎可以识别同一化合物的不同标注,简单说比如CH4、H4C和甲烷。

网络化学信息资源导航系统和网络化学信息搜索引擎都是利用web页面链接分析来发现新的化学信息页面,这一方法无法应用于web化学数据库所存储的化合物及其数据的发现与索引。网络免费化学化工数据库仍是网络用户需要独立搜索的资源。

3 网络免费数据库

通过前文叙述到的化学导航系统和化学化工搜索引擎,用户通常可以得到网络化学化工数据库的URL链接,从而进行进一步的检索。当前网络上具有代表性的免费化学化工数据库有化学合成数据库ChemSynthesis、物性数据库Chemistry WebBook、结构数据库ChemSpider、期刊性质数据库Pubmed、有机小分子活性数据库Pubchem、上海有机化学研究所的数据库群以及专利性数据库。表3是非专利性数据库的检索对比。

通过对比可以发现,除具有期刊数据库性质的pubmed,合成数据库、物性数据库和结构数据库的检索,一般都支持化合物名称、CAS号的检索。显示方式则由于数据库本身性质不同而各不相同。着重于化合物合成的数据库ChemSynthesis直接给出化合物合成文献具体期刊,为难以获得CA、Beilstain/Gemlin等综合性数据库资源的有机合成工作者完成了前期文献检索部分工作。物性数据库Chemistry WebBook则是化学化工研究者的化学百科辞典,从中研究者可以得到化合物多方面的信息。对于都具有子数据库的pubchem和上海有机化学研究所的数据库群,pubchem的“一站式”检索显得更加的简洁、方便,而作为国内第一个综合性化学数据库的的上海有机化学研究所的数据库群的检索则显得繁复和界面不友好。对于仍在开发建设中上海有机化学研究所的数据库群,美国国家标准与技术研究院 NIST的数据库建设技术有许多借鉴之处。

对于化学化工研究者来说,专利数据库也是非常重要的资源。网络上各国专利局或知识产权局一般都会给出相应专利数据库。目前利用较多的免费数据库有:中国国家专利检索数据库(http:∥search.cnpat.com.cn/Search/CN/)、加拿大专利数据库(http:∥patents.ic.gc.ca/cipo/cpd/en/introduction.html)、美国专利商标局网上专利检索(http:∥patft.uspto.gov/)欧洲专利局的ESP@CENET(http:∥ep.espacenet.com/)、世界知识产权组织网上专利检索(http:∥www.wipo.int/pctdb/en/)等等一系列专利数据库。

网络用户在对网络化学化工导航系统、搜索引擎搜索和网络免费化学化工数据库的利用过程中必定会产生疑问、希望得到解答,同时也希望将自己认为不错的资源推荐给他人,解答他人疑问,对于一部分化学工作者还希望找到与自己研究领域相同的群体。基于web2.0技术的化学化工虚拟社区、Wiki社区和化学化工相关blog就为用户搭建了这样的互动平台。通过对这些资源的搜索积累必定可以了解更多综合性的化学化工资源。

4 基于web2.0技术的化学化工虚拟社区、Wiki社区和化学化工相关blog

虚拟社区(virtual community or online community)是web2.0技术与社区相结合的产物。化学化工虚拟社区是由对化学化工有共同兴趣的人组成的团体。虚拟社区一般都采取会员制,根据会员对社区的贡献分等级,同时也根据会员等级给与不同等级资源的享有权利。与传统web服务相比,虚拟社区更注重信息资源的自主性、权威性、综合性和会员的参与性。可以说化学化工虚拟社区是化学化工业内良好的学术交流场所。化学化工虚拟社区作为Internet环境下化学研究者获取信息和进行交流的一种模式,正逐步成为化学研究者获取信息和进行远程交流的基本选择。目前网络上的化学化工虚拟社区很多,包括上面介绍的化学化工搜索引擎和化学化工导航系统也有向化学化工虚拟社区发展的趋势。国外比较著名的化学化工虚拟社区有英国的chemweb(http:∥www.chemweb.com/),德国的chemie(http:∥www.chemie.de/),国内学术圈影响较大的有小木虫学术论坛(http:∥emuch.net/)、偏向于医药化工的鸭绿江论坛(http:∥forum.e2002.com/)等。

同样基于web2.0技术的wiki社区,通过wiki模式形成。Wiki的知识传播是以词条为中心的非线性方式,维客们通过关键词条找到与自己在某方面志同道合的朋友,用Wiki的机制,把相关主题用词条链接起来。这种非线性的知识自组织过程,没有任何的强制力,每个页面都是通过词条链接在一起的,用户可以通过不断的点击词条链接到Wiki网站的每一个内容页面,因而,自组织的结果形成了知识内容的广泛关联度。同时,由于链接是通过相互引用和描述的方式实现,所以在知识的链接上具有强相关性。目前综合性的化学化工类wiki社区有usefulchem(http:∥usefulchem.wikispaces.com/)、用于化学教学的有chem241(http:∥chem241.wikispaces.com/)、mc-chem(http:∥mc-chem.wikispaces.com)、(http:∥teachgreenchemnh.wikispaces.com/)等。

weblog是个人网站,是以日志的形式描述那些按照日期顺序发布正在进行事件的网,weblog网站上的知识尤其是个人知识很容易被管理。Blog的归档、分类、搜索、动态更新等特点便于知识的组织。因此,对于想把自己的专业知识扩大、传播的化学化工专家而言weblog是一个理想的媒介,当然weblog也适合那些几个人通过建立链接构成小组彼此沟通的网民。科学堂blog(http:∥chenjinghua.net/sci)中就归纳了几十个国内外化学相关的blog。

对于基于web2.0技术的这三类网络化学化工资源目前还没有任何专门的导航体系,化学化工虚拟社区资源和化学化工blog在化学化工导航系统中有一些零星介绍和链接。这些资源分散在网络上,因此,对于网络用户应根据自己感兴趣的课题及研究方向进行网络搜索。例如自己所了解的化学化工专家或学者的blog,由于blog本身也会给出与本blog内容相关的blog,具有链带效应,搜索相对容易。至于wiki社区资源则只需要用户对感兴趣的词条进行搜索和积累。

古语云“授之以鱼,不如授之以渔”。本文并非是网络免费化学化工资源的简单罗列,而是从用户网络搜索角度对网络化学化工免费资源进行分类,并对同类资源功能进行对比,从而使化学化工工作者对各类免费网络资源情况有一个定性定位,对于网络用户在对网络化学化工资源没有了解的情况下,首先应该浏览综合性的化学化学资源导航,而对于想从网络上了解某类物质具体信息时,则可以通过化学化工搜索引擎或者是免费化学化工专业数据库进行搜索。对于愿意更多的与人分享和交流经验的用户则可以通过化学化工虚拟社区、Wiki社区 和化学化工相关blog等各类技术资源实现。文中对于同类资源的对比,则使用户对资源有更精确定位,同时对其基本检索有所了解。

参考文献

[1]朱长菊,彭凤来.网络化学化工资源的整合研究[J].吉首大学学报:自然科学版,2009,30(1):122-127.

[2]李晓霞,郭力.Internet上的化学化工资源[M].北京:科学出版社,2000.

[3]李华.数字化石油化工信息资源开发与利用研究[D].武汉:武汉大学,2005.

[4]黄晓斌,夏明春.数字资源整合方式的比较与选择[J].情报科学,2005,(5):690-695.

[5]肖信,袁中直,廖菊芳.Internet上重要的化学资源导航系统及其资源分类研究[J].现代图书情报技术,2002,(2):69-71,78.

[6]刘淑琼.Internet上的化学化工信息资源[J].胶体与聚合物,2003,(1):43-44.

[7]罗凌云,欧阳轻娥.化学化工搜索引擎Chemindustry.com[J].现代情报,2003:51-52.

[8]Antony J.Williams.Drug Discovery Today.2008,(13):495-506.

猜你喜欢
虚拟社区搜索引擎导航系统
基于KANO模型问答型虚拟社区用户需求的分类研究
一种GNSS/SINS容错深组合导航系统设计
解读全球第四大导航系统
网络搜索引擎亟待规范
虚拟社区人际关系对旅游行为意向影响的实证研究
基于虚拟社区的定向出版模式
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析
虚拟社区感对用户忠诚度影响的实证研究