医学文献中信号通路的检索方法探讨及常用网站

2012-04-29 02:54孙淑萍孙玉坤
现代情报 2012年12期
关键词:科技查新信号通路查全率

孙淑萍 孙玉坤

〔摘 要〕利用维普资讯——中文科技期刊数据库、美国国立医学图书馆的pubmed系统,对医学文献中信号通路的检索方法及应注意的问题进行论述,探讨其对医学科技查新的影响。

〔关键词〕科技查新;数据库;信号通路;检索方法;查全率;查准率

近年来研究发现,信号转导通路几乎参与所有的细胞生命活动,包括细胞代谢、分裂、分化、凋亡等。异常的信号转导通路在肿瘤细胞的增殖和分化过程中起着重要的调节作用。分析异常的信号通路,将对癌症的机理研究提供有益的指导作用。下面以“维普资讯——中文科技期刊数据库——镜像站”、“美国国立医学图书馆的pubmed系统”为例,就科技项目查新检索工作中,磷脂酰肌醇-3-激酶/丝苏氨酸蛋白激酶(PI3K/Akt) 信号通路的检索方法及应注意的问题,谈一些认识和经验。

1 维普资讯——中文科技期刊数据库

在诸多的信号转导途径中,磷脂酰肌醇-3-激酶/丝苏氨酸蛋白激酶(PI3K/Akt)通路被认为是癌细胞存活的首要通路,参与细胞生长、增殖、凋亡及迁移的多个过程,有望成为肿瘤治疗的新靶点。但磷脂酰肌醇-3-激酶/丝苏氨酸蛋白激酶(PI3K/Akt)检索词全称过长,且词中含有“-”和“/”等特殊符号,检索起来比较困难,很容易造成漏检。检索人员在检索PI3K/Akt时,分别采用几种不同检索词和书写方式进行检索,详见检索结果对照表,见表1。表1 任意字段PI3K/Akt的不同检索词及书写方式的

结果比较(1989-2012,9月)

序号检 索 词命中篇数①磷脂酰肌醇-3-激酶/丝苏氨酸蛋白激酶152②磷脂酰肌醇3激酶*丝氨酸*苏氨酸*蛋白激酶11③磷脂酰肌醇?激酶*丝氨酸*苏氨酸*蛋白激酶11④磷脂酰肌醇3激酶*丝苏氨酸蛋白激酶8⑤PI3K/Akt381

检索结果分析:检索式①命中的152篇文献,经将检索式展开,全都是以磷脂酰肌醇命中的文献,与PI3K/Akt不相关,显然是错误检索。后发现维普资讯——中文科技期刊数据库不识别“-”的半角符号输入方式,而默认“—”的全角符号输入方式。检索式②③④将磷脂酰肌醇-3-激酶/丝苏氨酸蛋白激酶检索词拆分,运用逻辑运算符“*”进行检索,虽检索到磷脂酰肌醇3激酶/丝苏氨酸蛋白激酶的文献,但相对文献较少,查全率低。检索式⑤命中381篇文献,全部是PI3K/Akt的文献。

在医学文献中,很多词都有全称和缩写两种书写形式。从表1中可以看出,缩写词在文献检索中起至关重要的作用,忽略缩写词,将漏检很多文献。尤其是在检索磷脂酰肌醇—3—激酶/丝苏氨酸蛋白激酶(PI3K/Akt)这类检索词过长,且词中含有“-”和“/”等特殊符号时,应尽可能选择检索式⑤的缩写词进行检索,避免漏检,提高查全率。

2 美国国立医学图书馆的pubmed系统

等进行检索,均命中6 304篇文献,全部是PI3K/Akt的文献。以英文检索词进行检索,检索式⑤⑥⑦分别命中558、37、518篇文献,虽检索到PI3K/Akt的文献,但相对文献较少,查全率低。采用逻辑符“AND”的分栏式检索词输入方法,即2个检索框进行检索,分别命中1 611篇和2 197篇文献,检索式⑧⑨为检索后系统给出的检索表达式,除命中PI3K/Akt的文献外,还命中PI3K/Akt拆分的文献。

从表2中可以看出,在检索磷脂酰肌醇-3-激酶/丝苏氨酸蛋白激酶(PI3K/Akt)这类比较长的检索词时,尽量不选择该信号通路的英文词进行检索,以防造成不必要的漏检。而应选择该信号通路缩写词的不同书写方式进行检索,也就是检索式②③④中的任何一种检索式,均能提高查全率和查准率。

3 医学文献信号通路的网络信息资源

互联网是世界上最大的信息资源网,利用网上资源是获取有用信息的最快、最有效的途径。近年来,与信号通路有关的研究正如火如茶,搜集、整理与信号通路有关的信息,对于全面理解生物进行复杂调控机制具有重要意义。但是面对浩如烟海的信息资源,要从中快速、准确地查找出所需的信息,并非易事。下面介绍比较常见的与信号通路密切相关的数据库。

存放信号通路的数据库:

《科学》(Science)是美国科学促进会(AAAS)出版的一份学术杂志。信号转导知识环境 (stke.sciencemag.org)是一个为研究细胞如何用化学信号相互“交流”提供的一个中心电子信息源。这个生物科学信息网络对了解从胚胎发育到癌症的几乎全部生物学问题必不可少。STKE提供综述文章、研究评述、实验规程、以及连接图(Connections Maps)等,该网站的内容被Medline索引[2]3.2 Signaling Gateway(http:∥www.signaling-gateway.org/) Signaling Gateways是加州大学圣地亚哥分校自然信令网关的分子页面(http:∥www.signaling-gateway.org/molecule)数据库,提供了超过4000蛋白质参与细胞信号,以及专家撰写的评论,高度结构化的数据,包括蛋白质相互作用等,这里介绍的信息和数据是免费提供给所有者[3]。

3.3 KEGGIsl(www.genome.jp/kegg)

KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是由日本京都大学生物信息中心开发的,是一个在网络水平和分子水平系统研究基因功能的数据库。KEGG数据库的主要组成部分是各种调控通路的图表。KEGG数据库主要以通路的形式储存关于基因组,生物化学、分子以及细胞生物学的一些研究,并且体现在分子水平或者基因水平的调控关系。另外,KEGG也储存了大量物种的基因目录以及全基因组序列信息。这个数据库每日更新并且是开源的

3.4 Biocarta(http:∥www.biocarta.comD)

BioCarta数据库是一家生物技术公司它在其公共网站上提供了用于绘制生物学通路的模板。可以用来研究分子互作关系、富集分析、通路为基础的研究等。它还提供了包括12万多个多物种的基因信息的重要资源。Biocarta的主要特点在于它是一个开源的在线平台,科研工作者可以在线上自主交流,自行绘制所涉及的通路。在Biocarta的通路页面,基因间的相互关系也以生动的图表表示出来。与KEGG不同的是,Biocarta以信号转导通路占主要部分[4]。

综上所述,在维普资讯——中文科技期刊数据库、美国国立医学图书馆的pubmed系统中,在检索有关医学文献信号转导通路时,我们必需考虑该信号通路检索词的全称、简称、英文名称、缩写词、特殊符号、希腊字母等不同的书写方式以及各数据库默认的检索表达式,尽量避免漏减,提高查全率。同时还可以利用网上信息资源,获取与信号通路有关的医学文献。

参考文献

[1]王立荣.信号通路相关文献挖掘与分析方法[D].2007-中国科学技术大学:生物医学工程 博士学位论文 万方数据库

[2]www.labbase.net/News/…5724B3A.html[EB].2009-12-07.

[3]www.signaling-gateway.Org[EB].

[4]王琼萍.通路分析与调控网络的分析[EB].www.xumurc.com/main/showNews-9656.html,2012-06-13.

(本文责任编辑:孙国雷)

猜你喜欢
科技查新信号通路查全率
海量图书馆档案信息的快速检索方法
心肌缺血再灌注损伤的发生机制及其防治策略
科技查新服务业变革优化的动力机制研究
科技查新领域的信息化问题研究
浅谈医学科技查新档案信息资源的开发利用
从信号通路角度分析中药治疗儿童白血病的研究进展
文献采购查重工作的实践与思考
基于Web的概念属性抽取的研究