基于文献的知识发现服务及其问题——以南京中医药大学图书馆为例

2015-07-03 11:23李文林
大学图书馆学报 2015年2期
关键词:馆员工具学科

基于文献的知识发现服务及其问题——以南京中医药大学图书馆为例

摘要基于文献资源开展知识发现服务已成为大学图书馆的发展趋势。南京中医药大学图书馆作为国内较早实施基于文献的知识发现服务实践的机构,以Web of Science、Pubmed及中医药类专业文献数据库为信息源,结合不同文本挖掘工具自建数据挖掘平台,面向学科开展了多项有助于启发科研思路的知识发现服务。实践成果表明图书馆与学科之间实现了协同发展,但在现实中也遇到了一些影响馆员积极性的因素,尤其是知识服务专业成果的认定、馆员与教师身份认同方面的差异,已成为高校图书馆推进学科化知识服务工作必须要认真面对的问题。

关键词高校图书馆文献资源知识发现案例研究

以启发科研思路、辅助科研决策为目的的基于文献的知识发现服务因能揭示大量公开发表的文献中隐含的科学知识,有助于研究人员从繁重的文献阅读工作中解脱出来,因此正越来越受到科研工作者的青睐与认可。

与其他学科相比,生物医学领域基于文献的知识发现服务经过多年的探索已进入全面发展阶段[1],国内外多种基于文献内容的知识发现方法或工具受到领域专家的认可,尤其是一些免费的专业知识发现平台为医药院校图书馆开展知识服务创造了条件。

南京中医药大学图书馆作为国内较早实施基于文献的知识发现服务的图书馆之一[2-4],自从2008年利用非相关文献知识发现工具Arrowsmith为校内中药学科研究团队提供知识服务以来,一直注重依赖专业馆员队伍对领域知识发现方法与工具的跟踪与应用,持续为学校承担的十五、十一五科技攻关、973项目及多个国家自然基金项目团队开展面向问题的服务,在相关学科的研究团队中取得了广泛认可,有效实现了知识服务与科研团队的协同发展。现结合案例研究,将近年来知识服务的做法、体验及遇到的问题进行总结,以期抛砖引玉,为推动高校图书馆深层次学科化知识服务的发展提供参考。

1基于文献数据库的知识发现服务

1.1 以web of Science为文献信息源进行共词分析服务

高校图书馆文献利用的高峰是每年国家自然科学基金或社会科学基金项目申报的前期。这个时段,尽管许多科研工作者对文献的检索、分析都有自己的诀窍,但在有限的时间内逐篇阅读密切相关文献仍是一件耗时、费力的事情。总有一些专家希望有专业背景的馆员针对其具体问题能在大量文献中筛选出有助于启发思路的关联知识,供其取舍参考。我馆的做法是,针对前沿性研究问题,组织人员对web of science进行文献检索,从相关的第一篇文献开始,结合文献量随时间的变化情况理出领域问题的总体发展态势,然后在总体趋势图上选取处于转折点上的高被引及高影响因子的文献进行深度阅读,从这些具有里程碑式的关键文献中梳理出知识聚合或分散的演进路径,再结合共词分析工具,对研究者关注的信息点进行深度解析。

以糖尿病肾病的中药治疗靶点筛选为例。研究者从大量中药复方中筛选出了若干个对糖尿病肾病有防治作用的单味中药,为进一步对这些中药的临床药效进行研究,需要了解这些中药对糖尿病肾病(Diabetic Nephropathy,DN)的可能作用机制,希望图书馆能提供研究切入点的参考信息。针对这一需求,我们首先检索出关于糖尿病肾病药物治疗的最新文献综述,阅读后发现当前治疗DN的药物主要为血管紧张素转换酶抑制剂(Angiotensin-Converting Enzyme Inhibitors,ACEI)、抗高血压药(Antihypertensive Agents)、胰岛素(Insulin)、降糖药(Hypoglycemic Agents)、血管紧张素Ⅱ型受体拮抗剂(Angiotensin II Type Receptor Blockers,ARB)等,这些药物都与糖尿病肾病已知的发病机制有关。从发文量来看,1965年就有了关于胰岛素的报道,1987年出现了第一篇关于ACEI的报道,2002年出现了第一篇关于ARB的报道。从文献的时间趋势来看,医学领域对胰岛素的研究与报道一直处于持续上升状态,而ACEI在2005年发文量大幅下降之时,正是ARB 发文量大幅增长之时,对这些文献的进一步检索、分析发现,为最大限度地减轻现有药物的副作用,有少量文献认为ARB在糖尿病肾病的已知发病机制之外,还可能通过另一条可能的信号路径对糖尿病肾病发挥疗效。顺着这一提示,我们利用济南泉方公司开发的“指纹共词”分析平台,对文献中提到的与新的信号路径相关的全部文献进行共词分析,从中过滤出与该信号路径相关的全部细胞因子后,选择其中影响因子较高的文献提供给研究团队,研究者结合自己的研究进行专业解析,确定以血管紧张素Ⅱ1型受体拮抗剂为主,以调整肾素-血管紧张素系统相关的两条信号通路的相互平衡为目的有可能成为DM治疗的新理念。基于这样的流程,不仅为研究者筛选出了高水平的研究论文,也为研究者获取研究思路提供了参考。

1.2 以Pubmed为文献信息源进行知识发现服务

继美国芝加哥大学情报学家斯旺森(Swanson)教授研制非相关文献分析工具Arrowsimth并从Pubmed数据库中进行知识关联发现研究以来,一大批集成有共词分析、医学实体关系抽取或聚类分析的生物医学知识发现工具相继被报道并在相关研究中予以应用。如希腊克里特大学医学院和塞浦路斯大学生物信息研究实验室的专家开发的BioTextQuest+文本挖掘工具[5],集文本聚类、共词分析、高通量分析于一体,可以对美国国立医学图书馆的Pubmed与Go(基因)数据库中蕴含的疾病、基因、蛋白之间的关联关系进行分析挖掘;德国米格尔安德拉德的计算生物学和数据挖掘研究中心研发的Alkemio文本挖掘工具[6],可对Pubmed数据库中的大量疾病与药物信息进行关联分析;希腊塞萨洛尼基生物技术研究中心提供的MeSHy主题词关联关系分析挖掘工具[7],可对Pubmed数据中的某一类文献的全部主题词之间的关系进行关联分析。加利福尼亚大学圣地亚哥分校提供的IntegromeDB[8],可对蛋白-基因-疾病-化学物质之间的多重关联关系进行分析并予以图形化展示,等等。利用上述工具对文献进行分析挖掘,可为研究假说的确定提供线索与参考。我们通过对这些免费文献挖掘工具的跟踪,一方面将其及时推荐给校内相关科研团队予以应用,另一方面也结合馆员的专业背景进行文献分析服务。

以中药防治术后腹腔粘连的知识发现研究为例。研究者从最新综述开始,将基于Pubmed、Embase、Cochrane等医学数据库中3912篇经系统评价认可的有效文献进行了详细阅读,归纳了大量与手术后腹腔粘连发病机制相关的多种细胞因子,试图对腹膜损伤后粘连形成过程中多种病理环节的共同触发因素进行推理分析,但鉴于细胞因子众多,发现仅从文献阅读的角度将各种细胞因子之间的先后关系梳理清楚实在困难,于是希望图书馆馆员给与帮助,以便为通过中药进行病因干预提供试验方向。认真分析研究者的需求后,我们结合专业背景,通过对最新文献的阅读,根据项目研究专家的提示,先以“术后腹腔粘连”与“腹膜间皮细胞”为检索词,用IntegromeDB知识发现工具检索,在挖掘工具对文献过滤出的162个基因、蛋白及其氨基酸序列位点中,发现有三个肿瘤坏死因子受体超家族的细胞分化抗原信息是研究者归纳的诸多信息点及我们基于系列文献阅读所从未关注的,结合对与挖掘平台关联的文献摘要的阅读,发现这些细胞分化抗原作为炎症介质与炎症反应链的形成有密切关联,而炎症反应是手术导致腹膜间皮细胞损伤后腹腔微环境的首发反应,顺着这样的关联线索,我们又回到数据库中,用细胞分化抗原与腹膜间皮细胞进行检索、分析,结果发现3篇被web of science收录的文献与研究者寻找腹腔粘连触发因素的问题关系密切,将这些信息提供给研究者,经其团队成员进一步文献分析,不仅很快确定了研究思路,且利用中药复方于炎症反应防治术后腹腔粘连的课题在2013年的国家自然基金申报中获得了资助。

1.3 利用自建数据挖掘平台进行中医方剂配伍规律知识发现服务

以往中药新药的开发基本上是一种经验开发模式,即临床医生利用自己的知识和经验进行组方,并将其用于临床进行验证,获得较好疗效后,再进行药理学、中药化学等方面的研究。近年来,以英文文献为信息源的知识发现工具的大量应用,也给越来越多的中医药研究者从中医药文献中发现具有隐含逻辑关系的知识带来了希望。然而由于中医药学是极具特色的一门传统医学学科,其高度哲学性、修辞性、个体性、主观性的文本特征,使得现有的知识发现工具都不能完全适用,如利用SPSS的Clementine工具进行中药复方中药物之间关联关系的挖掘,会产生大量诸如甘草、大枣、生姜等调和药与其他药物关联应用的规则,从专业角度看,这种规则是没有意义的。因此,中医药领域有必要开发自己的挖掘工具。为此,我们在与南京理工大学的计算机专家进行科研项目合作的基础上,利用关联规则与频繁模式方法,引入相关度、信息熵等指标,开发出针对中医方剂信息分析的数据挖掘平台,从大量中医古籍及现代期刊数据库中的中医方药信息中提取出有价值的模式和知识。该平台在学校多位博硕士研究生针对周仲瑛、朱良春、干祖望等知名老中医的经验分析中得到认可,对学校相关学科承担的国家十五、十一五课题及973项目研究起到了支撑作用,相关论文已发表在中医药类刊物上,不再一一列出。

2开展基于文献的知识发现服务的经验

2.1 依托专业馆员,以项目为中心形成团队化知识服务小组

近年来,随着人员准入资格的提升,各高校图书馆都富集了一批不同专业背景的博硕士馆员队伍。这些馆员在博硕士学习阶段都形成了一定的科研素养,他们是图书馆基于专业文献进行深层次知识服务的主要力量。南京中医药大学图书馆作为中医药类专业图书馆,同时也是全国医药类图书馆中最早开展科技查新工作的专业馆之一,一直比较注重对中医药、化学、药理毒理、医学信息、计算机等专业背景的博硕士的引进与在职培养。馆内当前有在职馆员50名,其中具有博硕士学位的为26名,这些高学历馆员分布在科技查新、古籍与民国文献资源开发、数字技术支持等不同岗位上。在面向学科的知识服务实践中,馆内主要是以项目需求结合专业背景对学科馆员进行分组组合,每组3-5人不等,在负责科研的副馆长带领下,每组指定一名馆员做组长,根据项目需求灵活开展知识服务工作。

2.2 整合不同发现工具,建立面向应用的知识发现框架

俗话说,工欲善其事,必先利其器。开发针对性的数据挖掘工具或知识服务平台并不是图书馆员的强项,但是利用近水楼台先得月的资源优势,及时跟踪各种数据挖掘工具却是学科馆员必备的职业素养。我馆的做法是,从事知识服务的专业馆员既要了解通用型数据挖掘工具如IBM Inteligent Miner、SPSS的Clementine、SAS的Enterpise Miner等产品的特点与实用性,也要从Pubmed、Embase、Science Direct等数据库中通过检测策略的RSS定制保持对生物医学领域各种知识发现工具更新与应用的了解。一旦发现功能相对完备的免费挖掘工具,团队成员要结合专业背景,从问题出发进行应用测试。大家结合各自的应用体验,对应用流程、参数设置、结果解释等进行充分讨论,对综合评价较好的工具,可调试好合适的操作流程及相关参数,以形成较成熟的知识发现实验,当有用户需要进行类似的知识发现时,可方便地导入这些实验,并在这些已有的实验上根据自己的需求作一些参数或修改。实践证明,以这种方式指导科研人员应用或接受科研人员的委托进行问题分析,能实现常见知识发现任务的快速解决。

2.3 采用多种沟通方式,集思广益解决问题

知识发现的主要目的之一是从数据中抽取有意义的知识,以明确科研思路与聚焦研究方向。在很多情况下,数据挖掘方法与工具的选择固然重要,但往往花费时间和精力更多的是问题需求的分析、检索策略或检索范围的确定、文献摘要或主题词中有效信息的过滤、挖掘结果的解析与评估等。生物医学领域的知识发现涉及基因、蛋白、化学物质、疾病等多个信息点之间的关联,很多知识发现工具往往集成不同的参数条件和多种挖掘算法,同一个检索策略,选择文献聚类或关联分析的参数不同,输出结果也大不相同。为了得到一个相对满意的结果,知识发现过程往往不是一轮就能完成,需要对实验方案(即操作流和参数)进行反复尝试和调整,因此熟悉信息检索的馆员、熟悉挖掘算法的馆员、熟悉领域知识的馆员以及项目委托的科研人员之间需要反反复复沟通。我们的做法是,需要当面沟通的直接当面沟通,否则就充分利用已经建立的中医药信息qq群、微信平台,让馆员与科研工作者在项目进展中随时沟通,项目组长负责对不同的参与者进行协调,并对各种方式的沟通结果进行收集、整理、汇总、反馈。通过这种方式,挖掘过程中每一个信息的提供者和采纳者都会留下痕迹,通过集思广益促进问题的解决。

3在知识服务工作中遇到的问题

3.1 专业成果在图情系列职称评审中不被认可

众所周知,在缺乏明确奖惩机制的高校图书馆,职称是大部分具有博硕士学位的馆员追求的终极职业目标。近年来,高校图书馆一直鼓励馆员开展面向学科的深层次知识服务。一个不可否认的事实是,深入到项目团队的知识服务必须依赖馆员专业知识的支撑,而越是含金量高的知识服务,越需要以专深的专业知识垫底。当从事学科服务的馆员既能长期保持对某一专业领域历史与前沿信息的密切关注,又能利用合适的知识发现工具或方法结合专业兴趣对其中的敏感信息进行关联性分析,随着经验的积累,馆员就很容易超越工具与方法而沉浸到专业视角对知识发现的结果游刃有余地予以解析。相应地,在侧重结果解析与应用的专业领域而不是在侧重方法或过程的图情领域申报课题、发表论文就是一件顺理成章的事。然而在职称评审中,图情界对馆员深入到图情专业领域之外的科研成果却不予认可。以我馆为例,2007年以来,我馆主持或参与的与知识发现有关的厅局级及以上中医药类相关项目32项,发表关于中医药知识发现研究的相关论文48篇(其中被SCI收录10篇),对学校十五、十一五科研项目“名老中医临证经验分析挖掘研究”、国家973项目“基于十八反的中药配伍禁忌基础理论研究”及部分国家自然科学基金项目的研究团队形成了有力支撑,与校内中药药理、中药化学、中医外科、中医文献等学科在文献分析与应用方面形成了紧密的合作研究关系。然而遗憾的是,这些发表在中医药类核心期刊上的论文,在馆员申请高级职称评审时,都因为不在图情领域中而不被认可。与从事学科化知识服务的同行的交流发现,这种情况在安徽、辽宁、山东等省份的高校图情系列高级职称评审中同样存在。

3.2 图书馆缺乏长效激励机制保护馆员的积极性

目前国内高校在学科馆员绩效考评方面尚没有完善的标准。由于学科服务不能像科技查新一样有明确的时间或量化要求,因此服务的成效只能靠科研人员认可。对高校图书馆而言,由于没有自主的薪酬分配权,鼓励馆员参与知识服务项目更多的是靠馆员自我能力提升的内在驱动以及培育创新服务文化的柔性机制。以我馆为例,馆内对于参与知识服务的专业馆员没有固定的经费支持与奖励方式,现有的激励或促进措施也与杭州师范大学图书馆大同小异[9]:即建立不定期知识服务案例交流学习制度,高学历馆员之间结合知识服务的新方法、新理念进行集中学习研讨;表现优秀的馆员可优先获得参加专业学术会议、到其他图书馆参观访问和学习的机会;馆员为校内科研团队开展知识服务获得的劳务费或科研经费均由个人支配;馆员发表在学科相关核心期刊上的学术论文由相关学科在年终予以奖励等。在这样的氛围下,馆员的整体知识服务水平以及对相关学科的支撑能力得到了明显的提升,但由于知识服务的沟通环节多、专业知识尤其是外文专业知识的要求高,大部分工作要靠业余时间来完成,加上专业论文与项目在职称评审中受到质疑,因此馆员的积极性一直无法得到长效的保障。

3.3 专业馆员的继续教育培训得不到政策支持

作为知识服务的中坚力量,专业馆员对知识发现理论与技术与时俱进地予以学习与提升,是保障其服务成效的重要途径。馆员根据工作需求和职业素养自觉提升是一个途径,但这种方式与经常参与交流培训的效果肯定不同。当前高校图书馆员进行服务技能拓展学习的形势比以往任何时候都更为强烈,然而遗憾的是,与专业教师相比,图书馆员参与跨界的高层次进修培训的机会少之又少。以我校为例,学校每年都推出相关政策鼓励教师参与国内外研修与培训,甚至境外研修已成为晋升高级职称的一个必备条件,但这些政策均明确表示不适用于教学、科研之外的其他人员。这种典型的身份歧视对图书馆员的职业发展及高水平服务工作的开展无疑是一道藩篱。

参考文献

1刘俊丽,蒋勇青,张秀梅.生物医学非相关文献知识发现研究综述.情报科学,2014,32(1):157-159

2郭卫宁,司莉.国内非相关文献知识发现研究综述.图书情报知识,2013(6):97-99

3高新陵, 王正兴.“十一五”期间我国文献情报领域知识发现研究综述.图书情报工作,2011,55(24):56-60

4张建功.我国医学数据挖掘与知识发现研究的文献计量学分析.慢性病学杂志,2013,14(8):596-599

5Papanikolaou N, Pavlopoulos GA, Pafilis E, Theodosiou T, Schneider R, Satagopam VP, Ouzounis CA, Eliopoulos AG, Promponas VJ, Iliopoulos I. BioTextQuest+: A Knowledge Integration Platform for Literature Mining and Concept Discovery.Bioinformatics. 2014 Aug 6.[Epub ahead of print]

6Gijón-Correas JA, Andrade-Navarro MA, Fontaine JF .Alkemio: Association of Chemicals with Biomedical Topics by Text and Data Mining. Nucleic Acids Res. 2014 ,42(Web Server issue):W422-9

7Theodosiou T1, Vizirianakis IS, Angelis L, Tsaftaris A, Darzentas N.MeSHy: Mining Unanticipated PubMed Information Using Frequencies of Occurrences and Concurrences of MeSH Terms. J Biomed Inform. 2011,44(6):919-26

8Baitaluk M1, Kozhenkov S, Dubinina Y, Ponomarenko J.IntegromeDB: An Integrated System and Biological Search Engine. BMC Genomics. 2012 ,19(13):35

9刘璇.高校图书馆学科服务基地创新实践探索-以杭州师范大学图书馆学科服务为案例分析.大学图书馆学报,2013(1):76-79

作者单位:南京中医药大学图书馆,南京,210023

Experiences and Problems in Literature-based Knowledge Discovery Service in University Libraries—Taking Nanjing University of Chinese Medicine Library as an Example

Li WenlinZeng LiYang Lan

Abstract:Literature resource based knowledge discovery service has been one of the growing trends in university libraries. Using Web of Science, PubMed and Chinese medicine literature database as source, various text data mining tool available on internet, and the self-developed data mining platform, Nanjing university of Chinese medicine library is one of the earliest institutions which provide multi-disciplinary knowledge discovery service in China. The library services and development of disciplines has been proved to be synergistic while there are still obstacle existing in practice, especially in the identification of the service achievement, and different recognition of librarian and teacher. These problems should be paid attention seriously in promoting multi-disciplinary knowledge service in university libraries.

Keywords:University Library; Literature Resource; Knowledge Discovery; Case study; Problem

收稿日期:2014年08月31日

通讯作者:□李文林*李文林,ORCID号:0000-0002-7105-2743,njliwenlin@126.com。曾莉杨斓

猜你喜欢
馆员工具学科
【学科新书导览】
土木工程学科简介
波比的工具
波比的工具
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
“巧用”工具
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
“超学科”来啦
论新形势下统一战线学学科在统战工作实践中的创新
浅谈图书馆青年馆员职业生涯规划