孔 琪,夏霞宇,秦 川
(中国医学科学院医学实验动物研究所,北京协和医学院比较医学中心;卫生部人类疾病比较医学重点实验室;国家中医药管理局人类疾病动物模型三级实验室;北京 100021)
实验动物品系数据库的建立
孔 琪,夏霞宇,秦 川
(中国医学科学院医学实验动物研究所,北京协和医学院比较医学中心;卫生部人类疾病比较医学重点实验室;国家中医药管理局人类疾病动物模型三级实验室;北京 100021)
目的基于国内外部分实验动物数据库和文献,收集整理世界上现有的200多种共计26 000多个品系的实验动物数据,建立关系型检索数据库,使其成为世界上最大最全的实验动物品系数据库。方法 构建基于My SQL数据库软件的中小型数据库,建立检索界面、录入界面和数据库接口。结果 本文建立了实验动物品系数据库,已经收录小鼠品系数据21 596条;大鼠品系数据2062条;猴品系数据13条;地鼠品系数据2条;犬品系数据5条;兔品系数据5条。以后会逐步完善数据,实现实验动物品系数据库的定期更新。讨论 该数据库的建立方便我国科研人员查阅和使用国内外实验动物品系资源,为引进欧美日等发达国家的实验动物品系资源提供链接。
实验动物;品系;数据库;小鼠;资源
实验动物是“活的试剂”,是生命科学、医学和 药学等诸多领域的科技支撑条件。实验动物科学为生命科学和现代生物学的发展提供技术平台,生命科学和现代生物学把实验动物科学带进分子水平时代并将它推到现代科学技术的前沿。推动实验动物资源自主研发和品系数据库建设对有效支撑生物医学科学研究和生物医药产业发展意义重大[1]。
实验动物按照动物物种来分,可以分为小鼠、大鼠、仓鼠、地鼠、沙鼠、豚鼠、土拨鼠、兔、犬、猫、猪、猴、猩猩、牛、羊、马、树鼩、鸡、鸭、鹅、鱼、蟾蜍、雪貂等。世界上用于实验动物研究的动物物种已经达到200多种,26000多个品系。这个数据每年还在不断增长。我国实验动物国家标准中涉及的七种实验动物包括小鼠、大鼠、地鼠、豚鼠、兔、犬、猴,也是最常用的实验动物[2,3]。实验动物品系数据库建设的目标是收集整理国内外所有的实验动物品系数据,建立世界上最全最大的实验动物品系数据库,供国内的实验动物科学、生物学、医学、农业等相关领域科研人员使用。数据来源主要是国内外实验动物数据库、期刊论文和相关机构网站。
1.1 数据来源
1.1.1 问卷调查:设计实验动物品系资源调查问卷,面向国内2000多家实验动物生产使用单位发放调查问卷。
1.1.2 网站检索:使用百度检索中文网站信息;访问各机构网站:实验动物生产机构、使用机构、管理机构、社团组织。
1.1.3 数据库检索:检索美国、欧洲、日本等国实验动物品系相关数据库,获取实验动物品系名称及相关信息,整理后录入数据库。
1.1.4 文献检索:检索中国知网(CNKI)、万方数据库、维普数据库,检索文献发表中提及的实验动物品系及来源。
1.1.5 单位积累:作者单位长期从事实验动物研究工作,最早引进实验动物品系近百种,建立了700多种基因工程品系,具有全国最多的实验动物品系资源。
1.1.6 同行提供:数据库为开放式数据库,对国内外同行提供数据录入窗口,可以在线填报或以邮件的形式提供数据,经过专家审核后录入数据库。
1.2 建立数据库
依托专业公司,构建基于MySQL数据库软件的中小型数据库,建立检索界面、录入界面和数据库接口;并预备与今后建立的数据库接口,逐渐形成数据库集群。
1.3 数据库检索
实现废弃物最大利用的前提便是垃圾分类,在北京、杭州等地,垃圾分类试点已经推行了几年,却未见明显成效,“垃圾围城”问题亟待解决。2016年6月,国家发改委、住建部联合发布了《垃圾强制分类制度方案》,提出到2020年,重点城市生活垃圾得到有效分类,实施生活垃圾强制分类的重点城市,生活垃圾分类收集覆盖率达到90%以上,回收利用率达35%以上。
分为简单检索、专业检索和数据浏览三种方式。
1.3.1 简单检索:关键词检索(keyword search)。
1.3.2 专业检索:品系编号(accession number)、品系名称(strain name)、其他名称(common name)、品系来源(origin)、传代方法(generation)、遗传特征(genetics status)、应用领域(research area)、保存单位(institution)。
1.3.3 数据浏览:以实验动物品系编号为序,按照种属分类,浏览实验动物品系。
1.4 联网运行
接入中国医学科学院医学实验动物研究所网站和中国实验动物学会网站,提供免费的检索服务;
1.5 数据更新
数据库实行外源运行,使用者可以上传数据库未收录的实验动物品种品系,经过审核和查实后,可以作为正式数据发布,可以不断扩展数据规模,实现数据实时更新。
2.1 制定元数据表
根据调查结果制定了元数据表(表1),包括数据格式,内容等。
2.2 确定实验动物品系编码规则
本数据库实验动物品系编号为:31-11-001-0-000001。其中31代表实验材料大类;11代表实验动物小类;001:实验动物品种编号;0,A-Z:实验动物品系名称编号(0为品种号,A为首字母为A的品系);000001:数据条编码(表2)[4-26]。国家自然科技资源平台实验动物资源库对根据实验材料对实验动物品系编码做了描述[27],本数据库的编码方式跟其做了衔接,方便共享。
2.3 数据库建立
2.3.1 数据库名称:实验动物品系数据库。
2.3.2 数据库网址:http://www.cnilas.org/plus/list.php?tid=158。
2.3.3 数据量:现在已经收录小鼠品系数据21 596条;大鼠品系数据2 062条;猴品系数据13条;地鼠品系数据2条;犬品系数据5条;兔品系数据5条(图1)。
表1 实验动物品系数据库元数据表
2.4 数据库检索
按照国际通用的数据库检索模式,分为模糊查询和精确查询两种界面。模糊查询,也叫快速查询,是指使用关键词(key word)查询,数据中有相关内容就会出现在查询结果中,每页20条,点击显示详细数据。精确查询会按照逻辑检索式,设置3~5个查询条件,包括查询号、品系名称、英文名称、研究应用和保种单位,显示界面每页20条数据,点击可显示详细数据。
实验动物资源也成为生命科学研究“大军”的必备“粮草”,然而在我国,这部分科研“粮草”的供应形势却不容乐观。所以,构建一个实验动物品系数据库,调查分析整理以我国实验动物品系资源为主,引进欧美日等发达国家实验动物品系资源数据,供生物医药相关科技人员检索使用,对于推动我国第六次科技革命,以及国务院颁发的生物产业发展规划意义重大。
国内外已经建立了一些的实验动物信息数据库以及信息资源平台,实现了信息资源共享。例如美国Jackson研究所的“小鼠品系数据库”“小鼠基因组”、“基因表达数据库”、“小鼠基因组百科全书”、“小鼠位点及遗传标记目录”、“小鼠突变资源库”等[5]。美国NIH的心肺血液研究所建立了大鼠基因组数据库(RGD)[6]。英国有“啮齿类基因组数据库”、“小鼠细胞遗传图谱”、“畸形人鼠同源性数据库”等[11]。以小鼠品系为主,已经形成了几个主要以信息共享为主的非营利性的实验动物资源联盟,包括国际小鼠种质资源库(IMSR)、国际小鼠资源联盟(FIMRe)、国际基因敲除小鼠资源联盟(IKMC)等。这些数据库收录品系较全,但仅限于小鼠或大鼠品系。
我国实验动物相关数据库建设严重滞后。作者单位曾经在2001-2003年构建过模式动物数据库,收录数据近100条。2008年国家自然科技资源平台中设立了实验动物资源库,收录8个物种188个品系的生物学特性数据。南京大学模式动物研究所等单位联合成立中国遗传工程小鼠资源共享联盟,收录基因工程小鼠品系717条。其他还有个别单位建立的小规模数据库。这些数据库特点是小而散,缺乏数据更新。
世界上而尚无一个数据库,能够包括所有的实验动物品系资源。建立世界范围现有的实验动物品系库,对于国内科研人员充分利用现有实验动物资源有积极意义。实验动物资源的共享与合作是全球性的发展趋势,主要目标在打破国与国之间的贸易壁垒,增进实验动物资源的分享、利用和保存,避免资源的重复生产与浪费。本文数据库的建立,将为用户免费提供实验动物品系资源的“一站式”查询和交流共享,有利于国内外实验动物资源的共享和利用。
本文建立的实验动物品系数据库已经开通并提供查询服务,数据量规模也达到2.4万条,但是距离完善还有很大的差距。许多条目还需要补充完善,内容上还存在一些瑕疵。检索方式、动物图片和配套数据库还有待增加。引用数据与相关数据库建立链接,用户可以通过链接查阅更详细的信息及资源拥有单位的联系方式。数据更新是一个数据库的生命线,本数据库建立后将有作者单位信息中心维护,定期收集整理公开发表的品系数据以更新,同时也接受国内外同行提交的品系数据。希望能在各位实验动物同行和前辈的指导和支持下,该数据库茁壮成长,健康发展,为实验动物信息化建设添砖加瓦。
表2 实验动物品种编号
致谢:小鼠的品系名称主要参考国际小鼠种质 资源库(IMSR),大鼠的品系名称主要参考 Rat Genome Database(RGD),其他品系数据参考国内外发表的文献,在此一并致谢。
图1 实验动物品系数据库查询结果截图
[1]秦川,主编,医学实验动物学 [M].人民卫生出版社.2008:11.
[2]秦川,主编,实验动物学学科发展报告[M].中国科学技术出版社.2009:4.
[3]秦川,主编,实验动物学[M].人民卫生出版社.2010:8.
[4]International Mouse Strain Resources(IMSR)[OL].2014[2014-11-26]http://www.informatics.jax.org/imsr/
[5]The Jackson Laboratory(TJL)[OL].2014[2014-11-26]http://jaxmice.jax.org/query/
[6]Rat Genome Database(RGD)[OL].2014[2014-11-26]http://rgd.mcw.edu/
[7]突变小鼠资源联盟 Mutant Mouse Regional Resource Center(MMRRC)[OL].2014[2014-11-26]http://www.mmrrc.org/catalog/StrainCatalogSearchForm.jsp
[8]人类癌症模式小鼠联盟 Mouse Models of Human Cancer Consortium,Frederick,MD(MMHCC)[OL].2014[2014-11-26]http://mouse.ncifcrf.gov/
[9]加拿大小鼠联盟Canadian Mouse Consortium(CMC)[OL].2014[2014-11-26] http://www.mousecanada.ca/ps/catalogue.htm
[10]加拿大突变小鼠数据库Canadian Mouse Mutant Repository,Toronto,Ontario(CMMR)[OL].2014[2014-11-26]http://www.phenogenomics.ca/databases/mutants _ samples.html
[11]European Mouse Mutant Archive(EMMA)[OL].2014[2014 -11-26]http://www.emmanet.org/mutant_types.php
[12] 日本实验动物中央研究所 RIKEN BioResource Center(RBRC)Laboratory Animals Division[OL].2014[2014-11 -26]http://www2.brc.riken.jp/lab/animal/search.php
[13]日本熊本大学动物资源发展中心Center for Animal Resources and Development(CARD)[OL].2014[2014-11-26]http://cardb.cc.kumamoto-u.ac.jp/transgenic/strains.jsp
[14]Charles River Laboratories,Inc[OL].2014[2014-11-26] http://www.criver.com/
[15]Taconic,Inc[OL].2014[2014-11-26]http://www.taconic.com/wmspage.cfm?parm1=16
[16]Harlan,Inc[OL].2014[2014-11-26]http://www.harlan.com/
[17]Mouse Genome Database[OL].2014[2014-11-26]http://www.informatics.jax.org
[18]ILAR[OL].2014[2014-11-26]http://www2.nas.edu/ilarhome
[19]Kong Q,Qin C.Analysis of current laboratory animal science policies and administration in China[J].ILAR J.2009;51(1):e1-e11.
[20]Kong Q,Qin C.Laboratory animal science in China:current status and potential for the adoption of alternatives[J].Altern Lab Anim.2010,38(1):53-69.
[21]NRC(National Research Council),Institute of Laboratory Animal Resources,Committee on Rat Nomenclature.1992.Definition,nomenclature,and conservation of rat strains[J].ILAR News 34(4):S1-S26
[22]NRC(National Research Council),Institute of Laboratory Animal Resources,Committee on Transgenic Nomenclature.1992.Standardized nomenclature for transgenic animals[J].ILAR News 34(4):45-52.
[23]Davisson MT.Rules and guidelines for nomenclature of mouse genes.International Committee on Standardized Genetic Nomenclature for Mice[J].Gene.1994,147(2):157-160.
[24]Maltais LJ,Blake JA,Eppig JT,et al.Rules and guidelines for mouse gene nomenclature:a condensed version.International Committee on Standardized Genetic Nomenclature for Mice[J].Genomics.1997,45(2):471-476.
[25]Davisson MT.Rules and guidelines for genetic nomenclature in mice:excerpted version.Committee on Standardized Genetic Nomenclature for Mice[J].Transgenic Res.1997,6(5):309 -319.
[26]Montoliu L,Whitelaw CB.Using standard nomenclature to adequately name transgenes,knockout gene alleles and any mutation associated to a genetically modified mouse strain[J].Transgenic Res.2011,20(2):435-440.Epub 2010 Jul 15.
[27]国家自然科技资源平台实验动物资源库[OL].2014[2014 -12-30]http://www.lasdr.cn/UploadFile/local/2008/12/22/30775493626026614161229941196718.pdf.
Establishment of the laboratory animal strain database
KONG Qi,XIA Xia-yu,QIN Chuan
(Institute of Laboratory Animal Science,Chinese Academy of Medical Sciences&Comparative Medical Center,Peking Union Medical College,Key Laboratory of Human Disease Comparative Medicine,Ministry of Health;Key Laboratory of Human Diseases Animal Model,State Administration of Traditional Chinese Medicine,Beijing 100021,China)
Objective To collect more than 200 kinds of species totaling more than 26,000 existing laboratory animals data worldwide to establish a largest and most comprehensive database of laboratory animal strains,based on the existing laboratory animal strain databases and related publications or references.Methods Based on MySQL database software to set up medium sized databases,and build search interface,input interface and database interface.Results In this work,a laboratory animal strain database was established,including data of 21596 mouse strains,2062 rat strains,13 monkey strains,2 hamster strains,5 dog strains,and 5 rabbit strains.We will gradually further improve the data to achieve regularly updated database of animal strains in the future.Discussions The establishment of this database will facilitate scientific researchers in our country to access and use domestic and foreign resources of laboratory animal strains,and provide links to introduce laboratory animal strain resources from European,American and other developed countries.
Laboratory animals;Strains;Database;Laboratory animal resource
R33
A
1671-7856(2015)04-0078-06
10.3969.j.issn.1671.7856.2015.004.016
中央科研院所基本业务费(DWS200502,DWS200709,DWS201208)和传染病科技重大专项资助(编号2009ZX10004-503)。
孔琪(1978-),助理研究员,博士,研究方向为实验动物学。E-mail:infor@cnilas.org。
秦川,研究员,博士生导师,研究方向为实验病理学。E-mail:qinchuan@pumc.edu.cn。
2015-01-21
继续教育