罗斌圣 郭志永 陈贤毅 谷荣辉 刘博 龙春林
摘 要:药用植物数据库的建立与相关数据挖掘,对民族药物学的研究具有重要意义。该研究在顶层设计的基础上,对广西靖西端午节药市及周边地区实地调查时获得的药用植物标本和照片进行形态学特征、药用价值、民族传统利用方式等信息的整理,由此设计和建立开放的民族药用植物数据库系统。主要应用Microsoft Office Access和Java编程对数据进行管理、查询和统计,通过提取药用植物特征的不同权值来计算不同科属和类别之间的相似度。结果表明:该数据库系统能以柱状图或饼状图的形式将数据之间的关系直观地展示出来,从而反映出各种植物特征和各种功能属性之间的联系。同时该数据库系统还可以用于数据的管理、检索和查询相关民族药用植物的背景资料、药用价值等信息,并能进行相应的统计分析,有利于挖掘数据和发现新线索。
关键词:数据库,民族药物学,民族植物学,药用植物,传统药用知识
中图分类号:Q949.9
文献标识码:A
文章编号:1000-3142(2018)05-0560-08
Abstract:Database system establishing and data mining of traditional medicinal plants are beneficial for ethnopharmacological researches. On the basis of top-level design,we firstly systemized the relevant information of medicinal plants collected in the medicinal market during the Dragon-Boat Festival in Jingxi County,Guangxi,Southwest China. The information included morphological information,medicinal value,traditional usages and others of medicinal plants. By using Microsoft Office Access and Java Programming,an open database system was designed and built. Except for some simple algorithm of query and statistics,we extracted and calculated different weight values from different features of medicinal plants so that we could investigate the relationship among different types of medicinal plants. The results of analysis can be displayed directly as bar charts and pie charts. This database system can not only be used for efficient search on information of medicinal plants,but also profoundly do some statistical analysis to greatly increase the possibility of knowledge discovery from this database.
Key words:database,ethnopharmacology,ethnobotany,medicinal plants,traditional medicinal knowledge
大量的民族药数据库的建设和发展,尤其通过互联网在线实现共享服务,不仅有利于记录和保护某一民族或地方性药用植物的传统知识,也能促进民族药物学和相关领域的研究,而且能直接服务于民族药的保护规划和有效管理 (马克平,2014; 张柳馨,2003; 陈林伟等,2014 )。不同行业对数据库的需求存在一定的差异,就民族药数据库而言,更追求实用性,主要服务于医药卫生、药用植物等专门领域,趋于解决实际问题 (陈颖等,2010; 孟庆安,2011)。我国现有许多与民族药相关的數据库,包括中国中医药数据库(Traditional Chinese Medical Database System)、民族药信息服务系统(China Ethnomedicine Information Service System)、中国植物物种信息数据库(Scientific Database of China Plant Species)等,都是数据量较大、国内学者所常用的民族药数据库。目前,民族药数据库普遍存在设计不合理、操作复杂、无法挖掘数据等情况,其数据也多摘抄于不同民族现有的医药典籍,并非来源于学者本身的实地调查或考证,数据库本身也无法被研究者用于野外实地调查。因此,本研究试图从民族药物学数据库的设计思路和数据挖掘角度,探讨实用型民族药数据库的建设和应用。
民族药物学(Ethnopharmacology)是一门研究某一族群利用动植物、矿物等天然药物进行医疗保健的相关传统知识的综合性学科,其研究方法涉及到了民族植物学、人类学、植物化学、药理学、药剂学等不同专业(de Smet & Rivier,1989; 淮虎银等,2000)。民族药是久经历史考验的宝贵财富,相关研究还可能为新药的研究与开发提供线索,大大缩短人类开发新药的周期,加之研究民族药对传统知识的传承与保护也具有重要意义,因此民族药在世界范围内受到了极大的关注(Farnsworth,1993; 裴盛基,2000)。
然而在民族药物学研究的过程中,需要采用民族植物学等方法对药用植物相关的传统知识和经验进行记录、整理和编目(淮虎银等,2000)。如果在这一环节利用数据库,不仅可以更高效、安全地对数据进行整理和保存,还能对原始数据进行进一步的分析和挖掘,以增加发现有价值线索的可能性(图1)。因此,对获得的传统药用植物信息和数据进行深入分析和挖掘,十分有利于民族药物学研究。
本研究以建立广西靖西端午节药市药用植物数据库为例,基于在靖西药市和当地实地调查所获得的数据,探索该模式在民族药物学研究中起到的作用,并为其今后的研究走向信息化、高效化提供思路。
1 药用植物数据库的设计与实现
1.1 药用植物數据库来源——广西靖西端午节药市
广西靖西端午节药市指的是在端午节这一天,当地草医、药农和村民将自己采集或栽培的草药在靖西县城专门的集市上交易,形成了一个草药交易和传统壮族医药知识相互交流的平台(杨春燕等,2009; 黄玉绿等,2013)。本研究团队自2006年至2014年曾9次到靖西端午节药市及周边地区进行实地调查,对药市的交易者和当地草医、药农等相关人士进行访谈,完成了对药用植物的采集、识别等工作。同时对植物的药用部位、用途、用量等信息进行了详细记录,运用植物分类学、植物资源学等方法整理和鉴定标本,并对部分数据进行整理分析。此外,我们还对药用植物信息进行查阅、完善和录入,其信息主要来源于《中国植物志》、Flora of China、《云南植物志》《中国民族药志要》《中国中药资源志要》等较为权威的书籍,以及互联网上的Web of Science、“维普数据库”“万方数据库”和“中国植物物种信息数据库”。经调查与鉴定:我们一共获得了564种壮族使用的药用植物信息,这564种药用植物隶属于129科409属,并收录在本数据库中。
1.2 开发平台
该数据库系统的建立使用了Java语言的jdk1.7版本,开发环境为Windows操作系统的NetBeans IDE 7.0;其运行环境为Windows 7 和 MacOS X以上的计算机系统。
1.3 数据库模型建立
本民族药数据库的建立模型简明清晰(图2):数据主要来源于对靖西药市的实地考察,并通过文献资料进行数据补充;再以数据为基础建立合适的数据库,对数据进行管理、查询和分析。所有数据主要按照以下类别进行分类并录入在不同的表中,分别是:植物名(含中文名、当地名、学名、科名、属名),功能主治(壮医理论、西医理论、中医理论),药用部位,药性,生境,分布,形态学特征,化学成分,花期果期等。如图3所示,各类数据类型通过植物的学名作为纽带,相互关联,并且该数据库系统也是通过学名来识别和调取不同表单中的信息进行展示、统计和分析的。
数据库的功能设计主要依照模块化设计原理来实现。模块化设计是按照一定的原则划分成一些较小、相互关联而功能相对独立的模块,每个模块完成一个具体的子功能。这样可以使得整个系统在设计上结构清晰,且便于每一部分实现。为此,我们将本系统分为以下功能模块:(1)系统查询模块:主要为用户通过关键字、词对药用植物进行精确或模糊查询。(2)信息展示模块:主要用于显示每种药用植物的详细信息,其中包括照片、生境、形态学特征、药性和药用功能等。(3)统计分析模块:本模块是利用不同算法,对不同类型的药用植物数据进行单独或交叉分析和统计,还可以以地域为单位进行统计分析,可用于挖掘潜在有价值信息。(4)数据管理模块:主要是对药用植物的数据信息进行修改、添加以及删除。
1.4 数据库系统的实现
1.4.1 数据库系统首页 该数据库系统主要采用白色,显得温和内敛。主界面采用了选项卡的模式,顶部为不同功能模块的选项卡,可根据用户不同功能需求来选择操作(图4)。
1.4.2 查询模块和信息展示模块 该模块的功能主要是帮助用户对目标植物进行检索和详细信息的查阅。在首页点击“查询”选项卡,即会跳转入数据管理模块界面,在搜索栏里输入查询目标关键字、词即可进行查询。图5为精确查询和模糊查询的举例。直接在搜索栏输入药用植物的当地名“九节风”,搜索结果显示所得到的药用植物为金粟兰科的草珊瑚(“九节风”即为在药市上所记录的草珊瑚的当地名),直接通过该植物的拉丁名进行精确搜索,也能得到相同结果。若在搜索栏中输入“豆”,结果则会出现名字中包括“豆”的所有药用植物,用户可进一步进行筛选来选择目标药用植物。
在进行目标植物查询后,可直接在查询界面的信息显示栏直接点击目标植物,便会从查询界面转入植物的详细信息展示界面,显示出植物的照片及信息。图6为穿心草 (Canscora lucidissima)的详细信息展示;点击导出,还可将该药用植物相关信息以html的格式导出,方便复制和粘贴。
1.4.3 统计分析模块和地域统计模块 该模块的功能在于帮助用户进行统计与分析药市中药用植物的相关信息。在首页点击“统计”选项卡,即会跳转入数据统计分析界面。大部分现有的数据库都是单纯地对植物数据进行罗列,而本数据库系统中加入了一些统计和交叉分析功能,以便用户能进一步挖掘数据。而且,选择信息展示栏的“图片”选项,统计数据还可以柱形图的形式直观地表现出来。该数据库系统主要采用了2种统计策略:单表统计分析和多表交叉统计分析。
单表统计策略指的是针对药用植物某一类信息进行统计分析。在统计分析界面中选择左边一栏的任意一种的目的信息即可对该类信息进行统计分析。图7为单表统计的植物分科统计和药用部位统计示例,数据库能将靖西药市中所有药用植物所出现的植物分科与药用部位分布情况进行罗列,并能够通过图片形式呈现统计结果。同样地,用户还能以药性、功能主治、毒性、不同形态学特征等作为筛选的条件。
多表统计策略主要指的是对两类或者两类以上的数据进行交叉统计,通过提取药用植物特征的不同权值来计算不同科属和类别之间的相似度。这样的统计分析方式相较单表统计更为高级、开放和丰富多样。图8为药用植物的药性与药用部位的交叉分析图示,通过选择“药用部位”和药性“寒”这两个属性来筛选目标植物,数据库会将不同药用部位的“寒”性药用植物罗列出来,并进行统计,还能以柱形图的形式将其所占比例展现出来。同样地,用户还能选择其他不同的属性得到目标结果。
此外,该模块还包括了地域分布统计。在首页点击“中国分布”选项卡,数据库系统界面会出现相应的中国地图。点击任意一个省,即可查得数据库中收录且分布在该省的药用植物,并且罗列出这些植物的科属分布与所占比例。
1.4.4 数据管理模块 在首页点击“数据库”选项卡,即会转入数据管理模块界面,界面左边一栏为项目选择栏,分别为“删除”(负责数据的删除)、“插入”(负责新数据的录入)、“变更”(负责数据的修改),右边一栏为操作栏,每选择一项在操作栏中都会出现相应的操作界面,如图9中三幅图分别为数据的添加、修改和删除。
1.4.5 数据库的功能扩展 靖西端午节药市交易的药用植物中有不少种类是珍稀濒危甚至是国家级和省(区)保护物种,但在该数据库中并未涉及,这在今后工作中可以进行补充,让该数据库在珍稀植物資源的保护和管理方面能有所帮助。在数据库的共享方面,当前的界面是针对PC软件设计的,目的在于科研工作者可以方便携带到野外,利于在实地工作中进行操作和使用。然而,我们在设计数据库的时候专门提供和封装了对应操作的接口API,只需要搭建一个简单的WEB页面,就可以直接调用封装好的接口实现对数据库的管理和操作。因此,在线共享是可以并容易实现的扩展功能,未来我们也将针对这点进行改善。此外,我们还计划制作移动终端的APP,希望可以在手机上对数据进行操作,并利用互联网和PC终端进行数据同步,更加方便科研工作者对数据的管理和分析。在当今这个大数据时代,随着科学技术的进步,类似的数据库系统作为重要的科研工具将快速发展,不仅更加方便科研工作者数据的采集和编目工作,也将成为民族药物学发展的主要推动力之一。
2 结论
本研究以建立相关数据库系统的模式来帮助民族药物学研究。以本团队多次赴广西靖西县端午节药市考察所得的药用植物数据为基础,构建了药用植物信息数据库系统,有效地解决了传统民族药物学研究中通过调查所得药用植物信息都是纸质文献、查询不方便等一系列问题,使用户更高效、快捷地查询和记忆。查询和分析统计功能不仅可以让用户按需检索数据,还能进行更深入的数据挖掘,同时为药用植物数据信息的二次开发提供了基础。本研究的设计思路,对其他类型的生物数据库开发也具有借鉴作用。
参考文献:
CHEN LW,QIN KM,XU XS,et al,2014. Research status and prospect of Chinese materia medica fingerprint database [J]. Chin Trad Herb Drugs,45(21):3041-3047. [陈林伟,秦昆明,徐雪松,等,2014. 中药指纹图谱数据库的研究现状及展望 [J]. 中草药,45(21):3041-3047.]
CHEN Y,WEI DM,LI DQ,et al,2010. A study on designing databases for fingerprint of folk medical plants [J]. Chin J Bioinform,8(3):271-273. [陈颖,魏大木,李迪强,等,2010. 民族药用植物指纹数据库的构建研究 [J]. 生物信息学,8(3):271-273.]
DE SMET P AGM,RIVIER L,1989. A general outlook on ethnopharmacology [J]. J Ethnopharmacol,25(2):127-138.
FARNSWORTH NR,1993. Ethnopharmacology and future drug development:the North American experience [J]. J Ethnopharmacol,38(38):145-152
HUAI HY,PEI SJ,XU JC,2000. Common methods in the study of ethnopharmacology [J]. Chin J Ethnomed Ethnopharm,(2):63-66. [淮虎银,裴盛基,许建初,2000. 民族药物研究中的常用方法 [J]. 中国民族民间医药杂志,(2):63-66.]
HUANG YL,GUO ZY,LIU YJ,et al,2013. Indigenous botanical nomenclature used by the Zhuang people in Jingxi County,Guangxi [J]. Plant Divers Resourc,4(35):443-452. [黄玉绿,郭志永,刘宇婧,等,2013. 广西靖西县壮族民间对植物的命名 [J]. 植物分类与资源学报,4(35):443-452.]
MA KP,2014. Rapid development of biodiversity informatics in China [J]. Biodivers Sci,22(3):251-252. [马克平,2014. 生物多样性信息学在中国快速发展 [J]. 生物多样性,22(3):251-252. ]
MENG QA,2011. Design of decoction pieces information database in hospital [J]. Chin Trad Herb Drugs,42(3):610-612. [孟庆安,2011. 医院饮片信息数据库的设计初探 [J]. 中草药,42(3):610-612.]
PEI SJ,2000. Modernization of traditional medicine and inheritance of folk medicine [J]. Chin J Ethnomed Ethnopharm,(1):1-3. [裴盛基,2000. 药现代化与民族医药的传承 [J]. 中国民族民间医药杂志,(1):1-3.]
YANG CY,LONG CL,SHI YN,et al,2009. Ethnobotanical study on medicinal market during Dragon-boat Festival in Jingxi County,southwestern Guangxi region [J]. J Centr Univ Chin (Nat Sci Ed),18(2):16-26. [杨春燕,龙春林,石亚娜,等,2009. 广西靖西县端午药市的民族植物学研究 [J]. 中央民族大学学报(自然科学版),18(2):16-26.]
ZHANG LX,2003. Conceptions for developing medical databases of national minorities [J]. Chin J Med Lib Inform Sci,12(5):14-15. [张柳馨,2003. 建立民族医药专题数据库的构思 [J]. 中华医学图书情报杂志,12(5):14-15.]