民族药用植物数据库构思初探

2024-05-19 14:37郑周静
科技风 2024年11期

摘 要:目的:将本地区民族药用植物建立一个开放式数据库,运用于科学普及、研究以及专业的教学过程中,同时也对本地区民族药用植物资源进行整合,利于民族医药的保护和现代传承。方法:前期利用文献分析和数据库检索法,弄清现阶段民族药用植物数据库的建设情况,分析其功能条件方面的不足,再通过实体考察和问卷分析等方法将收集的民族药用植物资源进行整理、統计和分析。结果:发现目前民族药用植物数据库存在功能性缺失、文献信息服务方面不足和访问受限,不能满足产学研方面综合知识服务的迫切需求。结论:拟将此民族药用植物数据库建设成除具有基础检索功能以外,还能结合民族特色以及文献信息跨库服务的开放式数据库,为其他民族药用数据库的建设提供参考和借鉴。

关键词:民族药用植物;植物数据库;药用数据库

遵义市域内植被资源丰富多样,少数民族聚居,随着时代的变迁,生活在这片土地上的民族,不断传承和探索,留下了丰富的用药记录。这些药不是来自现代化学合成,是当地的人们充分利用地理资源优势,将许多植物探索性地应用于疾病治疗中,辈辈相传,传承下来的民族药用植物记录、口述和文献,但许多记录和传承都较分散、无序,亟须一个集成、有序和统一的数据库平台收集、整理和推广学习。

1 国内民族植物数据库到民族药用数据库的流变历程

1.1 国内民族植物数据库到民族药用数据库的流变历程

我国于1987年开始系统、全面地研制开发中国经济植物数据库,并在“七五”期间建立完成了“中国珍稀濒危植物数据库”“中国植物分类名称编码数据库”“中国油脂植物数据库”等12个子数据库[1]。21世纪,国内在植物药用方面的数据库建设研究才如雨后春笋般涌出,在我国多民族的人口背景和传承保护传统文化政策的大力支持下,民族药用植物数据库的探索研究呈现出逐年上升趋势。如:罗斌圣等实地调查,设计与构建民族药用植物数据库,同时利用《中国植物志》、Flora of China、《云南植物志》《中国民族药志要》《中国中药资源志要》等较为权威的书籍,以及互联网上Web of Science、“维普数据库”“万方数据库”和“中国植物物种信息数据库”来完善和充实数据库,数据库主要实现药用植物的信息查询、主治和生物属性等功能模块[2]。熊勇等从植物的功能分类,植物名、学名、主治功能和图片等方面对云南彝族药用植物进行了数据库构建[3]。陈颖等则是对四川省民族药用植物资源进行指纹、药用价值、民族传统利用等信息整理,期望建立一个关于民族药用植物的开放式关系数据库的初步框架,实现数据库的任意查询[4]。

1.2 国内相关研究综述

综上所述,国内对植物数据库的建设偏向于对植物的经济价值和应用方面,在保护和传承优秀传统文化的政策背景下,国内学者对民族药用植物数据库的研究开始逐步走向成熟,但在民族药用植物数据库的建设当中还存在功能单一、数据库文献信息服务方面欠缺和访问受限等方面的问题,这是本研究的现实背景和理论依据。

2 功能条件方面存在的问题

2.1 数据库药用方面存在功能性缺失

已有的药用植物数据库平台大都只有一些简单的检索,检索结果以文字呈现较多,仅仅是网站首页图片丰富,但实质的内容仅仅只有科普功能,植物图片模糊,没有高清视频介绍。例如我馆试用的“本草风物志”数据库平台,这个平台收集的药用植物种类繁多,类目也丰富,对中医药的图书也进行推荐,这个数据库平台做了一个梵净山药用植物的分类统计,这是他们的亮点和特色。但美中不足的是这个平台也仅仅只是提供简单的检索功能,没有提供人人参与民族药物科普入口,公众参与度几乎为零。

2.2 数据库文献信息服务方面存在不足

目前做得较为完善的国家知识服务平台中医药分平台,功能模块里面将中药的分类、常见病验方速查、化学对照品波谱以及中药材的炮制通则等都做了详细的设计和分类,有高清图片的显示,同时也有中医药图书的推荐。该平台的化学对照品波谱对于药学这一学科的用户来说,还是具有非常重要的学习科研作用的。但这个数据库平台没有涉及跨库检索,也未涉及与科研相结合的文献、专利等的检索结果呈现。

2.3 访问受限,不能满足产学研方面综合知识服务的迫切需求

市面上大多数专业的药用植物数据库平台外网访问受限,只有购买或者试用授权的集团用户才能使用,这给企业、教学和科研工作者带来巨大的不便,阻碍了民族药用植物相关学科的发展,不利于民族药用植物的保护和传承。

基于上述情况,本数据库平台旨在解决功能缺失、访问受限、提供文献信息服务等的基础上,开展民族药用植物数据库的构思与设计,笔者承担的是基础的药用植物数据库设计这一板块。

3 数据库理论层面的设计需求

3.1 功能层面的模块需求

本系统初步计划设计检索、导入、编辑、审核、导出以及打印等基础功能模块,功能模块如下图所示:

民族药用植物数据库功能模块图

另外本数据库的设计重心是在信息检索模块,因此下设中文、英文、拉丁文、别名、文献、专利、点击和下载量统计和未检索到结果的检索词统计这几个子模块。前几个检索模块是常规检索,其中:(1)专利检索模块会给用户提供各个专利查询网站的路径,进行专利的综合检索,呈现出与民族药用植物相关的专利检索结果。(2)文献检索模块,在用户输入某一检索词时,系统会在几个常用的文献数据库里面进行检索,让用户一站式检索到与之相关联的文献条目,提高科研效率和辅助学习。(3)对用户键入的检索词反馈的结果进行判断,统计检索结果为空的检索词,后台进行统计分析,便于对系统数据的完善和编辑上传。(4)点击下载量的统计,这个数据对于系统起到一定程度的评判作用,利用率的高低直接督促管理人员及时调整服务方向。

3.2 采集方式

(1)结构化的数据采集方式,利用数据库需要的字段信息,设置问卷调查,对地方民族药用植物做一个结构化的调研。

(2)口述以及实体考察等方式,对遵义的药企、民老中医以及民间药用的传承人等进行实体考察和交流,将民族药用植物的相关信息进行分类整理。根据收集到的信息类型不同、采用不同的方式,例如,口述型信息采用录音录像等进行保存整理;古籍文献型可利用图片、扫描等方式进行留存;对雕刻类型的文本可采用拍照、拓印等方式留底整理[5]。

3.3 数据的结构化处理需求

(1)结构化处理的方法:对采集到的信息加工处理,提取出数据库字段需要的主要信息,对录音录像等数据统一存储格式和大小阈值,对文献类信息按照《中华人民共和国药典》的规定字段和关键属性进行规范化提取相关信息,对于缺少的信息部分,字段设置灵活处理,可为空。剔除一些不必要的数据信息,但保留原始数据备查和复核。

(2)具体的规范化处理措施。鉴于民族医药本身的特殊性和采集信息的不规范性,对信息的规范化处理,有利于数据库的完善、逻辑清晰和结构完整,同时也为了符合现代医药的科学性,便于用户在检索查询时清楚便捷、一目了然地理解该药物的相关信息。每张图片统一为不低于10M大小,像素在1920×1080P的高清图片,有利于清楚地看清植物的具体细节,不易和相似植物混淆;每个视频统一在3分钟以内,像素在1920×1080P,大小不低于100M,高清的视频可以让用户更直观、更全面地对某种药用植物提供认识;语音标准主要是针对地区方言和少数民族语言的植物发音,这条语音数据按照Blob字段的内在设定规范,不大于65K。

3.4 平台部分主要数据库模型设计

(1)本系统主要的一张数据表是药用植物基本信息表,基础字段规范参考《中华人民共和国药典》2020年版。

(2)民族药用植物除了药典规范的名称以外,存在许多别名和特殊的名称,需要将中文名和别名进行关联,便于多维度检索,因此需要建一张药用植物名称信息表。①鉴于地区和民族特色,有些本地药用植物不一定有英文名和拉丁文名,因此其中的拉丁文和英文名称字段允许为空;②民族药用植物涉及少数民族语言,而许多的少数民族语言是没有文字记录和传承的,特此在这张数据库表中添加药物方言的语音名称字段,便于对药物的少数民族语言名称进行保存,以及为后续的科研和教学提供示例。

(3)图片、视频这类超文本数据,占用大量数据库存储空间,直接存储于数据库表中会严重降低查询加载时间,用户体验感不佳,因此图片视频只在表中存储访问路径,将图片和视频建立独立的数据库来存储;药用植物相关的文献和专利,由于涉及跨库检索和资源整合,暂不在表中保存检索内容。

(4)每种药物都有其特有的生长习性和独特的地理分布,将药物的地理分布在数据库表中进行存储,使用户对药物有一个全面的了解,设置地图标识字段,便于快速识别分布信息。

(5)用户信息表主要用于权限设置和点击下载量统计,将用户的角色分为管理员、专家和普通用户,系统会根据角色身份授予不同的访问权限。点击下载量用了unsigned int数据类型,这表示该字段的数量为正,没有符号位,该字段主要用于统计用户的点击下载量。

(6)用户的检索不是每次都能检索到需要的内容,该数据库表按照用户角色对未检索到结果的检索词进行统计,便于后台对数据库信息的完善。

3.5 融合终端的展示需求

本数据库平台拟以B/S架构开发,用户可用PC端、移动终端等进行访问,普通用户可上传自己未检索到的药用植物基本信息,人人参与民族药用植物信息的填充和查缺补漏,同时平台支持检索药物的相关文献和专利跨库检索,实现一站式检索服务,对科研和教学提供极大的便利,同时亦为其他民族药用植物数据库的建设提供参考[5]。

4 总结和展望

本数据库平台结合地区特性、当地特色以及自身的专业特点,设计出对遵义药用植物的一个普查和相关文献专利检索的一个平台,对师生科研和学习提供便捷的服务,对遵义药用植物的科学普查和推广起到基础性作用,也对本地区药用植物资源的保护、利用和传承起到积极作用,让更多人了解、保护和利用本地区的药用植物。图书馆创建、整合、储藏和提供数据信息资源,最终目的是让更多师生受益,共同致力于药用植物资源库的发展和建设。系统创新了药用植物的高清图片、视频展示,提供不同方式的检索,相关文献专利的跨库检索,地方语言和少数民族语言语音的药物名称播报,对未检索到结果的检索词进行统计等实用型功能,让本数据库平台的设计优于功能单一的一些植物数据库系统。不足之处在于目前探究的面还比较窄,只针对遵义药用植物,后续我们拟计划将VR技术、中医药诊疗、药用动物和矿物等数据进行设计和模块添加,还要进一步扩大探究的行政区域,让数据库平台更丰富。

参考文献:

[1]祁发尧.甘肃省物种信息管理系统及其高等植物数据库的研制[D].西北农林科技大学,2008.

[2]罗斌圣,郭志永,陈贤毅,等.广西靖西端午节药市民族药用植物数据库系统的设计与构建[J].广西植物,2018,38(05):560567.

[3]熊勇,蒋孟圆,李艳红,等.云南彝族药用植物信息数据库的初步建立[J].云南民族大学学报(自然科学版),2019,28(06):536541.

[4]陈颖,魏大木,李迪強,等.民族药用植物指纹数据库的构建研究[J].生物信息学,2010,8(03):271273+278.

[5]王志耘,彭云,彭平,等.湖南湘西土家医药资源数字化处理与数据库设计[J].湖南中医杂志,2022,38(10):208212.

作者简介:郑周静(1991— ),女,汉族,贵州正安人,本科,馆员,研究方向:图书资料。