随着医药大数据、“互联网+”医疗等热门概念的兴起,药品数据标准化、规范化表达的需求更加迫切和强烈。目前我国药品信息的表达还没有统一标准,药品数据表达方式多样、用词模糊或缺省等问题较为常见,给药品使用和药事管理带来很多不便。以药品流通为例,由于药品数据不规范,医院药品数据的入库、管理、查询及统计分析等工作很大程度上要依靠人工进行,效率和准确率都有待提高。
剂型是为适应诊断、治疗或预防疾病的需要而制备的不同给药形式,是临床使用的最终形式[1]。剂型是药品信息的重要组成部分,与药品贮藏、运输、安全使用、不良反应监测等密切相关。当前剂型标准化、规范化研究受到了国内外学者的重视。收录了美国境内可获得处方药和相当数量非处方药的临床药品标准术语表RxNorm总结归纳了6大类共150余种药品剂型,国内标准的药品剂型当以《中华人民共和国药典》(以下简称“《中国药典》”)为依据。目前药事系统、药品说明书、药品数据库、药品厂家对药品剂型的使用仍存在很多不规范的问题,因此系统深入地研究中文药品剂型信息,探索剂型信息的表述规律,建立不规范剂型信息与规范剂型信息的映射关系及规范库,开发药品剂型数据规范化处理工具,对促进药品信息标准化具有重要意义。
药品剂型的选择与给药途径密切相关,适宜的药品剂型可发挥出良好的药效。药剂学中常用药品剂型有40余种,有4种分类方法[1]。
按物质形态分为液体剂型、气体剂型、固体剂型、半固体剂型,每一种剂型还有细分,如液体剂型分为芳香水剂、溶液剂、注射剂、合剂、洗剂、搽剂等。
按给药途径分为经胃肠道给药剂型和非经胃肠道给药剂型。经胃肠道给药剂型包括散剂、片剂、颗粒剂、胶囊剂等,非经胃肠道给药剂型还细分为注射给药剂型、呼吸道给药剂型、皮肤给药剂型、腔道给药剂型。每一细分剂型还包括多个剂型,如皮肤给药剂型包括洗剂、搽剂、软膏剂、糊剂等。
按分散系统分为溶液型、胶体溶液型、乳剂型、混悬型、气体分散型、微粒分散型、固体分散型,但此分类不能反映用药部位与用药方法对剂型的要求,甚至一种剂型可以分到几个分散体系中。
按制法分为浸出制剂和无菌制剂,此分类因不能包含合部剂型,而不常用。
这4种剂型分类方法各有特点,但都不全面、不完善,各有优缺点,因此可采用综合分类方法。
本文以《中国药典》、中国食品药品监督管理局(CFDA)网站、医药健康网站中的药品数据为例,分析中文药品剂型数据的特点,研究规范中文药品剂型数据的方法。
依据《中华人民共和国药品管理法》组织制定和颁布实施的《中国药典》第十版(2015年版)由一部、二部、三部及其增补本组成[2],其中制剂通则介绍了各个剂型定义、制剂规定等。
《中国药典》的一部是中成药,其中有的剂型是中成药特有的。剂型有丸剂、散剂、颗粒剂、片剂、锭剂、煎膏剂、胶剂、糖浆剂、贴膏剂、合剂、滴丸剂、胶囊剂、酒剂、酊剂、流浸膏剂与浸膏剂、膏药、凝胶剂、软膏剂、露剂、茶剂、注射剂、栓剂、鼻用制剂、眼用制剂、气雾剂与喷雾剂等,剂型下还有细分,如丸剂下分蜜丸、水蜜丸、水丸、糊丸、蜡丸、浓缩丸。
《中国药典》的二、三部分别是化学药物和生物制剂。剂型有片剂、注射剂、酊剂、栓剂、胶囊剂、眼用制剂、丸剂、植入剂,糖浆剂,气雾剂、粉雾剂和喷雾剂,膜剂,颗粒剂、口服溶液剂、口服混悬剂、口服乳剂,散剂,耳用制剂、鼻用制剂、洗剂、冲洗剂、灌肠剂,搽剂、涂剂、涂膜剂,凝胶剂,贴剂、外用制剂等,剂型下还有细分,如片剂有含片、舌下片、口腔贴片、咀嚼片、分散片、可溶片、泡腾片等。
国家食品药品监督管理总局(CFDA)批准的药品剂型种类达 950余种[3]。同一剂型药品又可以细分为多种亚剂型,如片剂可表达为糖衣片、薄膜衣片、普通片、素片;注射剂分为注射液和粉针剂,注射液根据容量大小又可以分为大容量注射液(容量≥50ml)和小容量注射液(容量<50ml);粉针剂又可以分为普通粉针剂、冻干粉针剂、溶媒结晶粉针剂[4]。
当前我国对药品剂型的表达还没有强制的统一规范,导致不同来源药品的剂型表达不一致。以国家食品药品监督管理总局(CFDA)国产药品中剂型“片剂”为例,其表示方式就有100多种。部分实例如图1所示。
图1 片剂部分表示方式
我国药品种类繁多,剂型表达复杂,即使通用名相同、规格相同的不同药品,也可能存在多种剂型表达方式。来源于不同供应商的药品也没有统一的表达规范,这给药品采购和管理、患者安全用药、药品监管都造成了很大困难。通过调研《中国药典》、国家食品药品监督管理总局(CFDA)和“39健康网”等网站的中文药品数据,发现中文药品剂型数据有如下特点。
前文提到剂型可从多个维度表述,以适用不同情景下应用。此外,剂型还具备分级表述特征,如低分子溶液剂细分为溶液剂、芳香水剂、糖浆剂、甘油剂、酊剂、醑剂、涂剂,片剂细分有含片、舌下片、口腔贴片、咀嚼片、分散片等。药品剂型有时会从多维度、多级别表达,导致同一药品同一剂型出现多种表述方式,如眼用滴眼液就有眼用制剂、眼用制剂(滴眼剂)、眼用制剂(滴眼液)、滴眼液、滴眼液(眼用)等5种表述。
因剂型可从多维度、多级别表述,很多数据库或供药商在制定药品剂型表述时较随意。维度上,有只从用药途径表述的、有只从物质形态表述的、有只从分散系统表述的、有只从制法表述的,还有几者结合表述的;级别上,有上级剂型的表述,有亚剂型的表述,还有上级和亚级剂型一起表述的,如鼻用制剂(滴鼻剂)、鼻用制剂(滴鼻液)等。前文所述的眼用滴眼液就是一个典型的例子。
中药剂型创用甚早,远在夏禹时代就已有酿酒法。中药传统剂型是指丸散膏丹、酒露汤炊、胶曲茶锭等剂型,新剂型是指针剂片剂、酊水油膏等剂型[5]。传统剂型中的丹、酒、茶、锭、汤等剂型是中药特有剂型。
制剂命名就是药品命名,应科学、明确、简短。通常药品名称列前,剂型名列后,说明用途或特点的形容词列于药名之前,如吸入用异丙托溴铵溶液,复方制剂根据处方组成情况采用不同方法。但实际药品剂型信息不是很规范,修饰或限定词的使用及顺序没有统一规定。
由于没有明确规定多个剂型之间采用何种符号分割,导致同一药品的同一剂型有多种表达方式,如“颗粒剂,茶剂”“颗粒剂、茶剂”“颗粒剂;茶剂”。
药品剂型信息标准化表达,即将表示形式不同但实质为同一剂型的信息进行规范化和归一化。本文借鉴《中国药典》和美国国立医学图书馆编制的临床药品标准命名术语表RxNorm[6-7]制定剂型形态及分级规范表,并引入组配原理,将药品剂型信息进行规范化处理。
剂型信息的规范化是一项复杂而繁琐的工作,其流程如图2所示。在数据拆分环节涉及拆分特征词;在数据匹配环节要参照《中国药典》剂型和RxNorm标准剂型,并依据剂型形态将之匹配到相应的类别中;数据映射是依据剂型规范化规则将不规范的剂型表达映射到最终的规范化剂型中。质量检测规则用于检测和修正数据处理中的错误,因篇幅所限,不详述各步骤细节。
图2 剂型规范化流程
本文剂型规范化方法包括剂型形态、剂型分类和剂型组配词3部分(图3)。剂型形态指按照剂型物质形态进行分类,共有7类,分别为吸入剂、喷雾剂、液体制剂、悬浮剂(混悬剂)、固体制剂、气体制剂、原料药、其他;每一种剂型又细分为一级类别和二级类别,如固体制剂一级分类有颗粒剂、棒剂、胶囊剂、片剂、凝胶剂、埋植剂、丸剂等;一级分类再细分二级分类,如片剂二级分类有泡腾片、口服片、含片、咀嚼片、分散片、控释片等。组配词是用于补充描述药品剂型的信息,主要与二级分类组合出现。处理后生成的剂型形态及一级分类如表1所示。
通过本文方法对从CFDA中下载的900余个剂型进行初步预处理(如合并、数据清洗),去除非剂型信息(如药品耗材等)后,对剩余的400余个剂型信息进行规范化处理,生成标准剂型映射表(表2、表3)。
图3 剂型规范化方法的结构
表2 标准剂型映射(多对一映射)
表3 标准剂型映射(一对一映射)
剂型组配词用来说明药品详细信息,如用途、特点、给药方式等。需要注意的是有些剂型组配词本身就是剂型。组配词主要有:薄膜衣片、包衣、糖衣片、素片、肠溶、包片、肠溶衣、含片、薄膜衣、肠溶片、贴片、阴道、薄膜包衣、分散片、分散、缓释片、缓释、咀嚼片、咀嚼、可溶、控释、口服、口含、口含片、口腔崩解、明胶包衣、泡腾、舌下片、双层片、薄膜、糖衣、肠溶薄膜衣、肠溶糖衣、素、速释、冻干、冻干粉、冻干粉针、冻干粉针剂、冻干针、粉针、粉针剂、肌肉注射、静脉注射、浓溶液、水针剂、无菌分装、无菌分装粉针剂、无菌粉末、小容量注射剂、大容量注射剂、含糖、无糖、供注射用、口服用、轻粉、液体、重粉、注射用、软胶囊、软胶囊剂、滴眼剂、滴眼液、眼膏剂、植入、复合、内服、外用、胶丸、含甘油、含山梨醇、吸入、混悬型、溶液型、滴鼻剂、滴鼻液、滴剂胶囊型、滴耳剂、滴耳液、气雾剂混悬型、气雾剂、液型、气态、气态分装、橡胶膏剂、液态、原料药、注射剂、糖丸等。
以CFDA国产药品中剂型“片剂”为例(图1),100多种不同形式经规范化处理后都唯一映射到“片剂”,其组配词有“糖衣”“薄膜衣”“素片”等。规范后的剂型信息变得更加严谨有序,有利于对药品剂型的管理和检索,减少因人工操作造成的失误和时间浪费。
药品基础信息是药房业务管理系统、合理用药监测系统、药品不良反应监测系统等药事相关系统的基础,药品剂型信息是药品基础信息的一部分。除剂型外,药品基础信息还包括药名、规格、单位、剂型、厂家描述性信息、药品用法、用量、适应证及不良反应等治疗属性信息[8-9]。
由于药品信息系统中所使用的药品数据不尽相同,不同系统之间的交互和协同极为困难,通常一个机构或组织(如医院或监管部门)可能同时运行和维护多个内部数据结构极为不同的系统,难以有效沟通协作。因此,探索一种适用于我国药品信息资源知识化表示的方法,有效揭示药品相关信息尤为必要。文献[10]初步探索了一种基于药品概念、概念间语义关系和概念属性的中国药品数据的知识表示方法,剂型规范化是其中重要的组成部分,可使药品知识组织体系中剂型信息的表达更清晰、规范。
规范药品数据的表达不但可以促进安全用药、加强药品监管、推进卫生信息化进程,还有利于充分挖掘利用药学信息,助力药物研发,提升药学信息服务水平。笔者希望有更多的专家学者关注和致力于我国药品信息的规范化和知识化表达相关工作。