乔丽芳,李香串,任 飒
(1.山西省医药与生命科学研究院,山西 太原 030006;2.西北大学 数学系,陕西 西安 710127)
党参 [Codonopsispilosula(Franch.) Nannf.]为桔梗科植物党参的根,该属植物全世界约有40种,我国约有39种,药用21种。其作为常用的治疗及保健药材,具有补中益气,健脾益肺之功效。它主要用于脾胃虚弱、肺虚喘咳、气短自汗、食少便溏、虚喘咳嗽、内热消渴的治疗[1]。现代研究表明,党参具有调节血糖、促进造血机能、降压、抗缺氧、耐疲劳、增强机体免疫力、延缓衰老、调节胃收缩及抗溃疡等方面的药理作用[2-3],在食品及保健食品中的应用越来越广泛,其中党参含多糖、葡萄糖、果糖、菊糖、蔗糖、磷酸盐和17种氨基酸,其中包括赖氨酸等7种人体必需氨基酸,此外还含皂苷、挥发油、脂肪和钾、钠、镁、锌、铜和铁等14种元素以及维生素B1、B2等,具有与人参类似的滋补功效,为此广泛应用于保健饮料和调理食品[4]。为进一步明确党参在保健食品配方中的应用状况,本文运用“R语言”构建含党参的保健食品配方数据库,在此基础上,使用软件的关联规则等数据挖掘方法,分析含有党参配方中常用的配方原料的应用规律,为更好的挖掘党参在保健食品中的应用规律,指导新配方的开发,扩大党参的应用奠定良好的基础。
本文从保健品数据库中对含有党参的保健品配方进行收集整理,以组成中明确含有“党参”的配方,共得到177个配方。
将上述筛选的配方由专人整理后,导入R语言的arules包。导入数据前,由2人负责数据源的审核,以确保数据源的准确。
通过R语言的arules包,以177种药的配方为挖掘对象,通过apriori算法进行关联规则挖掘。在挖掘过程中,逐步调整support与confidence阈值,并通过lift值加以验证,最终得到药物频次统计和组方规律分析。
177个含党参的保健品配方中,涉及药物324种,通过频次分析,得到含党参配方中使用频次较高的(频次≥5),见表1。
表1 含党参配方的常用原料
177个含党参的保健品配方中,涉及保健功能30多种。其中,应用最多的是增强免疫力,其次是改善营养性分血,再次是抗疲劳。
2.3.1 配方中含党参配方的常用原料频次分析
2 980个具有增强免疫力的配方中涉及原料党参的配方有89个,通过“频次统计”,得到具有增强免疫力保健品配方中含党参配方的使用频次较高(频次≥5)的34味原料,见表2。
表2 含党参配方的增强免疫力保健食品常用原料
2.3.2 基于关联规则分析的配方组方分析
应用关联规则挖掘方法对89个含党参的配方进行分析,将支持度设置为“8”(表示至少有8个配方中出现),得到常用组合54个,见表3。原料之间关联的“网络化展示”,见图1(支持度分别为4、8、12)。
表3 含党参配方的常用原料组合(支持度个数为8)
支持度为4,占含党参配方的 5%
支持度为8,占含党参配方的 9%
支持度为12,占含党参配方的 14%
2.4.1 配方中含党参配方的常用原料频次分析
206个具有改善营养性贫血的配方中涉及原料党参的配方有40个,通过“频次统计”,得到具有改善营养性贫血保健品配方中含山楂配方的使用频次较高(频次≥2)的41味原料,见表4。
表4 含党参配方的改善营养性贫血保健食品常用原料
2.4.2 基于关联规则分析的配方组方分析
应用关联规则挖掘方法对40个含山楂的配方进行分析,将支持度设置为“9”(表示至少有4个配方中出现),得到常用组合58个,见表5。原料之间关联的“网络化展示”,见图2(支持度分别为5、9、13)。
表5 含党参配方的常用原料组合(支持度个数为9)
支持度为5,占含党参配方的 13%
支持度为9,占含党参配方的 23%
支持度为13,占含党参配方的 33%
2.5.1 配方中含党参配方的常用原料频次分析
1 125个具有抗疲劳的配方中涉及原料党参的配方有29个,通过“频次统计”,得到具有抗疲劳保健品配方中含党参配方的使用频次较高(频次≥2)的47味原料,见表6。
表6 含党参配方的抗疲劳保健品常用原料
2.5.2 基于关联规则分析的配方组方分析
应用关联规则挖掘方法对29个含党参的配方进行分析,将支持度设置为“4”(表示至少有8个配方中出现),得到常用组合50个,见表7。原料之间关联的“网络化展示”,见图3(支持度分别为4、8)。
表7 含党参配方的常用原料组合(支持度个数为4)
支持度为4,占含党参配方的 14%
支持度为8,占含党参配方的 28%
本研究应用R语言软件,构建含党参的保健食品配方数据库,在此基础上,使用软件的关联规则等数据挖掘方法,分析含党参的保健食品配方原料的应用,对党参的进一步开发利用具有很好的指导意义和参考价值,同时也表明该软件辅助保健品配方分析及筛选领域中,具有广阔的应用前景和实用价值[5]。