林 薇,赵 荷,郝怡雯,朱宗萍,饶雅舒,赵海亮,韩国鑫,赵 萱*,廖 婉*
基于Copula函数研究柴胡-白芍药对在治疗“肝郁血虚”方剂中的剂量相关性
林 薇1,赵 荷2,郝怡雯2,朱宗萍2,饶雅舒2,赵海亮3,韩国鑫3,赵 萱2*,廖 婉2*
1. 成都中医药大学管理学院,四川 成都 611137 2. 成都中医药大学 西南特色中药资源国家重点实验室,四川 成都 611137 3. 成都中医药大学基础医学院,四川 成都 611137
构建Copula函数,研究柴胡-白芍药对在治疗“肝郁血虚”方剂中的剂量相关性。从自建方剂数据库中收集治疗“肝郁血虚”证并含柴胡-白芍药对的传统中医方剂,对其中柴胡剂量和白芍剂量进行数据处理和检验,从阿基米德Copula函数族、椭圆Copula函数族中选择出最佳的Copula函数建立数学模型,描绘联合分布函数图,测算Kendal秩相关系数和Spearman秩相关系数,监测柴胡剂量和白芍剂量数据间的相关性。筛选出109首方剂。Gaussian Copula函数模型能较好地反映柴胡和白芍剂量之间的相关性,柴胡和白芍的剂量的Kendal秩相关系数为0.330 1,Spearman秩相关系数为0.471 8,说明柴胡和白芍剂量之间具有较强的非线性关系,且呈正相关,即随着其中一味药剂量增大,另一味药也倾向于增大剂量。从数据挖掘和数理统计角度,创新引入Copula函数模型,研究药对剂量的相关性,为传统经典药对相使为用提供证据,以及为传统医学临床用药提供新的研究思路。
柴胡-白芍药对;肝郁血虚;Copula函数;剂量相关性;数据挖掘
柴胡与白芍是常用中药药对,最早记载于《太平惠民和剂局方》,临床应用已有上千年历史,“逍遥散”“四逆散”“柴胡舒肝散”等经典方均应用此药对[1]。柴胡与白芍配伍有疏表达邪、疏肝养肝、疏调气血、升阳散火之功。现代研究表明,柴胡-白芍药对协同使用在抗惊厥、抗炎、抗肝损伤等方面具有显著疗效[2]。中医素有“不传之秘在于量”的说法,在中药组方配伍研究中,剂量对于疗效至关重要,不同剂量的药物配伍可能产生差异性较大的结果。柴胡-白芍药对在历代医家的组方用药中运用较多,而不同方剂中剂量并未有明确规定,而目前针对柴胡-白芍药对的研究大多对比单味药和组方配伍后化学成分、吸收代谢或药理药效的变化,缺乏对组方配伍剂量的现代研究,难以说明柴胡-白芍药对的剂量存在相关性。
本研究从数据挖掘和数理统计角度开展对柴胡-白芍经典药对剂量的研究,从自建方剂库中收集含柴胡与白芍药对的传统中医方剂,建立Copula函数模型,将对证为“肝郁血虚”的方剂中人参剂量和附子剂量进行数学描述,研究所选方剂中柴胡及白芍所用剂量的相关性,从数理统计角度研究柴胡-白芍药对剂量的相互关系,为研究中药药对剂量关系提供新思路。
收集从秦汉、唐宋、明清至近代的主要方书,包括经典方书、部分名医所著方书、地方用药规范、部分地方中药成方选集等建立方剂库。从方剂库筛选方剂,为保证柴胡和白芍的剂量指标的代表性、可获得性和准确性,筛选条件:(1)方剂中包含柴胡和白芍2味药物,主治为“肝郁血虚”证;(2)方剂中药物的剂量描述准确;(3)选取宋代至清代医书中的方剂。从符合筛选条件的109首方剂中提取柴胡-白芍药对剂量数据,由于药方单位不统一,不同年代的计量单位与现代计量单位的换算关系不同,按照现代计量换算原则对药对剂量进行换算[3],见表1,方剂示例见表2。
表1 方剂剂量单位换算原则
表2 部分含柴胡、白芍方剂及剂量
将筛选出的方剂中柴胡剂量和白芍剂量进行数据处理和检验,通过Kolmogorov-Smirnov检验[4]或Shapiro-Wilk检验[5]对数据进行正态检验;用Ksdensity函数对数据进行拟合边缘分布。
1.3.1 Copula函数的选择
(1)阿基米德Copula函数族:阿基米德Copula函数其分布函数为:
其中,(u) 为阿基米德Copula函数的生成元,且∈[0, 1][6]。
二元Gumbel Copula函数的表达式为:
其中,为参数,对上尾变化较敏感,当逐渐增大,若上尾变化特征越明显,则变量间的相关性越强。
二元Clayton Copula函数的表达式为:
其中,为参数,对下尾变化较敏感,当逐渐增大,若下尾变化特征越明显,则变量间的相关性越强。
二元Frank Copula函数的表达式为:
其中,为参数,其尾部特征具有对称性,故而其不能捕捉变量间非对称的尾部相关关系。
(2)椭圆Copula函数族:二元Gaussian Copula函数的表达式为[7]:
二元-Copula函数的表达式为:
其中∈[−1, 1],为−1(),−1() 的线性相关系数。
(3)Copula函数的相关性测度:相关系数能刻画两变量之间的相依程度,为精准建模提供核心依据,在测度Copula函数时,常用到的是Kendal秩相关系数和Spearman秩相关系数。当数据相关系数(包括Spearman秩相关系数和Kendall秩相关系数)范围在 [−1,0)时,变量之间呈负相关;当相关系数为0时,说明变量间不相关。当相关系数范围在 [1,0)时,变量间呈正相关,越接近1,表明变量间相关越密切[8]。
Kendal秩相关系数τ的表达式为:
Spearman秩相关系数r的表达式为:
其中(,) 为、的Copula函数。
1.3.2 统计学方法 利用Epidata3.1软件进行数据录入,使用Matlab进行数据分析和模型拟合,通过正态性检验,经验分布函数和核估计,比较不同类型Copula函数的欧氏距离等方法来建立柴胡-白芍剂量相关性规律的模型。
将柴胡剂量和白芍剂量进行统计描述,结果如表3所示,其数据分布见图1。
结果表明,方剂组中,柴胡剂量多集中在(0.37,184.5)区间,中位数为3.69 g,白芍剂量多集中在(1.11,110.07)区间,中位数为11.07 g。
N表示样本量,Min表示极小值,Max表示极大值,M (IQR) 表示中位数(四分位数间距),95% CI表示95%置信区间
N represents the sample size, Min represents the minimum, Max represents the maximum, M (IQR) represents the median (quartile interval), and 95% CI represents the 95% confidence interval
根据Kolmogorov-Smirnov检验结果,柴胡和白芍的Kolmogorov-Smirnov检验或Shapiro-Wilk检验的值均小于显著性水平0.05,数据不符合正态分布,见表4。
应用Ksdensity函数分别计算柴胡和白芍的边缘分布,为避免经验分布函数因连续性及光滑度不好而引起的误差[9],采用核分布函数来拟合经验分布函数。利用搜集的数据分别绘制柴胡剂量()的核分布函数和经验分布函数()(图2)及白芍剂量()的核分布函数和经验分布函数()(图3),由图可知,柴胡剂量和白芍剂量的核分布函数和经验分布函数拟合较好。在确定柴胡和白芍的边缘分布后,得到柴胡剂量()和白芍剂量()的二元分布频数直方图(图4);从频率分布直方图(图5)可见其数据具有对称的尾部特征,可采用Copula函数对柴胡和白芍之间的非线性关系进行全面分析。
图1 柴胡-白芍药对的剂量数据分布
将筛选出的主治为“肝郁血虚”的109首方剂中,柴胡剂量和白芍剂量代入Copula函数,测算相应的平方欧式距离和参数估计。结果见表5。
表4 正态性检验
图2 柴胡剂量的经验分布函数和核分布估计图
图3 白芍剂量的经验分布函数和核分布估计图
图4 柴胡和白芍的频数分布直方图
图5 柴胡和白芍的频率分布直方图
表5 Copula函数的平方欧氏距离及参数估计值
根据平方欧式距离算法,将多种Copula函数与经验分布函数求解平方欧氏距离,其对应的经验Copula函数之间所得距离最短的Copula函数即为最优。由于Gaussian Copula函数的平方欧式距离为0.013 1,参数估计为0.411 8,均为最小值,即选择Gaussian Copula为最优函数。
采用Gaussian Copula能较好的拟合柴胡剂量和白芍剂量之间的关系,其表达式为:
依据Gaussianl Copula函数绘制柴胡剂量和白芍剂量的联合分布函数Copula(,)(图6)及联合概率密度函数(,)(图7),其中柴胡剂量的边缘分布函数为(),白芍剂量的边缘分布函数为()、柴胡剂量的边缘密度分布函数为(),白芍剂量的边缘密度分布函数为()。
根据Gaussian Copula函数建立的模型,数据呈现出明显对称的形态特征,说明该函数可以良好地捕捉柴胡剂量和白芍剂量之间的相关性特征,能较好地反映柴胡和白芍之间的相关性。测算其Kendall秩相关系数为0.330 1,Spearman秩相关系数为0.471 8,说明柴胡剂量和白芍剂量之间具有较强的非线性相关关系,且之间呈正相关。将椭圆族Copula函数的Kendall秩相关系数和Spearman秩相关系数进行对比发现,Gaussian Copula函数能更好地反映柴胡剂量和白芍剂量二者之间的秩相关性,Gaussian Copula函数刻画的柴胡剂量和白芍剂量,由于上、下尾部均为正相关,且呈现了对称分布的态势,因此,柴胡剂量和白芍剂量在一定程度上表现出同增同减的状态,即柴胡-白芍药对在方剂中使用时,其中一味药的使用剂量增大(或减少)时,另一味药的使用剂量也倾向于增大(减少),且当柴胡和白芍各自的剂量变化较大时,两者之间的协同关系会增强。
图6 柴胡和白芍的联合分布函数图
图7 柴胡和白芍的联合概率密度函数图
根据“2.1”数据描述性结果表明,方剂组中,柴胡剂量多集中在(0.37,184.5)区间,中位数为3.69 g,白芍剂量多集中在(1.11,110.07)区间,中位数为11.07 g,两者剂量以1∶1的比例居多,显示柴胡和白芍剂量有一定相关性,但仅从数据描述和比例频次研究上难以得出可信结论,本研究建立Copula函数分析柴胡剂量和白芍剂量相关性,从剂量角度验证中药药对的相并而用。
通过对两组数据进行正态检验和数据拟合边缘分布结果,柴胡-白芍药对剂量数据均不符合正态分布,呈非线性、非对称的趋势。Copula函数最早是由Sklar[10]提出,是一类将联合分布函数与它们各自的边缘分布函数连接在一起的函数,也称为连接函数,Copula函数可以捕捉变量间非线性、非对称以及尾部相关关系[11]。Copula函数可以捕捉变量间非线性、非对称以及尾部相关关系[12]。Copula函数已经用于西医临床联合用药的剂量关系研究,如Yin等[13]提出了一种基于Copula模型的贝叶斯自适应剂量发现设计,用以研究2种或2种以上药物联合使用时剂量的协同效应。Gasparini[14]在Copula函数的基础上提出了一类新的风险函数,用以评价联合治疗时临床相关性。Roberts等[15]使用双变量Copula函数分析了贫血和疟疾之间的关系,发现贫血和疟疾之间存在正相关关系,其强度因地区而异。目前,在中药药对配伍剂量的相关研究中尚未运用,本研究创新性运用Copula函数研究柴胡-白芍药对剂量数据的相关性。通过Copula函数模型分析结果表明,柴胡剂量和白芍剂量呈正相关,这2味药在用量上是协同关系,即随着其中一味药使用剂量增大时,另一味药也倾向于剂量增大,从而验证了柴胡-白芍药对在方剂配伍使用上的相使规律,为从数理统计的角度研究药物配伍使用规律提供了参考。
中药药对的研究是药物配伍的最小单元,是单味药与复方配伍之间的沟通桥梁,并且中药剂量是药物配伍中非常重要的因素之一[16],将定性和定量相结合探索药对之间的关系,对药物配伍研究具有非常重要的意义,不仅能确定药物之间的配伍关系,也能在药物间的使用上产生更好的疗效。
中医药在数千年的发展过程中积累了大量的成果,蕴含着极其丰富的医学理论和疗效确切的临证方剂[17],分析和整理历代医家的用药剂量来研究药对的剂量规律,可为现代中医临床提供更加详实的药物剂量参考和依据,还奠定了“量变”(剂量变化)到“质变”(效应变化)的研究基础。而数据挖掘技术和数理统计的引入为处理海量的药对信息资源提供了有效的技术方法[18]。课题组曾创新性构建Copula函数模型,研究川芎-当归药对在治疗月经不调、卒中、疮疡时剂量的相关性[19],本研究用Copula函数模型研究柴胡-白芍药对在治疗肝郁血虚证的剂量相关性,证明Copula函数模型可成为古方数据挖掘的重要方法,科学阐释传统经典药对的配伍规律,以及为指导传统医学临床用药提供新的研究模式。
利益冲突 所有作者均声明不存在利益冲突
[1] 李冀, 李想, 高彦宇, 等. 柴胡-白芍配伍临床应用及现代药理学研究进展 [J]. 辽宁中医药大学学报, 2019, 21(7): 8-12.
[2] 常泽, 韩振蕴, 曹云松, 等. 基于网络药理学的柴胡-白芍药对抗抑郁作用机制研究 [J]. 中医杂志, 2020, 61(8): 700-705.
[3] 王安妮, 于晓, 张瑜, 等. 基于方剂数据分析的中药用量历史变迁规律研究 [J]. 世界科学技术—中医药现代化, 2019, 21(3): 342-347.
[4] Pencina M J, Steyerberg E W, D'Agostino R B. Net reclassification index at event rate: Properties and relationships [J]., 2017, 36(28): 4455-4467.
[5] Franklin J M, Rassen J A, Ackermann D,. Metrics for covariate balance in cohort studies of causal effects [J]., 2014, 33(10): 1685-1699.
[6] Neumeyer N, Omelka M, Hudecová Š. A copula approach for dependence modeling in multivariate nonparametric time series [J]., 2019, 171: 139-162.
[7] Karra K, Mili L.for detecting dependence and monotonicity between stochastic signals [J]., 2019, 485: 18-41.
[8] Begg C B, Mazumdar M. Operating characteristics of a rank correlation test for publication bias [J]., 1994, 50(4): 1088-1101.
[9] Zhang M, Chen D H, He X,. A hydrodynamic model for measuring fluid density and viscosity by using quartz tuning Forks [J]., 2019, 20(1): 198.
[10] Sklar B. A primer onconcepts [J]., 1997, 35(12): 94-102.
[11] Thall P F, Nguyen H Q. Adaptive randomization to improve utility-based dose-finding with bivariate ordinal outcomes [J]., 2012, 22(4): 785-801.
[12] Luo W, Wo M. Binary outcome copula regression model with sampling gradient fitting [J]., 2021, 544: 56-77.
[13] Yin G S, Yuan Y. Bayesian dose finding in oncology for drug combinations by Copula regression [J]., 2009, 58(2): 211-224.
[14] Gasparini M. General classes of multiple binary regression models in dose finding problems for combination therapies [J]., 2013, 62(1): 115-133.
[15] Roberts D J, Zewotir T. Copula geoadditive modelling of anaemia and malaria in young children in Kenya, Malawi, Tanzania and Uganda [J]., 2020, 39(1): 1-14.
[16] 段金廒, 宿树兰, 唐于平, 等. 中药药对配伍组合的现代认识 [J]. 南京中医药大学学报, 2009, 25(5): 330-333.
[17] 曹俊岭, 李祖伦, 付强, 等. 中药及复方整合作用的研究 [J]. 中草药, 2007, 38(1): 158-160.
[18] 李慧敏, 贺凯, 郑慧, 等. 中医药健脾的保健作用机制及药食资源 [J]. 中草药, 2020, 51(3): 780-787.
[19] Zhao X, Lin W, Li J W,. Dose correlation of Danggui and Chuanxiong drug pairs in the Chinese medicine prescription based on thefunction [J]., 2020, 2020: 1-10.
Study on dose correlation ofandpair in treatment of “liver stagnation and blood efficiency” by using Copula function
LIN Wei1, ZHAO He2, HAO Yi-wen2, ZHU Zong-ping2, RAO Ya-shu2, ZHAO Hai-liang3, HAN Guo-xin3, ZHAO Xuan2, LIAO Wan2
1. School of Management, Chengdu University of Traditional Chinese Medicine, Chengdu 611137, China 2. State Key Laboratory of Southwestern Chinese Medicine Resources, Chengdu University of Traditional Chinese Medicine, Chengdu 611137, China 3. School of Basic Medicine, Chengdu University of Traditional Chinese Medicine, Chengdu 611137, China
To study the dose correlation ofandpair in the treatment of “liver stagnation and blood deficiency” by constructing Copula function.The traditional Chinese medicine prescriptions containingandpair for the treatment of "liver stagnation and blood deficiency" syndrome were collected from the self-established prescription database. The data of the dosage ofandwere processed and tested. The best Copula function was selected from Archimedes function family and elliptic Copula function family to establish the data model, depict the joint distribution function diagram, and calculate the Kendal rank correlation coefficient and Spearman coefficient. A rank correlation coefficient was used to monitor the correlation between the dose data ofand.A total of 109 cases of traditional Chinese medicine prescriptions containingandwere collected from the self-established prescription database. Gaussian Copula function model could better reflect the correlation betweenand. The Kendall rank correlation coefficient and Spearman correlation coefficient ofandwere 0.3301 and 0.4718 respectively, which indicated that there is a strong nonlinear correlation betweenand, and the correlation was positive, with the increase of the dose of one medicine, the other medicine also tended to increase the dose.From the perspective of data mining and mathematical statistics, this paper innovatively introduces Copula function model to study the correlation between drug pair and dose, and provides a new research model for the scientific interpretation of traditional classic drug pair compatibility and guiding traditional medical clinical medication.
anddrug pair; liver stagnation and blood deficiency;Copula function; dosage correlation; data mining
R285
A
0253 - 2670(2021)13 - 4007 - 07
10.7501/j.issn.0253-2670.2021.13.023
2021-03-11
国家自然科学基金项目(81803742);四川省科技厅国际合作项目(2018HH0122);四川省科技计划重点研发项目(2020YFN0152);成都市科技局国际科技合作项目(2017-GH02-00054-HZ);成都中医药大学杏林学者学科人才科研提升计划(ZRQNXZ2019028,(ZRQN2019010);四川中医药文化传承与研究中心项目(2019Y003);四川基层卫生事业发展研究中心项目(SWFZ20-Y-032);2018年度中医药信息化研究专项(02004906)
林 薇,女,讲师,研究方向为中医药统计学。E-mail: linwei@cdutcm.edu.cn
赵 萱,女,副教授,在读博士,研究方向为中药新制剂和新剂型。E-mail: zhaoxuan0225@cdutcm.edu.cn
廖 婉,女,博士,教授,硕士生导师,主要从事新制剂、新剂型及中药炮制工艺与机制研究。E-mail: liaowan2011@126.com
[责任编辑 潘明佳]