基于早期乳腺癌分期辨证规范化研究探索中医疾病诊疗规范化研究的方法学

2022-12-25 09:14:03戴燕罗薇孙杨朱华宇郭莉许锐陈前军
中医肿瘤学杂志 2022年5期
关键词:德尔菲证候聚类

戴燕, 罗薇, 孙杨, 朱华宇, 郭莉, 许锐, 陈前军

广州中医药大学第二附属医院乳腺科,广东 广州 510120

乳腺癌是女性常见的恶性肿瘤之一[1]。根据美国癌症协会估计[2],2022 年将有大约287 850 例新发乳腺癌患者,使乳腺癌成为美国女性排名最高的恶性肿瘤;同时预计死亡人数将达到43 250,仅次于肺癌和支气管癌。乳腺癌根据有无转移可以分为早期乳腺癌和晚期乳腺癌。对于早期乳腺癌的治疗目标主要是预防复发和转移,治疗方式主要包括手术、化疗、放疗、靶向治疗和内分泌治疗等[3]。目前由于早发现、早诊断、早治疗以及治疗水平的提高,乳腺癌的死亡率显著降低。然而,许多患者在治疗过程中仍然受到治疗副作用的影响,比如化疗引起的恶心呕吐[4-5],激素受体阳性乳腺癌患者接受内分泌治疗时出现的类更年期症状,如烦躁、抑郁、潮热、出汗、失眠、月经不调等,上述症状均会影响患者的日常生活[6]。

目前诸如5-羟色胺受体拮抗剂、植物雌激素和激素治疗等西医治疗手段可能会缓解西医治疗所带来的副作用,但对于某些治疗药物(如植物雌激素),安全性等方面仍存在着争议[7],所以越来越多的患者开始寻求补充和替代医学疗法的帮助[8]。癌症治疗的根本是杀死癌细胞,但同时也会破坏患者自身的内环境平衡[9]。中医药的治疗则侧重于调节内环境的平衡,因此可以减轻乳腺癌患者在标准西医治疗下伴随的相关副作用[10]。相关文献表明,中医药的治疗已成为癌症标准治疗过程中的辅助手段[11],尤其是在乳腺癌治疗过程中[12]。

在祖国医学中,乳腺癌称为“乳岩”或“乳癌”,传统中医治疗乳腺癌的理论体系是建立在以控制实体肿瘤为目的的基础上发展起来的辨证论治体系,是以局部辨证为主,全身辨证为辅的理论体系。随着现代医学的引入与发展,尤其是辅助治疗手段包括手术、化疗、放疗及内分泌治疗等的干预,早期乳腺癌患者在接受不同西医治疗中也会出现证候的变化,使得以控制实体肿瘤为治疗关键的传统乳腺癌中医治疗理论体系在临床实践中受到挑战。本项目文献研究也提示包括国家高等教育教材、研究论文等均未对早期乳腺癌的辨证论治进行统一或标准化[13]。

1 文献研究

该文献研究包括数据库文献检索、教科书及全国各大医院临床路径及诊疗方案的收集。数据库文献检索包括中国学术期刊全文数据库、重庆维普中文期刊数据库、万方数据知识服务平台、中国生物医学文献数据库、Cochrane 数据库、PubMed 数 据 库 、 Embase 数 据 库 及 AMED 数 据 库(Allied and Complementary Medicine Database)所收录的有关早期乳腺癌证候相关文献。同时收集有关早期乳腺癌的教科书、临床路径及诊疗方案等。同时参照《中医药学名词》《中医临床诊疗术语》《中医症状鉴别诊断学》等对文献中有关的中医证候、症状(包括舌象、脉象)进行中医名词术语的规范化处理。

数据分析方面,我们运用SPSS 26.0 统计软件,采用频率的统计描述以及聚类分析等方法,探索早期乳腺癌证候分布及组合规律、常见证候分布及主次症特征。聚类分析是根据数据的相似性将数据进行分类[14],其工作原理主要是将相似的样本分配到同一群体,将不相似的样本分配到不同群体[15]。本研究应用的层次聚类法主要包括Q 型聚类(对样本进行聚类)及R 型聚类(对变量进行聚类)[14,16]。因在文献研究中,我们将症状和体征(变量)进行聚类,故选择R 型聚类方法。聚类分析的另一个重要问题是选择最合适的方法来计算聚类之间的距离,包括最短距离法、最长距离法、重心法、组间平均距离法、离差平方和法等[14]。我们会对数据进行所有距离方法的计算,然后对结果进行比较,选定合适的方法。

2 临床研究

随后我们开展了前瞻性临床研究,收集广东省中医院等全国8 家医院于2020 年4 月至2021 年5月收治的住院及门诊早期乳腺癌患者资料。纳入标准为:①病理学符合早期乳腺癌的诊断标准(分期Ⅰ-Ⅲ,排除远处转移);②年龄大于18 岁(含18 岁)的女性患者;③ECOG(Eastern cooperative oncology group,美国东部肿瘤协作组)[17]评分为0 ~2 分;④自愿参加该项研究,并签知情同意书。排除标准为:①合并有严重心脑血管或精神相关疾病的患者;②接受新辅助治疗,或同时接受化疗、放疗及内分泌治疗的患者;③乳腺癌治疗中出现并发症的患者,比如术后伤口感染,严重淋巴水肿,中性粒细胞减少性发热,或者放射性肺炎等;④妊娠或哺乳期妇女。

通过EpiData 3.0 软件,建立《早期乳腺癌中医证候临床调查研究数据库》。数据分析方面,我们采用SPSS 26.0 统计软件对证候进行频数/频率的统计描述及聚类分析等,探索早期乳腺癌常见证候分类。同时运用logistic 回归分析、人工神经网络方法(运用IBM SPSS Modeler 18.0统计软件)研究常见证候的主次症。logistic 回归是一种多元回归分析方法,主要用于研究两个或多个分类变量与多个因素之间的关系[18]。Logistic 回归可用于根据计算变量之间的优势比(OR,odd ratio)来对现有变量进行预测[19-21]。该方法也已应用于中医证候的相关研究,通过OR 值进行主次症的分析[22-24]。本研究将所得临床数据处理为二分类,采用二分类Logistic 回归分析,运用Forward LR 逐步回归法,获得回归模型[22,24-26]。OR>1 表示自变量与因变量呈正相关,即代表为该证候的特征性症状。本研究根据所得OR 值的大小进行主次症的划分,将OR值≥3的症状与体征作为主症,1<OR值<3的作为次症,其余症状舍掉。

人工神经网络是一种模拟大脑神经元细胞传递信息的模型,由相互连接的神经元组成,通过自动化反复学习训练逐步调整各神经元之间连接的权重,以模拟输入变量与输出变量之间关系,而神经网络训练实际上就是神经元之间的连接权值不断调整与优化的过程[27-28]。多层感知器模型是人工神经网络模型中的一种,能够通过非线性基函数实现输入变量到输出变量之间复杂的映射关系[28-29],帮助建立证候诊断模型。本研究基本参数设置为多层感知器神经网络,以自动优化的网络权值分析各个症状对证候的贡献度,进行主次症的划分[30-31]。最终以权值≥0.4 的症状作为主症,0.1 ≤权值<0.4 的症状作为次症,其余症状剔除。在实际研究中,由于各研究疾病病种不同以及所收集的研究数据不同,在运用Logistic 回归分析及人工神经网络等方法拟定证候主次症划分判定标准时,可根据实际情况及实际需要适时调整参数,因此本研究的参数仅供参考[32]。

3 德尔菲法专家咨询

我们根据前期文献研究以及临床研究的结果,制定专家咨询问卷。在全国范围内遴选中医或中西医结合乳腺病领域专家30 名。对于本研究,专家需要满足:副主任或以上的职称;有10 年以上运用中药治疗乳腺癌的经验;目前仍在临床工作并且愿意参加本研究。问卷中指标重要程度依据5 分量表法赋值:很重要(5 分)、重要(4 分)、一般重要(3 分)、不重要(2 分)、很不重要(1 分)。依据专家对每个证候的熟悉程度,将熟悉程度分为5 个等级:很熟悉(1 分)、熟悉(0.8 分)、一般熟悉(0.6 分)、不熟悉(0.4 分)、很不熟悉(0.2 分)。将所收集资料进行数据审核、整理,建立《早期乳腺癌专家咨询问卷数据库》。

数据分析方面,SPSS 26.0 统计软件将用于数据的分析处理。每轮专家的回收问卷数将用于计算专家应答率。除了专家应答率,专家权威系数也用来评估专家的可靠性[33-35]。专家权威系数越大,说明权威越大,一般认为大于等于0.7 是可接受的权威水平[33]。权威系数主要是通过专家对问题作出判断的依据和专家对指标的熟悉程度进行计算[35-36]。另外,克朗巴赫系统将用于评估专家问卷中条目的可靠性[37-40],该系数越大,表明问卷调查的信度越高。一般来说,当系数大于0.7 时被认为是可以接受的[41]。每个证候的症状和体征都按照Likert 五分量表法进行评分,然后计算平均值[42-43]。此外,既往很多德尔菲法研究也会应用满分比[44-45],指的是在所有投票专家中对某项给出满分的专家所占的比例[46],所以在本研究也予以应用。变异系数[33,47]和肯德尔系数[43]常用来评估专家意见的集中程度。变异系数(用标准差除以均数得出)表示专家之间对指标的波动或协调程度。该指标越小,说明协调程度越高。肯德尔系数是反映所有专家在所有指标上的协调程度,该值范围从0 到1。如果所有专家对所有指标的意见完全一致,则系数为1,否则为0。统计方法的应用让我们对症状和体征条目的筛选有了一定的数据依据,也使得研究成果更加具有可信度。

4 讨论

本项目通过文献研究、临床研究及专家德尔菲法咨询构建早期乳腺癌中医证候分期诊断标准。迄今为止,文献提示存在多种数据分析方法可用于探索中医证候(比如因子分析、logistic 回归、关联分析等)[48-49]。因子分析是将关系错综复杂的变量(或样本)组合成几个因子,对多个指标变量用少数几个潜在指标的线性组合来表示[14]。因子分析在证候研究中也用于判断证候的主症及次症[50]。多元统计方法的应用可以为证候研究中的数据分析带来多种选择,但不同的分析方式可能会产生不同的结果。综合运用各种方法来确定证候和相应的主次症也是一个挑战。此外,有些数据分析方法对应用条件有特殊要求,所以如何选择合适的分析方法主要取决于研究问题及研究目的。

该研究专家咨询使用了德尔菲法,但目前也存在其他研究方法可以应用于共识的制定,比如名义群体技术(Nominal group technique)[51]或共识会议法[52]。名义群体技术是一种面对面互动的方法,通常涉及5到12名参与者[51]。团队成员首先写下他们的想法,然后通过循环反馈分享他们最喜欢的想法,随后进行结构化的小组讨论,最后向整个小组提供反馈[51-52]。该方法的优点是团队成员可以讨论和进行辩论,而缺点是结果可能会受到主要团队成员的影响[51,53]。我们在这项研究中应用了德尔菲法,因为它具有其他方法无法实现的一些优点,比如参与者的匿名反馈可以避免群体优势,还有德尔菲法的开展可以避免地理限制[52]。

本项目的开展弥补了前期研究的局限,比如文献研究使用的方法是根据Cochrane 系统评价手册进行的。此外,我们还收集了全国各大中心相关临床路径及诊疗方案,使得对这方面的认识更加全面。先前与乳腺癌证候的相关临床研究主要来自于单中心的数据,限制了研究结果的临床推广。本项目开展的临床研究涉及分布在全国不同地区的多个中心,使得研究结果更具推广性。另外我们在设计德尔菲法专家咨询第一轮问卷时提供了文献研究和临床研究的结果,使得德尔菲法研究设计和结果更加合理和严谨。同时德尔菲法专家是根据预先设定的纳入标准进行筛选,并且也考虑了地域分布确保专家的代表性,这样可以避免人为指定专家所带来的偏倚。

同样本项目也存在着一定的局限性。系统评价纳入的各阶段发表文献数量不同,影响了不同治疗阶段最常见的证候结果比较,进而可能影响对现有症状和体征进行综合分析得出的聚类结果。进行多中心临床研究对如何确保各中心的数据质量提出了挑战。虽然我们在项目开展前梳理了临床研究的标准化流程,但最后问卷收集进行数据审核时仍提示存在着部分数据不合格导致一些数据被排除在最终分析之外的情况。最后,德尔菲法本身具有难以避免的局限性,例如目前文献缺乏对如何进行专家共识意见的统一定义[52]。因此,本共识的阈值标准是由研究团队根据对已发表的文献和指南进行全面分析而决定。

本研究将早期乳腺癌中医证候根据目前标准西医治疗进行划分,使得辨证更加符合临床治疗的需求。但该项目仍需后续进一步研究来验证该诊断标准。我们将使用临床研究的数据,采用Apriori 算法,设计和实现关联规则算法,探索症状间关联关系;通过决策树算法,建立症状(群)与证候间关联模式模型,由所得的决策树提取分类规则,形成规则集;选择TAN(Tree Augmented Naïve Bays)模型,基于决策树结果,实现贝叶斯网络算法求得症状与证候间关联关系。然后结合多元统计、数据挖掘等方法对数据进行分析,并经课题组及相关专家讨论,确定早期乳腺癌中医证候诊断标准。最后开展前瞻性全国多中心临床研究来收集临床数据,通过检查敏感性、特异性、准确性、阳性预测值、阴性预测值、阳性似然比和阴性似然比等来验证该诊断标准的诊断效能。通过上述研究,我们拟构建与验证早期乳腺癌不同治疗阶段的中医证候诊断标准。

猜你喜欢
德尔菲证候聚类
肥胖中医证候动物模型研究进展
德尔菲法构建肿瘤医院ICU患者身体约束评估量表
基于德尔菲法构建融合式旅救护所指标体系
基于DBSACN聚类算法的XML文档聚类
电子测试(2017年15期)2017-12-18 07:19:27
海豚是鱼吗
大灰狼(2017年7期)2017-07-25 21:35:29
基于改进的遗传算法的模糊聚类算法
昆明地区儿童OSAHS中医证候聚类分析
基于德尔菲法的上海某专科医院公开招聘的影响因素研究
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例