基于文献计量学分析症状群生物学机制的研究现状*

2021-06-28 08:47李凌香刘保延周雪忠舒梓心牟梓君何丽云
中国中医基础医学杂志 2021年5期
关键词:生物学综合征机制

李凌香,刘保延,周雪忠,舒梓心,牟梓君,何丽云△

(1.中国中医科学院中医临床基础医学研究所,北京 100700; 2.中国中医科学院数据中心,北京 100700; 3.北京交通大学计算机与信息技术学院,北京 100044)

症状群(symptom cluster)最早出现在心理学和精神卫生领域。近10年来,症状群相关研究已成为国内外护理和癌症症状管理的热点,并逐步延伸至慢性疾病[1-4]领域。研究表明,单纯通过生物标志物或单个症状对疾病做出诊疗和预后判断并不准确,因此学者们越来越注重对症状群生物学机制的探索。2001年,Dodd等[5-6]首次提出症状群概念:“症状群为一组(2个及以上)具有内在联系的症状集合”。中医认为,症状群是指在同一病证中出现,具有共同病理机制且常相伴而生的几个症状共同组成的症状集合[7]。国内外学者对“症状群”的认识相对一致,症状群在中医辨证论治中具有重要地位,其本质是医患互动的信息转化过程,而症状群是信息的内涵。症状群可以体现疾病不同阶段的特征,用相对固定的“症状群”将“病”的过程、变化规律(即病机)加以区分;《伤寒杂病论》是善于运用症状群的典范,中医先辈们构建了一套阐释方证(症状群)规律的理论与临床诊疗体系,但对症状群生物学机制的阐述和揭示仍存在较大瓶颈。本研究分析症状群生物机制的研究现状、发展趋势、热点及不足,以期为中医药领域开展相关研究提供参考。

1 资料与方法

1.1 资料来源

以中国知识基础设施(china national knowledge infrastructure, CNKI)、中国学术期刊数据库(万方数据)、中文科技期刊数据库(维普网)、PubMed、SinoMed、Web of science、Ovid,共7个数据库为资料来源。检索主题:症状群生物学机制。中文文献检索采用主题/全字段检索,外文文献检索采取主题词与自由词相结合的方式检索,以期尽量查全。中文检索式:“症状群”AND “生物标记物” OR “炎症因子” OR “基因” OR “表观基因”OR “代谢组学”OR “蛋白组学”OR “线粒体”OR “细胞因子”OR “细菌”OR “病毒”。外文检索式:“Biological Markers”[Mesh] OR biomarker×[Text Word] OR “Inflammation”[Mesh] OR inflammatory markers”[Text Word] OR “Epigenesis, Genetic”[Mesh] OR “Genomics”[Mesh] OR “Metabolomics”[Mesh] OR “Proteomics”[Mesh] OR “Mitochondria”[Mesh] OR “Cytokines”[Mesh] OR “Bacteria”[Mesh] OR “Viruses”[Mesh] AND “Syndrome”[Mesh] OR“symptom cluster”[Text Word] OR “symptom clusters”[Text Word] OR “symptom complex”[Text Word] OR “multiple symptoms”[Text Word][8]。Filters: Humans。检索时间范围为建库至2020年3月20日。

1.2 文献纳入标准

研究类型涉及临床研究、实验研究、综述等;研究对象为症状群生物学基础(包括生物标记物、炎症因子、基因、表观基因、代谢组学、蛋白组学、线粒体、细胞因子、细菌、病毒等)。

1.3 文献排除标准

动物实验研究、无法获取全文的研究、数据不完整、重复发表或数据重复报道的研究(保留时间最早的1篇)、新闻报道、社论与主题不相关文献。

1.4 研究质量控制

文献筛选过程由2名研究人员根据纳入、排除标准,严格独立进行,意见不一致时由双方讨论达成一致意见,或由第三方人员进行判断。

1.5 统计学方法

以文献计量学基本定律作为数据分析的基本方法,采用Note-Express软件与Excel对相关文献的年代分布、语种及国家、文献类型、作者、高频关键词、研究内容、研究方法等为对象进行统计分析。

2 结果

2.1 文献检索结果

检索到相关文献共8581篇,其中CNKI 40篇,万方108篇,维普7篇,Pubmed 2464篇,Sinomed 2102篇,Web of science 846篇,Ovid数据库中3014篇。将初检文献进行查重,剔除重复文献217篇;阅读文献题目和摘要(必要时阅读全文)后,按照排除标准剔除文献8189篇(排除主题不相关文献较多,原因是现代医学疾病多以“综合征”命名的特点所致,而文献本身并未涉及症状群生物学机制研究),共纳入文献175篇(中文文献30篇,外文文献145篇)。

2.2 文献特征描述

2.2.1 研究发展趋势分析 图1示,检索到有关症状群生物学机制最早的文献见于1983年,发文1篇,表明在“症状群”概念正式提出之前已有学者关注这一问题。但1983年至2003年10年间共发表文献21篇,占发文总量的12%,平均每年发表2.1篇,数量少且增长缓慢;从2003年开始小幅度增加,由21篇增加至2012年的71篇,增长了3.4倍。自2012年开始呈现快速增长趋势,2012年1月1日至2020年3月20日共检索到发表文献104篇,占发文总量的59.42%,平均每年发表13篇;其中发表文献最多的年份是2019年高达22篇,占总文献数的12.57%,是1983年该类文章首次发文量的22倍。普赖斯原理[9]表明,文献数量进入指数增长阶段时,学科便进入大发展时期,提示症状群生物学机制研究的进展较缓慢,但目前已经进入大发展时期,呈现“情报爆炸”态势。

图1 各年度发表文献数量与文献累计数量比较

2.2.2 文献类型及语种分析 文献类型分为期刊、学位论文、会议论文三类,期刊文章最多为163篇(93.14%),其次为学位论文11篇(6.29%),会议论文1篇(0.57%),表明期刊论文是症状群生物学机制的主要发表形式。文献语种为英文论文139篇(79.43%),中文论文30篇(17.14%),其他语种为6篇(3.43%),提示研究症状群生物学机制的论文目前以英文为主。

2.2.3 研究设计类型分析 表1示,文献的研究设计类型分为4大类,包括临床研究(病例报告/病例系列、横断面/队列研究、随机对照试验、病例对照)、文献综述(传统综述与系统综述)、基础实验研究以及其他类型研究。以综述类文献68篇(38.86%)与病例对照类论文55篇(31.43%)为多见,表明症状群生物学机制研究目前以观察性临床研究为主,干预性试验研究和基础实验类研究较少。

表1 文献研究设计类型分布比较

2.2.4 文献作者分析 表2示,依据洛特卡定律,在一个成熟的研究领域,写n篇论文的作者数量约为写1篇论文作者数的1/n2,并且写1篇论文的作者数量约占所有作者数量的60%[10]。本研究仅统计论文的第一作者,作者发文量最多为4篇共有5位作者,发文量≥2篇的作者共40位。表2示,发文量4篇、3篇和2篇的作者人数占发文1篇,作者人数的比率分别约为3.70%、20.00%和5.93%,比率低于洛特卡定律规定的理论值(分别为1/42、1/32和1/22);发表1篇论文作者数约占作者总数的77.14%,高于洛特卡定律规定的60%理论值。提示症状群生物学机制相关研究还没有形成成熟的作者群,需要进一步培育能够长期从事该研究领域的学者群。

表2 作者发文量分布比较

图2示,收录文献中以美国作者发文最多共60篇占34.29%,其次为中国39篇占22.29%,英国10篇占5.71%。

图2 作者地域分布情况比较

2.2.5 研究热点分析 表3示,高频关键词是反映研究热点的关键信息,175篇文献共有536个关键词。从频次排名前10位的关键词来看,症状群生物学机制的研究热点主要集中于抑郁症、细胞因子与癌症相关症状群、炎症标记物及遗传学等方面。

表3 排名前10的高频关键词分布

2.3 研究内容分析

文献的研究内容能够在一定程度上反映出某时期内某一学科的研究热点及发展方向[11]。按照疾病的种类对文献研究内容进行归纳和总结,发现研究内容主要聚焦于7大类疾病,如精神心理疾病(抑郁症、精神分裂症、围绝经期综合征、经前期综合征)、癌症相关症状群(放化疗术后及陪护人员出现的症状群)、胃肠道症状群(肠易激、功能性消化不良)、纤维肌痛综合征、慢性疲劳综合征、心脏疾病症状群(心力衰竭、体位性心动过速综合征)、干燥综合征。分析发现,最早关注症状群生物学机制的文献为外文文献,研究内容为经前期综合征[12]。30篇中文文献的主要研究内容为精神心理疾病19篇(63.33%),癌症相关症状群5篇(16.67%),心脏相关疾病症状群4篇(13.33%)。145篇英文文献主要研究内容为精神心理疾病36篇(24.83%),癌症相关症状群25篇(17.24%),胃肠道症状群21篇(14.48%),慢性疲劳综合征11篇(7.59%),纤维肌痛综合征11篇(7.59%),干燥综合征8篇(5.52%)。

2.4 研究方法分析

2.4.1 症状群识别及其分类方法 文献中对于命名为“综合征”的疾病,其症状群的识别主要依据临床表现来确定[13];对于癌症相关症状群的识别,多采用潜在剖面分析法(potential profile analysis, LPA)与聚类分析法[14-15],结合患者的基本特征如年龄、性别、病程、病史和使用处方等,采用Logistic回归分析方法对症状群发生发展和预后等因素进行分析,获得影响症状群状态变化的主要表征及干预特征[16]。对于精神心理领域症状群的识别,主要根据相关量表(如汉密尔顿抑郁量表(hamilton depression scale,HAMD)、安德森症状评估表(md anderson symptom inventory, MDASI)、Greene更年期评分量表等)的条目、得分以及家族史,进行症状群划分[17-20],提示目前可能尚未形成较统一的症状群识别方法。

2.4.2 生物标志物-基因提取方法 共23篇文献涉及基因提取,文献中主要采用聚合酶链反应-限制性片段长度多态性(polymerase chain reaction-restriction fragment length polymorphism, PCR-RFLP)方法(9篇),也有研究者采取高温连接酶检测反应基因芯片(ligase detection reaction, LDR)技术测定基因多态性、利用TaqMan荧光探针检测单核苷酸多态性(single nucleotide polymorphism, SNP)技术以及聚合酶链式反应结合变性聚丙烯酰胺凝胶电泳(polymerase chain reaction-polyacrylamide gel electrophoresis, PCR-PAGE)等分析方法,还有少量的(genome-wide association studies,GWAS)研究[21],表明目前临床研究中基因数据主要来源于小样本目标人群的生物样本提取检测,对于生物医学数据库的利用度不高。

3 讨论

3.1 症状群生物学机制研究的重要性分析

症状群生物学机制研究是中西医结合新医学体系的关键拐点,也是沟通基础研究与临床实践的桥梁。症状群生物学机制研究,不仅能为症状群的靶向治疗和精准护理奠定理论基础[22-23],还能揭示中医辨证论治的科学内涵。国外1项130万余人的失眠相关基因研究[24]发现,失眠疾病基因与高血压、肥胖和冠心病之间有很高的重合度,从某种程度上说明中医异病同治的科学内涵。文献研究[25]发现,桂枝汤证的生物学基础为9个toll样受体(toll-like receptors, TLR)的亚型中TLR-3、TLR-4和TLR-9的mRNA表达上调,而桂枝汤能有效逆转某些TLR亚型在不同时间的上调,这一研究科学地解释了桂枝汤的药理作用机制,也阐明了桂枝汤证(即症状群)的生物学基础,在一定程度上阐释了“方证”的科学内涵。中医的病通常是建立在症状学基础上的,是一种宏观上的病[26]。尽管“症”是客观的,但客观性并不是选择诊断性或评价性指标的唯一依据[27],只有能真正反映疾病特征的症状群,才能作为诊断或评价的指标。病是症状群在时间上的分布规律的体现,不同时期的症状群将疾病分成段,而证是症状群所处的空间位置。症状群是证候形成的主要信息载体,不同类别的症状群可以反映疾病不同阶段的特征。用相对固定的“症状群”将“病”的过程、变化规律,也就是“病机”加以区分,形成辨证论治诊疗模式的主体框架,可以提高辨证和论治的把握度。刘钊乐[28]等发现,症状群具有更强的诊断指向性,对提高临床辨证诊断水平有积极的影响。生物学机制研究则是该研究策略下的重要切入点,有助于从分子水平综合描述病证发展过程的复杂性及其相互关联关系[29]。在此研究潮流之下,现代医学与中医有望殊途同归,未来在中医辨证论治整体观的指导下,可以系统开展症状表型研究、症状群分类、生物学基础内涵的研究,建立以症状群为主要框架的个体化辨证论治诊疗体系。

3.2 症状群生物学机制的研究现状分析

通过上述文献分析可以发现,症状群生物学机制研究仍处于不成熟阶段。现代医学对症状群的研究主要涉及症状群的种类、构成及其与基因多态性、细胞因子等生物标记物的相关性。研究方式以临床观察性研究为主,且以小样本研究居多,干预性试验研究和基础实验类研究仍很少;研究的病种亦较为局限,主要关注精神心理疾病、癌症相关症状群、胃肠道症状群、纤维肌痛综合征与慢性疲劳综合征,未来应该进一步丰富疾病病种,并进一步探索不同病种出现相同症状群的生物学机制。目前症状群的识别方法尚未统一,这可能是疾病的命名特点所致。现代医学对于许多疾病的命名,尤其是命名为“综合征”的疾病,其本质就是1组或多组由特异性症状与非特异性症状组成的症状群,如肠易激综合征、围绝经期综合征、干燥综合征等。对于症状群的识别,主要使用统计分析方法提取症状群或采用质性研究的描述方法,通过文字提炼症状群[30]。但因对症状群定义的界定不一致,研究者采取的统计学方法也存在差异[31]。目前常采用的统计学方法主要包括主成分分析、公因子分析和聚类分析。然而Kim[32]指出,并没有太理想的研究症状群的统计分析方法;2016年Samantha[33]发现,潜类分析法(latent class analysis, LCA)非常适合症状群研究,可用于鉴别不同人群中生物标志物、遗传变量与症状群成员的关系。因此,研究者在选择识别症状群方法时,应该结合自身研究疾病的特点,选择相对较为公认的方法。

文献研究提示,目前临床研究中基因数据主要来源于小样本目标人群的生物样本提取检测,对于生物医学数据库的利用度不高。因此,笔者建议在开展大型临床研究的同时,可以加大对生物医学数据库的利用度。大数据时代,许多开源数据库都可以十分便捷地获取信息和知识。本研究团队前期建立的数据库SymMap[34],整合了中西医症状、疾病、基因、中药和靶点等症状图谱(SymMap http://www.symmap.org/)。该图谱包含6种实体(1717个中医症状,499味中药,961个西医症状,5235个西医疾病,19595种化学成分和4302个基因)和106721条直接实体关系,且在持续更新和完善中。刘林[35]等通过对症状数据的收集整理及研究,得到准确的症状术语、症状与疾病以及症状与基因关系数据等,从而为研究症状的生物学基础提供了巨大帮助。以下简单介绍一下常用的中医药生物医学数据库。①疾病数据库:MalaCards[36]、DisGeNet[37]、GWAS[38]和DiseaseConnect[39]等;②中药成分数据库:TCMSP[40]、TCMID[41]、HIT[42]和TCM Database@Taiwan[43];③药物成分靶点数据库:Genecards[44]、DrugBank[45]等;④生物分子相互作用数据库:STRING 11(人种子集,近2万蛋白质,30余万高质量相互作用)、HPRD、BIND、DIP、HAPPI和MINT[46]等。各类生物医学信息数据库正以蓬勃态势发展,为相关研究的开展奠定了深厚的生物学基础。

3.3 症状群生物学机制的研究动态分析

2017年美国专家共识[47]提出,在未来的研究中,症状群的定义应该从患者的主观症状体验、时间维度、基本分子机制等角度出发。为进一步揭示症状群的分子机制,促进症状群临床评测的开展,美国NIH于2018年发布了有关症状群研究的R01项目指南(https://grants.nih.gov/grants/guide/pa-files/PA-17-462.html)。该指南分别从跨病种症状群种类及演变规律、症状群的分子机制和症状群的评测研究等三个方面开展,期望通过症状群的临床与基础研究,以解决疾病机制研究中症状涉及少与临床中症状困扰负担重的鸿沟(临床中症状困扰仍是大多数患者就医的主要原因)。中医药领域开展症状群生物学机制研究,需要结合中医临床数据在非特异性症状的采集、症状内涵的理论解析和辨证论治体系的优势;从疾病的症状群分类、症状群生物学内涵和分子网络关联的有效核心方证的挖掘等方面进行示范性研究,为中医药领域防治重大慢性疾病(如糖尿病、失眠等)提供可行的方法和研究路径。未来开展症状群相关研究,需要注意以下几个方面:一是同时关注特异性症状群和非特异性症状群,以便开展个体化治疗;二是症状群分子机理研究,除特异性生物标记物,还需从分子网络视角探索症状群生物学内涵的系统性与多样性;三是疾病症状群研究,不能只注重单个症状群的发现研究,还需探索各症状群之间的关联及演变规律。

症状群生物学机制研究目前处于发展阶段,中医疾病-症状群生物学机制研究更是处于萌芽阶段,但大数据时代带来了前所未有的良机,如果能够建立相应的方法结合网络药理学、系统生物医学、生物信息学、互联网技术以及临床诊疗数据,对重大慢性疾病的症状群分类、演变规律及生物分子机制进行深入系统的研究,或许有望进一步促进中医辨证论治诊疗规律科学内涵的揭示,这也是中西医结合的一个新的着力点。本文通过对症状群生物学机制的研究现状、热点与未来可能的发展方向进行分析,结合中医学的学科特点,提出以“症状群”结合“病机”进行疾病分类的设想:通过对疾病-症状群-有效方证为核心的辨证论治体系,展开生物学机制的探索,建立从“疾病-症状群表型网络-中药靶点网络-分子相互作用网络”理解“病-症-治-效”的研究框架,以期为中医药领域开展相关研究提供参考。关于构建中医疾病-症状群-有效核心方-分子生物学机制相关联的辨证论治体系,任重而道远,希望有志者能携手共同探索。

猜你喜欢
生物学综合征机制
SAPHO综合征99mTc-MDP及18F-FDG代谢不匹配1例
Chandler综合征1例
谷稗的生物学特性和栽培技术
考前综合征
初中生物学纠错本的建立与使用
初中生物学纠错本的建立与使用
自制力是一种很好的筛选机制
猪繁殖与呼吸综合征的预防和控制
破除旧机制要分步推进
PEDF抗肿瘤的生物学作用