基于文献计量学和文本挖掘的余甘子研究进展*

2024-04-22 05:39方龙伟卓玛东智多吉卓玛央拉巴桑卓玛
中医药导报 2024年3期
关键词:甘子药理作用聚类

方龙伟,卓玛东智,多吉卓玛,央拉,巴桑卓玛

(西藏大学高原健康科学研究中心,西藏 拉萨 850000)

余甘子为大戟科叶下珠属植物余甘子(Phyllanthus emblicaL.)的干燥成熟果实。余甘子作为常用藏药被《中华人民共和国药典》1977年版收录,是我国第一批药食两用品种。在我国余甘子主要分布于广东、广西、云南、福建等地[1]。余甘子在伊朗、印度、阿富汗等17个国家的药物体系中应用极为广泛,在我国约有16个民族使用余甘子,其中以藏族最为常见。余甘子被联合国卫生组织指定为全世界推广种植的3种保健植物之一[2]。

余甘子具有清热凉血、消食健胃、生津止咳之功效,主要含有酚酸类、鞣质类、萜烯类、甾醇类、脂肪酸类、黄酮类、氨基酸类等化合物。现代药理学研究表明,余甘子具有抗氧化、抗癌、降血脂、保肝、抗菌、抗炎和免疫调节等多种药理活性[3]。余甘子由于具有广泛的药理作用而被国内外医药界深入研究。

文献计量学作为一门交叉学科,通过利用数学、统计学、文献学等方法对学术信息进行定量描述,再结合统计分析来揭示文献的数量特征和潜在规律[4],解读大量信息和挖掘研究热点。而主题模型是文本挖掘的有效工具,常用于研究特定领域的主题和热点。隐含狄利克雷分布(latent dirichlet allocation,LDA)是最受欢迎的主题模型之一,在很多领域都有应用[5]。本研究采用文献计量、文本挖掘和可视化分析方法,对20年来有关余甘子的研究进行总结,旨在揭示该领域的研究现状、研究热点及发展趋势,挖掘需深入研究的内容,以期为余甘子产业化研究、临床合理用药提供参考。

1 资料与方法

1.1 数据来源 计算机检索中国知网、Web of Science中涉及余甘子的研究文献。中文检索式:SU=余甘子+油甘子+庵摩勒+滇橄榄+余甘果+油甘,英文检索词:TS=Phyllanthus emblica OR Fructus Phyllanthi。检索时间为2003年1月1日至2022年11月20日。

1.2 分析方法

1.2.1 文献计量分析 信息可视化软件CiteSpace是由陈超美教授所开发的一款着眼于分析科学文献中蕴含的潜在知识,通过数据可视化途径来呈现科学知识、规律和分布情况的软件[6]。本研究采用CiteSpace 6.1.3软件对导入文献进行格式转换处理及可视化分析,图谱寻径网络算法选择Pruning sliced network,数据提取的阈值为Top 50、Top 10%,其他参数设置为默认。

关键词聚类分析采用LLR算法(Log-likelihoodrate)进行加权计算,生成高强度突变率的关键词排序表。中介中心性(centrality)超过0.1的节点称为关键节点,中介中心性越高,节点越重要。突现词突现强度与增加的速率成正相关,用于预测下一阶段的研究方向。聚类结构合理性:模块值Q>0.3表明聚类结构显著,网络轮廊值S>0.5表明聚类结果同质性较高。

1.2.2 文本挖掘分析 文本挖掘的主题LDA模型由BLEI D M等[7]于2003年提出,主要用于推测文档的主题分布。它基于三层贝叶斯网络,以概率分布形式给出文档主题,实现主题聚类和主题演变分析等目的。本研究提取文献的摘要到模型语料库中,通过Python sklearn实现LDA模型,通过困惑度确定主题LDA模型,选取前7位关键词结果来解释对应主题。

2 结果

2.1 文献筛选结果 通过文献检索获得中文文献972篇,去除会议文献34篇,报纸文献10篇,相关通知、征稿启事、无作者信息等文献124篇。英文文献检索得到621篇,排除不相关文献44篇。纳入分析的中文文献、英文文献分别为804篇和577篇。

2.2 年度发文趋势分析 2003—2022年,中文文献呈波浪式样上涨趋势,整体发文量大于英文发文量。但是在2021年、2022年中英文发文情况略有变化,呈现英文文献发文数量大于中文文献。(见图1)

图1 年度发文量趋势图

2.3 作者合作情况 作者合作网络图中节点大小表示作者发表论文的数量,节点间连线反映合作关系及其强弱。核心作者是指在本领域研究中发表更多科研成果的作者。根据普赖斯定律,核心作者最低发文量为发文量最多的作者的论文数量[8-9]。

中文文献数量排名前5位的作者依次是赵琼玲、张兰珍、瞿文林、张弘、吴玲芳。以赵琼玲、张兰珍、张弘为主的各团队内部合作联系紧密。中文作者643位,最高发文量为19篇。M≈3.26,取整数为4即发表论文4篇及以上的作者为核心作者。共有80位核心作者,发文574篇,占总文献量的71.39%(574/804)>50%,说明余甘子研究领域作者相对集中,已形成相对稳定、高效的核心作者群体。

英文文献研究的合作作者以ZHAO M M、BALIGA M S、ZHANG Y J、YANG C R、XU M、WANG D为代表的研究团队为主。英文文献作者572位,作者最高发文量为8篇,根据普赖斯定律,M≈2.12,取整数为3,即发文量3篇及以上的作者为核心作者。共有36位核心作者,发文151篇,占总论文数量的26.17%(151/577)<50%,说明余甘子研究领域作者相对比较分散,未形成相对稳定、高效的核心作者群体。

中文文献作者突现分析共出现了不同研究时期活跃的25位作者,英文文献有9位活跃作者。其中近些年以张定堃、黄浩洲、ZHANG M M、WANG D等为代表的学者研究较多。(见图2)

图2 作者合作网络分析图和突现分析图

2.4 关键词分析

2.4.1 高频关键词 关键词可以概括某一特定知识领域研究主题的核心和重点,高频关键词可以更好地显示变化和演变主题的当前重点[10]。

中文文献关键词共现图谱中有576个节点,1 018条连线,网络密度为0.006 1。英文文献关键词共现图谱中有558个节点,1 676条连线,网络密度为0.010 8。余甘子研究领域高频关键词分别为余甘子、没食子酸、氧化应激、多酚、抗氧化、藏药、含量测定、数据挖掘等,其中没食子酸、氧化应激、药用植物等为关键节点,即其中介中心性大于0.1。(见图3、表1)

表1 频数排名前10 的关键词

图3 关键词共现图谱

2.4.2 关键词聚类 中文文献关键词聚类Q值=0.654 4,S值=0.944 9;英文文献关键词聚类Q值=0.608 2,S值=0.826 4。聚类图谱见图4。聚类标签见表2。中文文献关键词聚类分析显示,关注度排名前5位的依次为#0滇橄榄、#1抗氧化、#2干河热谷、#3没食子酸、#4藏药,大多以余甘子抗氧化、活性成分研究为主。研究内容多侧重于余甘子植物学、化学成分没食子酸、鞣质类成分研究。英文文献关键词聚类分析显示,关注度排名前5位的依次为#0gene expression(基因表达),#1green synthesis(绿色合成),#2extract(提取物),#3antioxidant activity(抗氧化活性),#4phyllanthus emblic(余甘子),大多以余甘子基因表达、生物合成等方面研究为主。研究内容多侧重于余甘子植物化学、作用机制方面研究。

表2 排名前10 的关键词聚类标签

图4 关键词聚类图谱

余甘子整体组分、药效药理作用和具体应用方面的探讨较为不足,有待进一步深入研究。

2.4.3 关键词突现和时间线分析 中文文献分析得到排名前9位的突现关键词,其中强度排名前3位的分别是藏药、保健功能、提取。突现时间跨度最长的关键词是质量标准,其次为保健功能。多酚、鞣花酸、质量标准是目前余甘子研究的主要热点趋势。英文文献分析得到排名前10位的突现关键词,其中强度排名前3位的分别为lipid peroxidation(脂质过氧化)、growth(生长)、green synthesis(绿色合成);突现时间跨度最长的关键词为lipid peroxidation(脂质过氧化),其次为flavonoid(黄酮)、oxidative stress(氧化应激)、growth(生长)、green synthesis(绿色合成)、silver nanoparticle(银纳米粒)。生长、绿色合成、银纳米粒是目前余甘子研究的主要热点趋势。(见图5)

图5 关键词突现图

关键词时间线图也可以显示不同类别余甘子研究工作的交叉融合、多样化、时间跨度等方面特征。余甘子的研究内容与方向随着时间而发生改变,范围得到扩大,如从余甘子的基础研究向余甘子成分、药理作用、工艺优化、分子机制等方面逐步扩大。(见图6)

图6 关键词时间线图

2.4.4 文本挖掘 pyLDAvis可实现主题结果的可视化,针对LDA模型提供可以分析主题差异性和高度关联关键词的全局视角框架。中文文献有部分主题之间有一定重叠,其他主题均保持了相对的独立性,而英文的主题分类情况较好。中英文文献摘要主题分类显示,主题大多与活性、成分、药理作用、质量标准等方面内容有关。中文文献主题主要为品种、活性、鞣质、含量、工艺、成分、藏药、细胞等;英文主题主要为extract(提取物)、leaves(叶子)、triphala(三果)、activities(活性)、cell compounds(细胞复合体)、plants(植物)、oxidative(氧化的)、nanoparticles(纳米粒)等。(见表3、图7)

表3 摘要主题分类

图7 摘要主题模型可视化结果

2.4.5 深度文献分析 中英文文献高频关键词、关键词聚类、关键词时间线分析和摘要文本挖掘,主要涉及余甘子的药物化学、药理作用、制剂应用等方面。本研究进一步通过文献查阅,对文本信息进行深度挖掘,分析余甘子的研究热点及发展趋势。

2.4.5.1 药物化学 余甘子化学活性成分的研究较为广泛,鞣质、黄酮类等成分关注度比较高,其中研究鉴定出来的成分包括鞣质类48个、酚酸类34个、黄烷醇及其衍生物8个、黄酮类20个、萜类8个、挥发性成分43个以及多糖、甾醇、蛋白质、氨基酸、微量元素等多种活性物质[11-12]。这些基础物质成分的化学结构研究为余甘子的进一步开发和应用提供了物质基础。针对余甘子活性成分的提取分离方法研究范围也较广,一直处于探索的阶段,如:采用NKA-II[13]、XAD-7HP[14]等树脂进行分离纯化多酚类物质,通过加氢蒸馏和超临界流体萃取等方法获得挥发性成分、漆黄素和没食子酸等,以及采用Sephadex LH-20色谱和反相高效液相色谱分离和纯化香叶素等活性化合物[14-15]。研究者一般需采用UPLC-Q-TOF-MS或者LC-MS/MS等方法进一步鉴定余甘子成分的化学结构[16],但具体化学结构研究还未取得一定成果。化学成分标准研究方面,存在标准不一、不稳定等问题。研究者一般基于余甘子多酚成分转化传递规律进行研究[17]。此外,研究者也基于中药质量标志物的原则[18],对其质量标志物的候选化合物进行预测[19],同时还有研究者通过查耳酮合酶和查尔酮异构酶对其生物合成路径进行控制[20]。

2.4.5.2 药理作用 余甘子一般主要用于治疗感冒、支气管炎、糖尿病、眼病、黄疸等,具有抗菌、抗氧化、抗炎、降血糖、抗癌、抗衰老、防辐射、保肝、免疫调节、降血脂等药理作用[21-22]。随着研究的深入,余甘子新的药理作用不断涌现出来,为余甘子深度开发和药理机制研究提供了新的路径。如多酚类成分具有多种药理作用:与DENV NS5蛋白相互作用从而发挥抗病毒作用[23];下调GSK-3β和p53蛋白表达从而发挥抗阿尔茨海默病作用[24];降低肿瘤发病率、数量和体积[25];激活毛发生长基因的表达,降低踝关节滑膜细胞中NLRP3和半胱天冬酶-1的表达,以及抑制血清中TNF-α、IL-10和IL-1β等下游炎症因子和MMP13的表达[26];改善小鼠肠道菌群的谷胱甘肽代谢紊乱、色氨酸代谢、牛磺酸和次牛磺酸代谢以及原胆酸生物合成等[27]。以上现代药理作用机制研究,与中医、藏医治疗疾病的范畴存在一定程度互补的关联性,同时也为传承创新中医、藏医、西医融合发展奠定了理论基础。

2.4.5.3 制剂应用 余甘子作为藏药处方中的重要药材,被称为“生命之果”“众药之王”。《藏药部颁标准》中收载的藏药品种中,余甘子的使用频率为32.68%。二十五味余甘子丸、多血康胶囊、三味姜黄胶囊等藏药方剂均含有余甘子[28]。余甘子Triphala药物制剂可以更有效地治疗退行性疾病和胶质母细胞瘤[29]。也有学者采用绿色纳米化技术开发新制剂,如余甘子银纳米新颗粒被用于调控治疗氧化应激、炎症和肝癌,抗病菌,以及抗Hep2细胞系增殖等[30]。现代剂型产品中,余甘子多作为潜在的抗氧化剂、抗衰老药、抗炎药和美白药妆成分,可为藏药产品开发增加新的药用食用新原料[31]。在日化领域,通过Box-Behnken响应面法开发出的余甘子抑菌免洗凝胶[32],以及符合Higuchi方程、Hixson-Crowell方程的余甘子软膏[33]等产品也广受市场欢迎。

3 讨论

近20年来传统医药、天然药物的深入研究,为深度认识余甘子药材的本质内涵提供了新的机遇。本研究借助CiteSpace软件的文献可视化和文本挖掘将余甘子的研究现状进行了系统整理与分析,使研究者对于其研究现状、热点、前沿及趋势、重点研究团队以及未来可能的发展方向有更深入的了解。

从研究内容来看,余甘子的研究热点从简单的成分分析、功效研究逐渐转变为多成分的综合研究及基于药理药效作用的深入探索。活性成分与药理作用的研究,不再只局限于单一部位、单一成分的研究。同时余甘子抗炎、抗衰老、抗病毒的药理作用研究和其酚酸类、鞣质类、黄酮类活性成分的研究仍是余甘子研究的重要部分。结合数据挖掘、生物合成、基因组学这些新的研究手段对余甘子进行深入的探索可能是未来的研究方向之一。余甘子处方在防治COVID-19中有重要作用,这与其抗炎、抗病毒的药理作用有密切的关联。因此余甘子防治COVID-19的作用机制及活性成分研究仍是未来的研究热点。目前研究多聚焦在体外实验和细胞实验的验证,缺乏体内外相关性的转移转化研究。同时对于含有余甘子的新药中成药制剂的研发可能是未来的研究方向。本研究发现其质量控制标准是其发展中的瓶颈,余甘子的质量控制正在从以单一指标成分的化学评价向多维多成分整体性的品质动态评价过渡。在未来,建立余甘子质量标准体系综合评价余甘子的质量,可能会成为研究者们所关注的方向。应用方面,余甘子目前多以复方、提取物的形式应用于保健药品、日用品等。而在药用方面,其临床疗效,尤其是涉及多组分靶点作用方面的研究较少。

余甘子的开发研究存在巨大的潜力的同时,也存在一些不足之处。(1)研究成分较为局限。鞣质类和黄酮类成分的研究较多,而其他成分的研究尚不够深入。建议后续研究提高对其苷类、挥发油类、多糖类等多组分研究的重视。(2)余甘子的疾病治疗研究以消化系统疾病、呼吸系统疾病、心血管系统疾病为主,研究范围局限。后续研究可探索余甘子治疗其他疾病的研究,如阿尔茨海默病、衰老、缺氧等方面疾病。(3)药效物质基础研究不足。建议加强对余甘子的药效物质基础研究,将物质基础转化规律体内外动态结合起来。

综上所述,余甘子的研究在未来仍然充满无限可能性,值得不断探索与挖掘。本研究也存在一些不足,如在共现网络图中涉及余甘子研究的内容较多,本文只选取发文量、作者和关键词、摘要等方面内容进行挖掘,选取成分、药理、应用等方面进行信息分析,未对余甘子的植物学、工艺、功能等方面进行详细研究,后续可对这些内容进行研究。此外本研究仅对中国知网、Web of Science数据库中有关余甘子研究的文献进行了分析,后续可纳入更多中、英文数据库进行分析。

猜你喜欢
甘子药理作用聚类
蚓激酶的药理作用研究进展
橘红素药理作用研究进展
余甘子化学成分及其抗炎作用的研究进展
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
采用高效液相色谱法检测余甘子中的没食子酸
无花果的药理作用研究进展
藏药余甘子茶的生产工艺及高血压的临床应用
玛咖化学成分及其药理作用的研究进展
一种层次初始的聚类个数自适应的聚类方法研究