宋 瑶,林咸明,王莉莉
(1浙江中医药大学附属第二医院·浙江 杭州 310000;2浙江中医药大学附属第三医院·浙江 杭州 310000)
中医学认为“神”是生命的本原与本质,是精神活动的物质基础,强调针灸治疗必须以神为根本。《素问·宝命全形论》明确指出“凡刺之真,必先治神”;《灵枢·官能》认为“用针之要,无忘其神”,因此“治神”“调神”成为中医针灸疗法的核心精髓,并衍生出众多以“调神”命名的针法,如通督调神针法、醒脑调神针法、调神益智针法、调神利咽针法等等[1-4],临床笼统称为“调神”类针法。近年来,与“调神”相关针法的文献发表量逐年升高,研究内容丰富多样。本研究引入基于机器学习的文本挖掘技术,通过TF-IDF算法自动寻找“调神”相关针法文献中的特征词汇,结合原文数据回溯、人工阅读分析降噪等方法,发掘“调神”类针法在主治病机、适用科属病种、主要选穴归经等方面的特点,以期指导针灸临床。
1 资料与方法
1.1 数据来源及检索方法 文献来源中国期刊全文数据库(CNKI)、维普数据库(VIP)、万方数据库,时间范围为建库至2020 年12 月所有与“调神”针灸法有关的文献。主题词为“针灸”“调神“治神”,并结合手工检索各论文参考文献目录。
1.2 文献纳入及排除标准 纳入标准:选取已经正式发表的包含有“调神”针灸法具体应用、经验总结等的期刊论文。排除标准:①动物实验研究性论文;②临床治疗中未以“调神”针灸法为主要治疗方法的论文;③重复发表的文章。
1.3 文本挖掘
1.3.1 分词预处理 将纳入文献利用Jieba中文分词工具进行分词预处理。Jieba中文分词是最常见的中文分词工具之一,以“最大匹配”作为匹配规则,完成基于词典的候选词挑选和最终结果的返回[5]。词表数据来源于《中国针灸穴位通鉴》[6]、《中国中医药学主题词表》[7]《中医病证分类与代码》(GB/T15657-1995)[8]。
1.3.2 分词的文本挖掘 将预处理的单词于Python3.6环境中提取频率-逆向文件频率(term frequency inverse document frequency, TF-IDF)值。TF-IDF算法是从一组多个文档中提取具有高重要性的单词的方法,单词在特定的文档中出现的频率越高,说明它在区分该文档内容属性方面的能力越强(TF);单词在文档中出现的范围越广,说明它区分文档内容的属性越低(IDF)[9]。归一化TF-IDF计算公式为[10]
对于所有“调神”相关针法文献,在上述公式中,i代表第i篇文章,j代表特征性词汇j。N表示与“调神”针灸法有关的全部文献数量,表示“调神”针灸法特征性词汇j在N中出现的次数,s表示“调神”针灸法中特征性词汇的总个数。所有文献中第j个特征词汇的TF-IDF均值,某单词的TF-IDF值越大,则该单词对于“调神”针灸法意义越大。结合TF-IDF值及分词排序加权值(加权关联值),进行聚类及可视化。
2 结果与分析
根据设定好的检索词,通过计算机检索得到“调神”相关针法文献共183 篇,经过再次筛选,将其中符合纳入条件的168 篇录入Jieba分词工具数据库分析,得出16 224 个词汇,计算各分词TF-IDF值,剔除对于研究结果无意义单词,如“医院”“疗效”等;对于意义相近单词,选取TF-IDF值较高者,如“卒中”TF-IDF值0.0450,“脑卒中”TF-IDF值为0.0370,纳入词汇“卒中”,剔除词汇“脑卒中”,具体结果如下。
2.1 “调神”相关针法主治的病机 共提取到“调神”相关针法主治的病机54 项,依据TF-IDF值聚类及可视化处理,可见有两组分词连线较多且线条较粗,分别是脑神-安神-心脾两虚、气血-疏肝-气郁,说明“调神”相关针法主治病机与心、脑、脾、肝失调强相关,着重调节脑、心、脾神,与肝气调达、气血和畅关系密切。见图1。
注:“调神”相关针法主治的病机可聚为3 大类,分别位于3个圆圈内,连线表示分词之间的相互关系,相关性越强,连线越多、线条越粗,越处于核心位次。
2.2 “调神”相关针法适用的疾病及科属 “调神”相关针法在临床运用中包含内科、外科、妇科、皮肤科4 个疾病科属,共34 种疾病,涵盖27 种内科病、3 种外科病、皮肤病妇科病各2种,其中TF-IDF值前3位疾病依次是抑郁(0.0494)、卒中(0.0450)、失眠(0.0300)。见表1。
表1 “调神”相关针法治疗疾病的科属及病种情况
2.3 “调神”相关针法主要腧穴及归经分析 “调神”相关针法TF-IDF值排名前10 位的腧穴从高到低依次为百会、内关、神门、印堂、太冲、三阴交、风府、足三里、合谷;所属经脉为督脉的穴位最多,包括百会、印堂、风府。见表2。
表2 “调神针法”TF-IDF值排名前10位腧穴及所属经脉情况
3 讨论
针灸疗效的发挥和提高与针灸“调神”密切相关,张介宾于《类经》中强调针以治神为首务,曰“医必以神,乃见无形;病必以神,血气乃行”。现有文献中,以“调神”命名、与“调神”相关的针灸法报道多达183 篇,研究角度各有侧重,从众多文献中提炼“调神”相关针法主治的病机、适用的科属病种、主要的选穴归经,对系统阐明“调神”类针法的内涵意义重大。
本研究表明:①“调神”相关针法所主的病机与心、脑、脾、肝失调密切相关。神明之体藏于脑,神明之用发于心[11],心、脑二者共主神明,神又有赖于脾胃之精的滋养与肝对气机的调达。现代研究认为,脑神禀受于先天,涵盖各种“遗传信息”如天赋等,其活动不以人的意志为转移,主要表现在管理感觉、记忆、运动,维持其相关的自稳调节机制等方面;脑神的功能在心神的统领下,具体操控,搜集信息,从而发挥其主宰生命活动、主感觉和肢体运动的功能[12];同时,针灸对脑与肝脾关系的干预可能与脑肠轴理论有关,参与信息传递由胃肠道至脑涉及免疫、神经、内分泌、肠道菌群4 条通路[13]。因此,心、脑、肝、脾任一脏腑有恙皆会令神不得安,诱发相应疾病,包括以髓海不足、神志失养为主要病机的痴呆、失眠、抑郁、卒中、癔病(瘫痪、失语等),由肝、脾气血失和所致的腹泻呃逆,以及因心神失养而出现的“诸痛痒疮”。②在经络与腧穴的选择上,选取与脑关系密切“上额交巅上,入络脑”的督脉,其常用调神穴位(百会、印堂、风府)与心经之神门、心包络之内关、胆经之风池、胃经之足三里将心、脑、肝、脾等脏腑联系起来,既能通达心脑温养神气,又可调和脏腑,使气血得脾之化生与肝之疏利,通过调理经络、气血、脏腑,实现针灸之调神。
文本挖掘技术是数据挖掘技术的一个分支,相较于人工检索海量信息数据库,文本挖掘技术可以更智能、直观地从信息库中快速检索出符合需求的信息,无需用户逐条目筛查,且研究结果通常以结构化数据呈现,便于后期分析,可极大提高临床科研效率[14]。对于文本挖掘而言,特征计算是最重要和基础的环节,目前,数据挖掘技术在针灸领域主要被用于研究针对某一具体疾病的腧穴配伍规律、名老中医经验挖掘、古籍整理等,数据偏于结构化,特征不超过几百。相较之下,“调神”相关针法概念相对模糊,尚无确切定义,其相关文献的文本数据多为非结构或半结构的,转换为特征矢量后特征数巨大,将达到几万甚至几十万。引入TF-IDF这一经典的面向向量空间模型的特征权重计算方法,能有效的表示文本关键词特征,快速处理海量文献[15]。本研究在Python3.6环境下基于分词算法和TF-IDF特征算法,对关键词在“调神”相关针法主题中的重要程度进行表征,并以此进行相关性分析和可视化表达,是对“调神”相关针法相对细致、完整、客观的总结,对针灸临床研究具有一定的借鉴意义。
4 小结本研究引入基于机器学习的文本挖掘技术,通过TF-IDF算法自动寻找文献的特征词汇,得出“调神”类针法主治病机、适用病种、主要选穴归经,三者之间相互联系,结果具有自洽性。