中医疾病的命名规则研究❋

2022-06-09 13:00杨丽娜祖亮华罗晓兰朱邦贤
中国中医基础医学杂志 2022年5期
关键词:病位术语病因

李 明, 周 强, 杨丽娜, 祖亮华, 罗晓兰, 朱邦贤△

(1.上海中医药大学科技人文研究院中医方证信息研究中心, 上海 201203;2.上海中医药大学中医药国际标准化研究所,上海 201203;3.上海中医药大学图书馆,上海 201203)

中医疾病名称形成于中国古代,是中医学在数千年临床实践中逐渐发展起来、在对疾病本质认知过程中凝炼而成的概念集群,它反映了中医对某一病种的本质及其特征的基本认识,并在发展过程中赋予了时代和社会的烙印。

中医对疾病的命名最早可以追溯到长沙马王堆的《五十二病方》《阴阳十一脉灸经》等中医古籍,这些古籍被认为是现知我国最古的医学方书,成书年代约为战国至秦汉之际。在这些出土的医书中,已经出现了概念化的疾病名,如“厥、痈、疽、疣、疥、庀、癃”等,并且出现了以身体部位为主的疾病命名方式。如《阴阳十一脉灸经》中的“踝蹶(厥)、骨蹶(厥)、臂蹶(厥)、骭蹶(厥)、阳蹶(厥)”等,《五十二病方》中的“尻厥”等[1]。《黄帝内经》同样成书于战国至秦汉之际,但应该晚于《五十二病方》,此时期与“厥”组配的词语明显增多,病因病机、疾病名、经络、身体部位、数字等均可以与“厥”进行组配。如“寒厥、热厥、痿厥、痹厥、少阴厥逆、巨阳厥逆、臂厥、肝厥、四厥”等。中医疾病的命名还有部分是通过寓意来命名,如宋·张杲《医说·疾证》记载:“古之论疾,多取象比类,使人易晓”[2],如蛇头疔、蟹睛、蛤蟆瘟、鹭鸶咳等以动物的特征命名,杨梅疮、葡萄疫、石榴疽、瓜藤缠等以植物的特征命名。

目前,中医疾病术语的规范化、标准化研究大都只是关注疾病名称整体上的规范化、标准化,忽略了疾病名称中涵盖的病因、病机、病位、症状等中医基本理论词语的语义概念,以及疾病名称中包含的动词、数量词、颜色词、动植物寓意词等词语的语义概念,中医疾病名称正是通过这些语义概念的相互组配才形成了如今的中医疾病名称。

在大数据和人工智能时代,我们更加需要含有丰富语义信息的语义词典,并能够让计算机“理解”中医疾病名称所含有的语义,才能更加有效地开展中医语义分析、数据推理、临床决策辅助等人工智能的研究。因此,本研究采用本体研究方法,从中医疾病命名规则和语义组配角度,开展中医疾病标准的研究,探讨适用于人工智能等现代信息技术的中医疾病标准化研究方法。

1 资料与方法

1.1 资料与数据来源

本研究以《中医病证分类与代码》(GB/T 15657-2021)[3]中收录的中医疾病名称为数据来源。上述标准共收录了1369个术语,其中中医疾病相关术语1316个,中医症状相关术语54个[4]。由于部分疾病名还收录了同义词,本研究通过人工梳理共选取了1935个中医疾病名。

1.2 研究方法

本研究利用python和jieba分词工具,对中医疾病名进行中文分词,将疾病名解析为症状、病因、病机、身体部位、动词、程度词、性质词、颜色词等不同的词素,分析疾病术语名称的词素构成,从本体和语义学角度,开展中医疾病术语的命名规则和组合模式研究。

1.2.1 自建字典 由于jieba分词自带的字典有关中医的词汇很少,同时jieba分词是按照名词、动词、形容词等词性进行词语标注。然而,本研究需要从中医理论的角度对中医疾病名进行语义标注,因此本研究需要创建符合中医理论特色的自建字典,并按照中医属性设置语义标注符号。本研究共收集和整理23个类别的730个字词作为自建字典,对部分自建字典的类别及其标注符号进行了比较(如表1)。

1.2.2 语义解析 本研究通过python调用jieba分词模块对《中医病证分类与代码》收录的1935个中医疾病名进行分词,然后将标注符号转化为对应的名称,之后人工审核疾病名称的组合模式(如表2)。

2 结果

本研究对新版《中医病分类与代码》国家标准中收录的1935个中医疾病名进行了字数统计分析,中医疾病名称中2~4个字组成的疾病名占整个疾病的90.54%。同时根据对上述标准的语义解析结果,分析中医疾病名的主要命名规则和方法有如下几种。

2.1 单字或单字+“病”命名模式

本研究中单字类命名的中医疾病名共46个,约占总数的2.3%。如疣、癣、疖、疔、痈、发、疽、漏等单字使用表示疾病的名称,以及诸如暑、温、疫、瘴等病因概念,哮、喘、汗等症状概念,及眦等病位概念加“病”的组配方式命名。此类模式命名的中医疾病如暑病、温病、疫病、瘴病,哮病、喘病、汗病,眦病等。

表1 自建字典中医类别及标注符号

表2 中医疾病名命名规则解析示例

2.2 病因命名模式

本研究中,单纯以病因要素命名的疾病名约200个,约占10.3%。该命名方法的优点是可以通过病名推断疾病的主要病因,而以病因命名的疾病主要分为如下几类。

2.2.1 单病因或多病因组合 以六淫或疫疠等外感病因或痰饮等病因间相互组配而形成的中医疾病命名模式,如暑风、风温、暑温、疫疠、寒疫、温疫、风瘟、暑瘟、湿温、湿瘟、疠风、痰饮、痰毒等,或者在该模式下在末尾添加“病”字,如温燥病、凉燥病、寒燥病等。

2.2.2 动词+病因组合 如伤风、冒暑、伤暑、中暑、冒湿、伤湿、伤寒、中风等。

2.2.3 病因+动词组合 如暑闭、湿阻、虫螫、蛇犬伤等。

2.2.4 时间+病因组合 如春温、暑温、秋燥、冬温、春瘟、冬瘟等。

2.2.5 形象寓意+病因组合 如龟背痰、鹤膝痰、蛤蟆瘟、鸬鹚瘟、鹤膝风、驴嘴风、葡萄疫等。

2.2.6 病因+颜色组合 如瘟黄、疫黄、火丹等。

2.2.7 寄生虫、血吸虫等+“病”组合 如蛔虫病、绦虫病、寸白虫病、囊虫病、钩虫病、蛲虫病等。

2.2.8 动物致伤命名 如虫螫、松毛虫伤、蠼螋伤、射工伤、狂犬病、猛兽伤等。

2.2.9 其他物体致伤命名 如漆毒、水毒等。

2.3 病机命名模式

本研究数据中,单纯以病机命名的疾病名并不多见,如虚劳病、虚损病、气脱病、液脱病、血脱病、精脱病、蓄血病、血溢病、溢血病、痰饮等。

2.4 症状命名模式

本研究中包含症状的疾病名约129个占总数的6.6%。在中医疾病名称中,单纯以症状命名的疾病主要分为如下几类。

2.4.1 单个或多个症状组合 如脱臼、哮病、喘病、水肿病、咳嗽病、腹胀病、泄泻病、便秘病等。

2.4.2 特定时期+症状组合 如小儿顿嗽、五更泻、经间期出血、经行吐衄、经行发热、妊娠眩晕、妊娠咳嗽、产后痉病、产后瘖、子满等。

2.4.3 性质描述+症状组合 如暴泻、暴咳病、暴咳、暴喘、晚期产后出血、急惊风、慢惊风、暴聋、暴瘖、暴喑等。

2.4.4 时间+症状组合 如久泻、久泄、百日咳、百晬嗽等。

2.4.5 颜色+症状组合 如黄肿病、黧黑斑等。

2.4.6 形象寓意+症状 如鹭鸶咳、杨梅疹、田螺疱、雀斑等。

2.5 病位命名模式

本研究中,包含身体部位或形态结构的疾病名约837个占总数的43.26%。其中,单纯以部位或形态结构与动词、修辞性词语等命名的模式约161个占总数的8.32%,该命名模式主要可以分为如下几类。

2.5.1 病位+“病”组合 如颈椎病、腰椎病、筋骨病、黑睛病、白睛病等。

2.5.2 病位+动词组合 如锁子骨断伤、骨错缝、肾垂、阴缩、脏躁、乳头破碎、脐带缠绕、胞轮振跳等。

2.5.3 动词+病位组合 伤筋、闪腰、缩阴、转筋、裂肛、漏胎、滑胎、转胞、漏睛等。

2.5.4 颜色与病位组合 如白喉、肝黄、灰指甲、胎黄、臀红、眼丹等。

2.5.5 形象寓意与病位组合 如鱼口、酒糟鼻、象皮腿、鸡眼、鳝拱头、葡萄胎、雪口、耳菌等。

2.6 形象寓意命名模式

如狐臭、雀目、蟹目、鸡眼、蟹珠、霍乱、臭田螺、鱼口、百合病、蛇丹、狐惑等。

2.7 病位+疾病命名模式

本研究中,采用身体部位或形态结构加疾病的命名模式约297个占总数的15.3%,是所有命名模式中最常见的一种命名模式,该命名模式主要可以分为如下几类。

2.7.1 病位+疾病组合 如肺痨、脑痨、肝痨、肾痨、肠痨、骨痨、腕疽、足跟疽、喉痧、肩痹、项痹、胸痹、心痹、心厥病、心厥等。

2.7.2 动词+病位+疾病组合 如搅肠痧、烂喉痧、噤口痢、含腮疮、恋眉疮、托腮痈、锁喉痈、附骨疽、咬骨疽、漏睛疮、断耳疮、锁肛痔等。

2.7.3 寓意+病位+疾病组合 如牛皮癣、蛇皮癣、蛀发癣、鱼脐疔、龟头痈、鹅口疮等。

2.7.4 特定时期+病位+疾病组合:如小儿烂喉丹痧、产后子宫脱垂、初生儿脐疮、小儿口疮等。

2.8 病位+症状命名模式

本研究中,采用身体部位或形态结构加疾病的命名模式约105个占总数的5.4%,如心悸、心痛、腹胀、腰痛、头痛、肝痞、胆胀、胃痞、胃胀、脾胀、胰胀、肺咳、肺胀、面瘫、面痛、乳衄、胁肋痛等。骨折和脱位类疾病的命名大多采用此类方式命名,如锁骨骨折、缺盆骨损折、锁子骨断伤、井栏骨折断、肩胛骨骨折、颞颌关节脱位等。还有一些是采用性质+病位+症状命名模式,如急喉喑、慢喉喑等。另外一些采用部位、症状、寓意组合的命名模式,如胞肿如桃、蟹足肿、鱼睛不夜等。

2.9 病位+病因命名模式

本研究中,采用身体部位或形态结构加疾病的命名模式约86个占总数的4.3%,该命名模式主要可以分为如下4类。

2.9.1 病位+病因组合 如肝瘟、肝热病、踝关节扭伤、心瘅、肾风、头风、喉风、腿风、脏毒、四弯风、委中毒等。

2.9.2 动词+病位+病因组合 穿拐痰、锁喉风、漏肩风、抱头火丹、缠腰火丹、穿腮毒等。

2.9.3 性质/程度+病位+病因组合 急性腰扭伤、慢脾风、急喉风、大头瘟、大脚风、软脚瘟等。

2.9.4 方位、寓意、特定时期等与病位、病因组合 如偏头风、雷头风、小儿软脚瘟等。

2.10 结合现代医学的命名模式 如缺血性中风、出血性中风等。

3 讨论

在人工智能时代,人们对医学标准的要求已经发生了改变,信息技术已经深入到医疗的各个方面,因此编制适合现代信息技术利用的医学标准便成为医学术语标准的新趋势。虽然,中医疾病名称字面上的规范化、标准化已经可以满足临床诊断、卫生统计、病案管理等方面的需求。但是从自然语言处理、数据挖掘等人工智能的角度而言,中医疾病名称粒度太粗,难以开展深层次的数据挖掘和数据分析。在大数据和人工智能时代,我们更加需要含有丰富语义信息的语义词典,并能够让计算机 “理解”中医疾病名称所含有的语义,如伤风、风厥、风赤疮痍等中医疾病名称中的“风”均指病因“风”,然而“风轮赤豆”中的“风”则不是指病因。

本研究采用本体的研究方法,从症状、病因、病机、身体部位、性质、程度、颜色、动物、植物等不同的维度对中医疾病名进行了解析,分析了中医疾病名称的词素构成,探讨了中医疾病的命名特征,从语义组配的角度开展了中医疾病术语的命名规则和组合模式研究。

本体是一种以术语为研究基础的现代信息学研究方法,主要研究概念与概念间的相互关系,是各学科知识工程领域引起广泛关注的研究发展方向,也是国际医学标准研究的热点和发展趋势。本体通过概念和概念间关系的确定,可以将某领域的知识体系用形式化语言描述出来,达到知识领域信息共享与重用的目的。由于基于本体的表达方式能被计算机更好地识别与利用,也就更有利于对该领域知识的深度挖掘和应用。因此,开展基于本体的中医疾病标准化研究也是中医信息化、智能化的基础研究。

在通用领域,wordnet、hownet等语义词典在文本自动处理、语义分析、数据挖掘等人工智能领域发挥了重要作用。在医学领域,基于本体方法构建的SNOMED CT是国际上比较成熟的医学临床术语本体,是一个基于语义组配的概念体系。SNOMED CT的全称是Systematized Nomenclature of Medicine--Clinical Terms(医学系统命名法——临床术语),其在决策支持、数据挖掘、医疗研究等领域应用广泛[5]。2019年5月25日第72届世界卫生大会审议通过的《国际疾病分类第十一次修订本(ICD-11)》也采用本体方法编制新版的医学术语标准,该标准还首次纳入起源于中医药的传统医学[6],共收录了250个中医疾病相关的术语及284个中医证候相关的术语[7]。

因此,从中医疾病名称的命名规则和语义组配的角度,开展基于本体方法的中医疾病标准体系建设,不仅有利于准确理解中医疾病的内涵,也是对中医疾病名更加深入的规范化、标准化研究,对引领中医疾病术语标准体系的国际标准发展态势,有效促进和规范中医药国内外交流,凸显我国传统医学在人类卫生与健康促进事业上的地位与作用,都具有重大的研究意义。

猜你喜欢
病位术语病因
老年眩晕患者的病因分析及治疗
不同病因新生儿惊厥临床特征分析
术后早期炎症性肠梗阻的中西医结合治疗案例举偶
中医对痛风的认识
消渴病合并抑郁症之病位探析
汉字小门诊系列(六)
汉字小门诊系列(五)
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势