3种主流现代解剖学本体的器官表征特点对比分析研究*

2024-03-15 08:01姚克宇杨啸林
医学信息学杂志 2024年2期
关键词:解剖学术语层级

付 璐 姚克宇 杨啸林 朱 彦

(1中国中医科学院中国医史文献研究所 北京 100700 2中国中医科学院中医药信息研究所 北京 100700 3中国医学科学院/北京协和医学院基础医学研究所 北京 100005)

1 引言

人体解剖学是研究正常人体各部分形态、结构、位置、毗邻、结构与功能关系的科学[1]。人体解剖结构与人体的生理、病理密切相关,是生物医学知识的重要组成部分。解剖学本体用符号信息表征人体结构的解剖知识点,并能模拟、推导各知识点关系的解剖术语、关系、规则的集合,即以计算机系统可理解、推演的形式表征解剖学知识[2]。本文介绍目前3种主流的解剖学本体医学系统命名法——临床术语标准(SNOMED CT,SCT)、跨物种解剖本体(Uberon)和解剖学基础模型本体(The foundational model of anatomy ontology,FMA)的核心类及层级关系,通过对比3种解剖学本体关于器官的术语关系、分类方式及概念/类的定义,以期为传统医学身体结构的本体构建提供一定的参考。

2 SCT本体(身体结构部分)

2.1 概述

SCT是当前国际上广为使用的一种临床医学术语标准,由国际医疗术语标准发展组织管理发布[3]。SCT基于本体理论,以概念为核心,构建以描述、概念和关系为基础构件的术语模型,对医学概念进行逻辑定义[4-5]。

SCT在国际临床医学数据分析研究中应用较广,许多医疗信息化的系统均基于其体系构建。SCT涵盖大部分临床诊疗相关术语,包括疾病、药品、医疗操作等,临床中主要针对电子健康记录及临床信息系统,用于患者诊疗信息的收集、存储、处理及提取[6]。此外,医疗信息化研究人员从学术研究角度将现有医院的代码系统、分类或术语映射到SCT或参考其核心架构,支持更高效的医疗数据分析和知识建模[7]。

2.2 术语类型及层级关系

SCT术语概念目前有19个顶层分类,每个层级概念进一步细分为多个次级概念层,形成树状结构[8]。其中“身体结构”部分涵盖解剖学子本体,包括“解剖或后天获得的身体结构”“由原来的解剖结构演变成的异常身体结构”等8个主要子类,可囊括人体正常情况、出现病理变化或者接受器官移植等多种情况下的解剖结构。“解剖或后天获得的身体结构”主要分为 “解剖结构”和“后天获得的解剖结构”。具体的解剖结构按照颗粒度由粗到细进一步分为身体区域、系统、器官、组织、细胞等,如“解剖空间结构”“身体器官结构”“身体区域结构”“身体系统结构”“身体组织结构”“细胞结构”。其中,器官主要依照其功能结构的不同分为“消化器官”“呼吸系统器官”“血管”“皮肤”“脑和脊髓”等。

2.3 器官的概念表征

SCT对身体结构表征的核心模型是SEP三元模型,主要包括3个核心部件:“结构(S)”“整体(E)”及“部分(P)”。整体概念:其实例为完整的解剖实体。例如“整体肺”囊括所有肺的实例。部分概念:其实例为某种解剖实体的真子部分。例如“部分肺”的实例囊括某肺脏的所有真子部分实体:“患者A的肺毛细血管结构”“患者B的肺间质组织结构”等。需要注意的是“部分肺”并非“肺”的实例。实体结构概念:是整体概念及部分概念的上位概念,囊括解剖实体的整体或部分的全部实例,例如“患者A的肺”“患者A的肺毛细血管结构”“患者B的肺间质组织结构”等。

SCT对器官的表征同样采用SEP三元模式,以肺为例,见图1,包括“肺结构”“整体肺”和“部分肺”3个核心概念。对于某些左右各一的双侧器官,如双肺、双肾、双眼等,通过定义“偏侧”关系,进一步分为左侧、右侧及双侧的概念,如“整体肺”包含“整体左肺”和“整体右肺”等子类;“肺结构”的子类包括“左肺结构” 和“右肺结构”。“整体左肺”和“左肺结构”均与“左侧”具有“偏侧关系”。“双肺”则属于“成对的解剖结构”。需要注意的是,当前版本未见“双肺”与“左肺”“右肺”“肺结构”“整体肺”“部分肺”的概念关联。

图1 SCT中 “肺”“左肺”及“双肺”的层级关系

3 Uberon本体

3.1 概述

Uberon是一个综合的跨物种解剖本体,按照常规的解剖分类标准分类。Uberon的特点是与现有以物种为中心的多种解剖学本体广泛关联,支持人类和其他物种的数据整合,为跨物种的解剖结构知识推断奠定基础。其使用一种全新的方法搭建解剖学分类,对分析人体表型的变化具有重要意义[9]。

Uberon关注物种差异。由于多种人类特有的疾病(尤其是罕见病)无法利用动物造模,只能依据动物模型的表型特征-基因等信息进一步推测人类的表型基因特征。而Uberon的优势在于将物种特异性和临床解剖、组织的本体联系起来,因此可用于多物种的数据整合。如多物种数据分析平台Monarch Initiative,提供一个系统来组织和协调在临床和模式生物、非模式生物资源中发现的异质基因型-表型数据,从而为来自多物种的基因数据创建统一的描述[10]。该平台在建设中主要参考了Uberon本体、统一表型本体、基因本体等,其中Uberon本体主要用于构建不同物种解剖实体之间的关联性。

3.2 术语类型及层级关系

Uberon目前版本包含6 500多个类,囊括解剖系统、器官、组织等不同粒度的解剖学实体,支持多物种解剖结构的概念表征。每个类均以URI作为唯一标识。术语来源包括学术论文、教材、百科全书、医学词典和专家共识等。在Uberon的4 692个定义中,有2 293个与维基百科页面引用关联,其余引自哺乳动物表型本体、GO、FMA、PubMed ID或标准教科书等[11]。

Uberon将解剖实体分为非物质解剖实体和物质解剖实体。物质解剖实体可进一步分为解剖集合、解剖结构、解剖表面区域等。解剖集合主要用于描述成对或者属于一套系统的解剖结构,例如双肺、鼻孔等。解剖结构包含解剖边界、解剖组、解剖系统、多细胞解剖结构等。

3.3 器官的概念表征

在Uberon 本体中,器官属于多细胞解剖结构,子类主要依据器官的功能分类,如生殖器官、呼吸器官、免疫器官等,如肺属于呼吸器官,淋巴组织属于免疫器官。

器官概念表征的常见关系包括is a,part of和develops from,如“肺泡”与“肺”之间的关系表征为 “pulmonary alveolus SubClassOf part_of some lung”,表示每个肺泡都是肺的一部分,但并非所有的肺都有肺泡。

对于偏侧器官的表征常采用生物空间本体的关系,如“in left side of”“in right side of”“in lateral side of”等,用于定义双边对称或成对结构的侧半部分。如“肺”是一种“偏侧结构”,同时属于“双肺”的一部分,位于双肺的偏侧。“左肺”与“肺”“双肺”的关系为:左肺是一种肺,左肺是位于双肺左侧的肺,具体关系,见图2。

图2 Uberon中“双肺”“肺”及“左肺”的层级关系

4 FMA本体

4.1 概述

FMA是由美国华盛顿大学结构化信息研究组开发的精确表征人体解剖结构基础知识的领域本体,是一个不断发展的基于计算机的生物医学信息学知识源。其主要目标是以人类和计算机均可理解的方式表征人体表型结构必需的类或类型及其关系。具体来说,FMA确保在不同应用中表示解剖学类名称时的一致性,其本体论框架可以应用并扩展到所有物种[11]。

与SCT相比,FMA主要用于表型正常人体解剖结构的相关概念。目前 SCT中与正常人体解剖相对应的大部分术语已与FMA 建立了映射关系,且FMA 术语覆盖的颗粒度更细[12]。

4.2 术语类型及层级关系

FMA本体由7.5万解剖类、13万术语以及来自168个关系类型的约210万语义关系实例构成,与SCT、Uberon等词表存在概念与术语的交叉[13]。FMA包含“解剖实体”“属性实体”“空间实体”等8个主要类别。颗粒度最大的解剖类为“人体”,其他颗粒度如“主要身体部分”“器官系统”“器官” “细胞”等,直至最小的解剖类“生物分子”,包含建模整个人体结构所需的所有解剖类及关系。

4.3 器官的概念表征

FMA中器官的上层结构为“解剖结构”,主要依据器官的解剖形态分为“实体器官”和“空腔器官”两大类。实体器官包括“实质性器官”和“非实质性器官”。如肺、肝等属于实质性器官,韧带、肌肉、筋膜等属于非实质性器官。空腔器官包括“带有空腔的器官”和“带有部分空腔器官的器官”。如胃、肠、膀胱、子宫等属于带有空腔的器官,骨骼、海绵体等属于带有部分空腔器官的器官。

FMA对偏侧器官的表征较简略,如将“左肺”和“右肺”归类为是一种“肺”,未见与Uberon相映射的“偏侧结构”的概念。“双肺”则属于“成套的解剖物质”,与肺和左肺的概念未见关联,具体层级关系,见图3。

图3 FMA中 “双肺”“肺”及“左肺”的层级关系

5 3种本体对于器官概念的映射及特点

根据源于Uberon本体的数据库交叉引用数据,以肺相关的术语为例,比较分析3种本体的特点,见图4。

图4 SCT、Uberon、FMA中 “肺”“左肺”及“双肺”的概念表征

5.1 器官的层级分类

关于器官的上层结构,Uberon、FMA及SCT皆认为器官的概念属于解剖结构。但值得注意的是,Uberon中的解剖结构“anatomical structure(UBERON_0000061)”、FMA中的解剖结构“anatomical structure(FMA:67135)”与SCT中整体解剖结构“362889002|entire anatomical structure(body structure)|”的概念为同义词,而SCT中的解剖结构“91723000|anatomical structure(body structure)|”概念在层级上涵盖了整体解剖结构的概念。而在器官的下层结构中,SCT与Uberon主要依据器官功能分类,如呼吸器官、泌尿器官等;FMA则主要依据器官解剖形态分类,如空腔器官、实质器官等。

5.2 器官的术语映射

SCT主要采用SEP三元组表征模型将器官分为“器官结构”“整体器官”和“部分器官”,如将“肺”分为“肺结构”“整体肺”“部分肺”。关于三者的术语映射关系,Uberon和FMA中器官的概念与SCT中整体器官的概念相同。例如,Uberon和FMA中肺“lung(UBERON_0002048)”“lung(FMA:7195)”的概念对应SCT中整体肺“181216001|entire lung (body structure)|”的概念;同样,Uberon和FMA中左肺的概念与SCT中的整体左肺“361982005|entire left lung (body structure)|”相对应。

5.3 偏侧器官的关系构建

关于成对的器官,三者的表征形式较相近,如SCT中双肺上层结构为“成对的解剖结构”,Uberon中双肺的上层结构为“解剖集合”,FMA中双肺的上层结构为“成套的解剖物质”。偏侧器官与器官的关系均表征为“is a”的关系,如“左肺”是一种“肺”。值得注意的是,在偏侧器官与双侧器官的关系构建中,SCT和FMA中的双侧器官与偏侧器官均无关联,而Uberon中的双侧器官与偏侧器官存在“in lateral side of”“in left side of”“in right side of”的方位关系。

6 结语

人体解剖学知识作为生物医学知识的重要组成部分,其规范化和形式化的表征为生理、病理、疾病等微观宏观知识的表征奠定了基础。本文分析对比目前3种主流解剖学本体关于器官的设计模式、分类结构及映射关系等,有助于学习和了解当前成熟本体的构建方法,为其他领域本体的研究和构建提供参考支持。

中医学的“脏腑”概念与现代医学“器官”的概念存在一定关联,但其内涵更为丰富。除器官的解剖结构之外,另有中医生理功能和四时五行等生理属性的含义存在,且与经络、气血、阴阳等身体结构及物质基础存在密切关联。主流解剖学本体对于构建器官的层级关系、器官与器官之间的关系,以及偏侧与双侧器官的表征有丰富启示,在借鉴解剖本体概念表征模式的同时,后续将结合中医学理论特色与中医身体结构的概念特点,构建涵盖解剖形态、生理功能、生理属性的中医身体结构本体,结合临床实际应用,为中医药领域本体集的构建与应用奠定基础。

利益声明:所有作者均声明不存在利益冲突。

猜你喜欢
解剖学术语层级
军工企业不同层级知识管理研究实践
基于军事力量层级划分的军力对比评估
CBL结合微课在神经解剖学实验教学中的应用
任务期内多层级不完全修复件的可用度评估
解剖学教师培养模式的探索
正常人体解剖学知识竞赛的规划设计与组织开展
不同教学模式在人体解剖学教学中的应用与探讨
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势