基于本体的生殖医学随访知识库构建研究

2025-02-23 00:00:00霍然周金阳黄林芬李爱芳刘畅
医学信息 2025年1期
关键词:随访知识库

摘要:本文以生殖医学专科随访相关的专科指南、专家共识和专业书籍内容作为知识范畴,结合临床实际随访流程,使用本体构建工具protégé 5.5 构建生殖医学随访知识库,从而将静态文本形式的专科随访相关的医学知识转换成可查询、可推理的知识库,并建立关于生殖随访知识相关概念、属性及其关系的检索模型。通过生殖随访知识库的构建,帮助医护人员快捷识别及精准定位患者的知识需求、并给予标准化、专业化、个体化的宣教建议,旨在为辅助生殖全过程或妇产科等更多领域推广循证支持下的知识库建立提供参考及借鉴。

关键词:辅助生殖技术;知识库;随访

中图分类号:R714;TP391.1" " " " " " " " " " " " " 文献标识码:A" " " " " " " " " " " " " " " DOI:10.3969/j.issn.1006-1959.2025.01.004

文章编号:1006-1959(2025)01-0022-08

Research on the Construction of Reproductive Medicine Follow-up Knowledge

Base Based on Ontology

HUO Ran1, ZHOU Jinyang2, HUANG Linfen1, LI Aifang2, LIU Chang2

(1.Reproductive Medicine Center, the University of Hong Kong-Shenzhen Hospital, Shenzhen 518053, Guangdong, China;

2.Department of Cardiac Surgery, the University of Hong Kong-Shenzhen Hospital, Shenzhen 518053, Guangdong, China;

3.Shenzhen Qianhai Taikang Hospital, Shenzhen 518000, Guangdong, China)

Abstract:In this paper, the content of specialized guidelines, expert consensus and professional books related to reproductive medicine follow-up is taken as the knowledge category. Combined with the actual clinical follow-up process, the ontology construction tool protégé5.5 is used to construct the knowledge base of reproductive medicine follow-up, so as to transform the medical knowledge related to specialized follow-up in the form of static text into a knowledge base that can be queried and reasoned, and establish a retrieval model about the related concepts, attributes and relationships of reproductive follow-up knowledge. Through the construction of reproductive follow-up knowledge base, it can help medical staff quickly identify and accurately locate the knowledge needs of patients, and give standardized, professional and individualized education suggestions, aiming to provide reference for the whole process of assisted reproduction or obstetrics and gynecology and other fields to promote the establishment of evidence-based knowledge base.

Key words:Assisted reproductive technology; Knowledge base; Follow-up

人类辅助生殖技术(assisted reproductive technology, ART)是采用医疗辅助手段使不育夫妇妊娠的技术,包括人工授精(artificial insemination, AI)和体外受精-胚胎移植(in vitro fertilization-embryo transfer, IVF-ET)及其衍生技术,有许多问题值得研究,因而需要大量的原始资料和数据[1]。生殖医学科随访对于实施辅助生殖技术后了解妊娠发展和子代发育情况至关重要,2003年卫生部修订的《人类辅助生殖技术与人类精子库相关技术规范基本标准和伦理原则》明确提出,要求孕早期随访率100%,出生随访率不得低于95%,供精随访率100%[2]。目前生殖医学科的随访工作主要是人工管理模式,具体为临床护士通过短信、微信、电话和面对面随访进行[3]。本研究通过分析和比较知识库的构建方法,结合生殖医学科随访的特点,选择基于本体的“Protégé”七步法[4]构建生殖医学科随访知识库,旨在提高临床随访工作的效率,贮存并分析相关数据,帮助医护人员快捷识别及精准定位患者的知识需求、并给予标准化、专业化、个体化的宣教建议,同时也为其他专科建立相关知识库提供借鉴依据。

1本体的构建

1.1确认本体概念" 目前被广泛认可的定义是1993年斯坦福大学Gruber[5]提出的“本体是概念化的明确的规范说明”。本体具有强语义特性,能够以直观、图形化的方式来展示领域知识,有助于知识共享[6]。构建本体是为了获取相关领域的知识并对该领域知识达成共同理解,明确该领域内共同认可的概念,定义这些概念之间的相互关系,通过明确这些概念之间的相互关系来描述概念的语义,甚至实现知识库与案例库的对应自动构建[7]。在本研究中,本体是人类辅助生殖技术的随访。

1.2构建工具" 目前国际上有多种构建本体的方法,包括KACTUS法、七步法、“骨架”法、TOVE法、Meth-Ontolog法等[8]。其中美国斯坦福大学医学院提出的Protégé七步法应用最广泛,其基本流程包括:①确定本体的专业领域和范畴;②考察复用现有本体的可能性;③列举领域术语;④定义表达概念的类;⑤定义类的对象属性;⑥定义类的数据属性;⑦创建实例[9]。Protégé具有可视化编辑界面,可以直接生成形式化编码,支持多种格式,也可自定义符合实际需要的各类属性[10],且该软件还有开源、免费获取、支持中文输入、可视化图表输出等优势。因此本研究使用Protégé 5.5作为构建工具来建立生殖医学科随访知识库。

2生殖医学科随访知识库的创建

2.1确定本体的专业领域和范畴" 本研究建立的本体是生殖医学科随访知识库,其应用场景为护士对所有接受辅助生殖技术的患者进行术后随访,即本体主要面向开展随访的护理人员,以及接受辅助生殖技术的患者。本体的使用对象为生殖医学科的专职随访护士,专业领域包括生殖随访的时间节点、辅助生殖技术分类、常见检查、治疗、术后并发症、孕期保健等相关信息[11]。研究者从护士和患者双方对随访沟通的需求出发,通过归纳生殖医学科规范教材、最新指南等内容,利用本体技术进行生殖医学科随访领域本体的构建,重点梳理生殖医学科的疾病、分类、治疗、检查、围手术期准备、并发症等相关知识概念并建立语义关联,设计并构建生殖医学科随访系统本体的知识库检索模型,将静态的文本形式的专科指南转换成可查询、可推理的知识检索系统,对生殖医学科随访知识进行语义推理和查询,为临床医护人员了解患者术后妊娠及生育情况提供便利有效的方式,也为患者了解相关疾病知识及围手术期注意事项提供科学完整的查询途径。

2.2考察复用现有本体的可能性" 本研究以全国辅助生殖技术规范化培训教材中的《辅助生殖护理技术》及《辅助生殖的伦理与管理》的内容为依据,参考中英文医学主题词表Mesh、国际疾病编码系统ICD-10等,具有较好的准确性、实用性及循证性。

目前国外常用的本体知识库包括UMLS和SNOMED CT等,一体化医学语言系统(unified medical language system, UMLS)由美国国立医学图书馆研发,是由生物医学概念所构成的全面广泛的叙词表和本体[9]。SNOMED CT是世界上最全面的医学临床术语集之一,可用于完整表达病史、疾病、治疗和效果等患者相关信息[12]。国内最早在医学领域引入本体理论的课题是由中国科学院技术研究所曹存根教授负责的国家知识基础设施(National Knowledge Infrastructure, NKI)[13],其中子集 NKIMed(医学知识库)是以常见疾病为知识来源构建领域本体,客观描述了疾病症状、临床诊断、治疗方法以及用药之间的关系。基于本体论体系的中医药一体化语言系统(Traditional Chinese Medical Language System, TCMLS)是将UMLS架构融入中医药学语言特点及学科体系中,是我国第一个计算机化、可拓展的中医药术语本体库[14]。经过对国内外常用本体库的检索,尚无生殖医学科随访的相关本体知识库,故无法复用现有本体。

2.3列举领域术语和定义表达概念的类" 列出辅助生殖技术随访的重要概念,在深入理解专业指南的基础上,梳理和归纳总结出生殖医学科随访的重要概念,定义出辅助生殖随访的类,对于概念术语,也即是类的名称确定,参考了上述第二步中所列的词表和本体,以保证所选取概念的规范性。经过梳理,归纳出疾病概念、临床表现、检查项目、治疗、并发症、预防、家庭社会支持7个子类的相关概念158个,主要如下:

疾病概念:不孕症、不育症、卵巢储备功能下降、多囊卵巢综合征、子宫内膜异位症、生殖器官发育异常、性发育异常、生殖器官肿瘤、不孕合并垂体功能障碍、不孕合并甲状腺功能异常、不孕合并糖尿病、不孕合并肾上腺皮质功能异常、复发性流产、原因不明性不孕症等。临床表现:月经史、婚育史、不孕年限等。检查项目:超声检查、激素检查、其他影像学检查等。治疗:诱导排卵、控制性卵巢刺激、人工授精、体外受精胚胎移植、植入前遗传学诊断、卵母细胞体外成熟技术等。并发症:卵巢过度刺激综合征、取卵后出血、取卵后感染、盆腔脏器损伤、异位妊娠、多胎妊娠、多部位妊娠、出生缺陷等。预防:肥胖、嗜好烟酒、流产、污染、压力等。家庭社会支持:积极心态、正向信念、人际交往、夫妻关系、爱与情感、家庭共同体、家庭支持、社会支持等。

通过阅读相关文献,如《临床诊疗指南—辅助生殖技术与精子库分册》《不孕症与辅助生殖》《医脉通》等图书及生殖医学科相关最新研究进展文献获取专业领域知识。结合需求分析,通过与生殖中心护士和患者进行个人面谈、观察随访工作过程、进行问卷调查、分析相关文献、组织专家讨论等形式,深入了解护士和患者双方对随访知识的需求,生殖医学科随访知识库的核心内容应包括患者、疾病、手术方式、并发症、术前宣教、术后宣教、术后随访宣教。其中疾病主要包括男性不育和女性不孕;手术方式主要包括人工授精、取卵手术、胚胎移植技术、冷冻胚胎移植技术;并发症主要包括感染、出血、宫外孕、多胎妊娠、卵巢过度刺激综合征(OHSS)。根据领域本体的框架设计,本研究采用从上至下的分类开发模式(top-down development process)[15],先列举知识库的核心类(一级类),再对每一个核心类进行扩充(子类),利用Protégé 5.5建立知识库要先明确和创建类别和其子类(图1)。

2.4定义类的对象属性和数据属性

2.4.1等级关系" 等级关系指上位类与下位类之间的关系[16],包括:①整体-部分关系:整体概念是上位词,部分概念是下位词,如“并发症”由“OHSS”“出血”“多胎妊娠”等多个部分组成;②属种关系:普通概念与专指概念的关系,下位类与上位类是继承关系,继承上位类的所有属性,如“检查”包括“体格检查”“化验检查”等;③并列关系:表示在同一上位类所属的同层次的子类,如“手术”中的“人工授精”和“取卵手术”为并列关系;④实例关系:子类是上位类的具体的实例,如“禁食禁水”是“术前宣教”的实例。

2.4.2相关关系" 相关关系指除等级关系以外的、具有强烈关联的关系[16],包括:①治疗关系:关注辅助生殖技术中人工授精、胚胎移植等具体治疗方法;②并发症关系:关注手术并发症、发病原因、预防机制等;③诊断关系:包括疾病、并发症的诊断和分级;④并发症关系:并发症分类、诊断及治疗方法等;⑤表现关系:临床表现、症状、患者主诉等。

2.4.3数据属性" 类的数据属性(data property)即类自身所拥有的特征,用于描述概念自身的固有属性,如果一个类拥有某一属性,则这个类的子类和它的实例均有此种属性[8]。在Data/Object Property的编辑界面有4个窗口,分别为“Data Property Hierarchy”(数据属性层次结构)、“Object Property Hierarchy”(对象属性层次结构)、“Annotation”(注解)“Characteristics”(特征)和“Description”(描述)。因此,在进行属性构建时,作者对拥有某种属性的最大的类添加了数据属性,如患者的姓名、年龄、性别、联系方式等都是患者自身固有的属性(图2)。疾病类型包括男性不育和女性不孕,而定义和临床表现是疾病自身的固有属性,未额外定义它们与疾病的数据属性关系。

2.4.4对象属性" 类的对象属性(object property)是类的另外一个重要属性,对象属性也叫关系属性,连接两个个体实例[17]。通过对象属性可以建立两个个体之间的关系,是连接个体的桥梁。对象属性是可以自行定义的,如患者“被诊断”疾病、手术“treat”疾病、手术“导致”并发症,手术“提前做”术前宣教、手术“术后做”术后宣教,手术“出院做”术后随访(图3)。因类的属性不同,需要明确类与类之间的概念独立性和准确性[18]。

此外Protégé系统提供的描述语言如资源描述框架(Resource Description Framework Schema, RDFS)和OWL(Ontology Web Language)也可通过定义类以及类的属性来形式化某个领域,并说明它们之间的属性,以便对类和个体进行推理[19]。

2.5对类通过数据属性和对象属性进行约束和关联" 例如在手术方式中选择“人工授精”,它可能会导致并发症:多胎妊娠和宫外孕,其术前准备包括:①请夫妻携带双方身份证、结婚证原件准时到达辅助生殖中心;②术前请排空膀胱;③勿化妆、勿涂指甲油、勿佩带手饰、勿携带贵重物品;④丈夫当日需留取精液。所有关于人工授精的约束和关联因素都可通过“Subclass of”进入“Object restriction creator”选项选择对象属性建立对应关系并可通过“Usage”界面进行查看(图4)。手术后不同情况的随访时机也不同,可以通过设定随访时机进行关联(图5)。对于数据属性可通过“Subclass of”进入“Data restriction creator”选项对其的取值类型进行限制。例如患者“姓名”的取值类型是“xsd:name”,“定义”是通过字符体现的,所以它的取值类型是“xsd:string”[20](图6)。

2.6定义属性分面" 属性分面是指属性的属性,例如属性的类型、取值范围等[21]。本研究的本体模型的对象属性主要是患者、临床表现、疾病、诊疗方式、不良反应等之间的关系。例如患者的诊断均为不孕症;临床表现及并发症均与患者相关;诊断需要对应的检查项目作为金标准进行确认;不良反应一定在药物或手术治疗之后发生等。本研究定义的属性信息如下(表1)。

2.7创建实例" 在“Entities”下选择“individuals”创建实例,例如“张三”是“患者”,年龄“38岁”,性别“女”,联系方式“189****4321”(图7)。创建一个手术方式“人工授精”的实例,则相对应的关系自动比配(图8)。Protégé图谱可视化,点击“OntoGraf”选项通过视图显示出各类别及各个子类之间的关系(图9)。

3总结

将本体理论和知识库技术结合起来,通过Protégé 5.5把静态文本形式的临床指南转换成方便提取及分析的知识库,构建了生殖医学科随访本体知识库。其本体包括不孕症的诊断分型、治疗方式、术前宣教、术后宣教、并发症、随访的时机和内容等知识概念,建立了关于生殖医学科随访知识相关概念、属性及其相关关系以及知识库的检索模型,为患者查询相关信息及根据患者需求实现人工智能随访提供依据。

本体知识库的研究近年来是各医学及相关领域研究的热点,而在Protégé下建立的辅助生殖或妇产科方向的知识库实例较少,其可行性和专业性仍有待临床实践验证。生殖医学科的随访工作是辅助生殖技术实施后了解手术成败及预后发展的重要途径,其随访过程的标准化、信息收集的准确性对专科诊疗有着重要的临床意义,尤其受到业内的关注和重视。专业的、可推理的专科知识库可为构建人工智能的随访系统奠定基础,通过Protégé 5.5的软件技术和方法,结合生殖医学科随访的工作流程,可将指南、专家共识和书籍等静态文本形式的知识转变为可查询、可推理的知识库系统,从而建立生殖医学科随访知识库,帮助医护人员更快捷地识别及精准定位不孕症患者的治疗进程、知识需求并给予标准化、专业化、个体化的宣教建议。本项目通过生殖随访知识库的建立与运用,为辅助生殖全过程或妇产科更多应用领域推广循证支持下的知识库建立提供参考,也为其他医学专科知识库系统的开发提供借鉴意义。

参考文献:

[1]方颖,付旻,王筠.辅助生殖术后患者随访的信息化管理[J].中国妇产科临床杂志,2020,21(1):77-78.

[2]中华人民共和国卫生健康委员会.卫生部关于修订人类辅助生殖技术与人类精子库相关技术规范、基本标准和伦理原则的通知[EB/OL].(2003-06-27)[2023-09-02].http://www.nhc.gov.cn/bgt/pw10303/200708/68ba58984aba4a44 a3bcf74b0c3e2048.shtml.

[3]程静娴,王春艳,王婕妤.辅助生殖夫妇婚姻状况的影响因素及其对妊娠结局的影响[J].中华全科医学,2023,21(5):744-748.

[4]Amith M,Roberts K,Tao C.Conceiving an application ontology to model patient human papillomavirus vaccine counseling for dialogue management[J].BMC Bioinformatics,2019,20(21):706.

[5]Thomas RG.Toward principles for the design of ontologies used for knowledge sharing[J].International Journal of Human - Computer Studies,1995(43):5-6.

[6]崔晓英,宋双,翟倩雯.精准医学时代下中医特色生物资源样本库的建设探析[J].江苏科技信息,2020,37(9):25-27.

[7]盛姝,黄奇,郭进京.基于知识库与案例库的在线健康社区诊疗解决方案自动推理模型研究[J].情报科学,2022,40(5):161-172.

[8]于凡.基于本体的糖尿病管理知识库的构建研究[D].北京:北京协和医学院,2018.

[9]Betsy HL,Mark TS.Something New and Different:The Unified Medical Language System[J].Studies in Health Technology and Informatics,2022,288:100-112.

[10]胡海斌,李青,胡章荣.基于Protégé的学科本体构建研究[J].福建电脑,2017,33(10):7-8.

[11]吴蔓,姚娟,雷晓静.阶段性追踪随访管理在人类辅助生殖技术患者护理质量管理中的应用[J].中国生育健康杂志,2018,29(3):253-255.

[12]Luke R.SNOMED CT: working smarter, not harder[J].The British Journal of General Practice,2023,74(727):77.

[13]曹存根.国家知识基础设施的意义[J].中国科学院院刊,2001(4):255-259.

[14]尹爱宁,张汝恩.建立《中医药一体化语言系统》[J].中国中医药信息杂志,2003,10(3):90-91.

[15]André TS,Milton SO,Eduardo IY.Developing a rigid frame wheelchair in Brazil[J].Disability and Rehabilitation: Assistive Technology,2021,16(5):538-544.

[16]温斌斌,常春.基于词间关系的叙词表术语翻译[J].中华医学图书情报杂志,2019,28(5):6-10.

[17]崔一迪.寻常型银屑病中医诊疗本体知识库的构建与应用[D].北京:中国中医科学院,2020.

[18]赵励彦,范贞,刘瑞爽.生物样本库的伦理审查[J].中国医学伦理学,2020,33(3):345-348.

[19]Consortium WWW.OWL Web Ontology Language Guide[EB/OL].(2004-02-10)[2023-09-02].https://www.w3.org/TR/owl-guide

[20]刘志,郝克俊.基于Protégé的人工影响天气术语本体知识库设计与实现[J].中国科技术语,2019,21(6):17-23.

[21]万润之,孙丽平,王延博,等.小儿肺炎喘嗽本体知识库构建研究[J].中国医药导报,2021,18(36):183-188.

收稿日期:2023-08-07;修回日期:2023-09-04

编辑/肖婷婷

基金项目:1.广东省医学科研基金项目(编号:A2020291);2.香港大学深圳医院院内科研培育项目(编号:HKUSZH201901009)

作者简介:霍然(1982.5-),女,吉林长春人,硕士,主任护师,主要从事临床护理、护理信息化、妇产科护理研究

猜你喜欢
随访知识库
汉语近义词辨析知识库构建研究
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
美国高校机构知识库开放获取政策调查
图书馆建设(2018年8期)2018-08-31 02:20:56
新生儿高胆红素血症与听力损伤的研究进展
保守方法治疗儿童轻度脊柱结核的疗效分析及预后随访
腹腔镜根治性膀胱切除术治疗膀胱癌的近期疗效及半年随访分析
90例新生儿肺透明膜病数字X线摄影床边胸片特征及疗效分析
右江医学(2016年4期)2017-01-05 16:15:03
三维适型放疗联合肝动脉栓塞化疗治疗原发性小肝癌的疗效观察
高速公路信息系统维护知识库的建立和应用
梅毒诊断治疗中值得注意的问题
上海医药(2016年9期)2016-06-03 22:55:54