张颖,马秀兰,艾合买提·阿不都热依木,李静茹,曾琳,马建萍,孙奇1,2
(新疆维吾尔自治区中医医院新疆国家中医临床研究基地乌鲁木齐830000)
基于共享系统开展新疆地区HIV感染者中医证候分布特征的相关性研究*
张颖,马秀兰,艾合买提·阿不都热依木,李静茹,曾琳,马建萍**,孙奇1,2**
(新疆维吾尔自治区中医医院新疆国家中医临床研究基地乌鲁木齐830000)
目的:基于临床科研信息共享系统,以新疆地区HIV感染者为研究对象,对其中医证候分布特征进行数据挖掘分析。方法:利用我院临床科研信息共享系统构建数据库(数据来自2011年5月-2012年3月间1151份格式化电子病历),通过Oracle、ETL软件进行数据处理,采用数据可视化分析进行数据挖掘。结果:新疆地区HIV感染者证候分布相对集中的气虚湿阻、气阴两虚、肝肾阴虚、肝郁气滞四大类。气虚湿阻证候年龄相对集中在20-30岁范围内,女性居多,性传播感染者比重较大。气阴两虚证候年龄相对集中在30-40岁范围内,男性居多,静脉吸毒感染者比重较大。各证候中维吾尔族人群比例均占较大比重。病程与证候的变化关系按1年、3年、5年分层分析体现了实证、虚实夹杂证、虚证由实至虚的传遍转化规律。结论:利用临床科研信息共享系统可用于临床大数据的处理,挖掘的结果可用于指导临床实践,为中医临床科研提供很好的平台。
共享系统HIV感染者中医证候分布特征
临床科研信息共享系统是在中医药规范化、标准化的基础上,充分利用信息网络技术、数理统计、数据挖掘等方法建立的一个以病人为中心,以结构化电子病历为手段,整合数字化、规范化医院信息资源,构建的一种高效管理和分析利用中医临床复杂海量数据的技术系统,是开展真实世界中医临床研究的前提和基础[1]。新疆是艾滋病疫情较为严重的省区之一,新疆维吾尔自治区中医医院作为国家中医临床研究基地的建设单位,临床科研信息共享系统是国家中医临床研究基地业务建设的重要内容之一。为进一步分析新疆地区HIV感染者证候分布特征,揭示其中医证候分布规律,本研究结合新疆地区HIV感染者中医证候规范化与客观指标的流行病学调查,应用共享系统对新疆地区HIV感染者中医证候分布特征进行数据挖掘分析。根据流调数据实际使用环境,建立重点病种艾滋病本地化标准术语字典和病历模板,使用结构化电子病历系统进行数据采集,建成相应数据库,引进数据挖掘技术,进行数理统计和数据分析,实现基于艾滋病中医医疗与临床科研信息共享系统的应用研究。
1.1 数据来源
2011年5月-2012年3月,新疆地区6个疫情高发区的1151例HIV感染者。年龄分布于18-71岁,平均35.32±8.15岁。男性735例,女性416例,男女比例为1.77:1。病程分布在0-18年,平均2.75±2.72年。
1.2 数据采集
由两名中医副高以上职称、一名调查员、一名质控员组成调查组,运用随机整群分层抽样的方法采集病历,填写相应的调查表,获取研究对象的基本信息、病历信息及相关实验室检查信息。通过对调查表的研究分析,抽提重要信息,结合临床和科研两方面的需求特点,建立新疆地区HIV感染者中医证候规范化与客观指标流行病学调查相关信息术语字典及病历模板,完成数据录入人员操作培训,使用结构化电子病历系统进行数据采集。
1.3 数据预处理
数据的存放和管理由Oracle软件实现,数据的抽取、清洗、加载由ETL软件实现。
1.4 数据挖掘分析方法
中医证候分布采用构成比和率进行描述性分析。证侯作为观察变量,按照分层因素描述证候构成。在相同证候中,计算不同分层因素的相关矩阵。采用数据可视化分析,呈现不同年龄、性别、民族、病程、感染途径的证候分布特点。
2.1 新疆地区HIV感染者中医证候分布
此次调查证候分布相对集中在气虚湿阻、气阴两虚、肝肾阴虚、肝郁气滞四大类,见表1。其中气虚湿阻、气阴两虚、肝肾阴虚三类证候例数较多,分别占被调查总数的20.85%、18.07%、9.73%。
2.2 不同年龄中医证候分布
对调查的主要证候按照年龄进行分层分析。年龄分布集中范围为20-70岁人群,其中最小年龄18岁,最大年龄71岁,结果见图1。年龄在20-30岁范围内气虚湿阻证较多,年龄在30-40岁范围内气阴两虚证较多。
2.3 不同性别中医证候分布
对调查的主要证候按照性别进行分层分析,结果见图2。统计学分析看出,不同性别的主要证候分布无差别,两人群中医证候的规律一致。男性中医证候相对集中在气阴两虚证,共计186人,占被调查总数的17.06%;女性中医证候相对集中在气虚湿阻证,共计102人,占被调查总数的9.36%。
2.4 不同民族中医证候分布
对调查的主要证候按照民族进行分层分析,见图3。从统计学分析中可以看出,不同民族主要中医证候分布无差别,各证候中维吾尔族人群均占较大比重。
2.5 不同病程中医证候分布
本调查病程分布在0-18年,平均年龄35.32岁,其中最短病程为最新确诊病例,最长病程为17.5年,见图4。病程小于1年的患者肝郁气滞证较多,病程1-3年的患者气虚湿阻与气阴两虚证均多见,病程3-5年的患者气虚湿阻证较多,5年以上的患者气阴两虚证较多。
2.6 不同感染途经中医证候分布
对调查的主要证候按照感染途径进行分层分析,见图5。气虚湿阻证候中性传播感染者居多,共计121例,占被调查总数的11.10%。气阴两虚证候中静脉吸毒感染者居多,共计122例,占被调查总数的11.19%。肝肾阴虚证候中静脉吸毒感染者与性传播感染者均为56例,占被调查总数的5.14%。气虚湿阻证候中性传播感染者比重较大,气阴两虚证候中静脉吸毒感染者比重较大。
随着大数据时代的到来,科学数据的产生和积累呈指数级增长,中医药在几千年防治疾病的过程中积累了丰富的临床经验,形成了许多行之有效的方法和技术,必须主动利用这一变化来进行战略性创新,满足需求,创造未来。随着对临床医学研究方法的逐渐深入和医疗实践的迫切需要,真实世界研究越来越受到关注[2]。临床科研信息共享系统使医疗实践和计算机结合起来,在真实世界中通过海量数据挖掘解决实际问题。以临床医疗数据流的结构化采集为核心,以数据质量管理体系建设和术语的规范化研究为前提,利用现代信息技术,全面采集临床诊疗信息,实现以患者为中心的所有临床信息的纵向和横向整合,形成了“以数据为导向”的真实世界中医临床科研新模式[3]。
表1 中医证候分布
图1 不同年龄中医证候分布
图2 不同性别中医证候分布
图3 不同民族中医证候分布
图4 不同病程中医证候分布
本次研究应用科研信息一体化共享系统进行数据挖掘分析结果表明,新疆地区HIV感染者中医证候分布相对集中在气虚湿阻、气阴两虚、肝肾阴虚、肝郁气滞四大类。按照年龄、性别、民族、病程、感染途径对证候进行分层分析,气虚湿阻证候年龄相对集中在20-30岁范围内,女性居多,性传播感染者比重较大。气阴两虚证候年龄相对集中在30-40岁范围内,男性居多,静脉吸毒感染者比重较大。各证候中维吾尔族人群比例均占较大比重。病程小于1年的患者肝郁气滞证候较多,病程1-3年的患者气虚湿阻与气阴两虚证候均多见,病程3-5年的患者气虚湿阻证候较多,5年以上的患者气阴两虚证候多见。综上所述,新疆地区HIV感染者主要分布在青壮年阶段,尤其以30-40岁最多,男性居多,维吾尔族居多,静脉吸毒与性传播为主要传播途径。结合社会经济发展,该年龄阶段为创造社会价值的最佳阶段,但是由于HIV感染,使得患者对于创造社会财富的能力受到影响。由于艾滋病是一种慢性消耗性疾病,当病毒入侵人体,不断损伤人体正气,故气虚是艾滋病患者的共性症状。但新疆地区患者多兼湿阻,考虑与新疆地区居民饮食习惯有关。因喜食烤炙肉食导致脾胃损伤,运化失职,湿浊内生,遂成气虚湿阻证,故调查的主要证候为气虚湿阻证。病程与证候的变化关系体现了实证、虚实夹杂证、虚证的传遍转化,反映出疾病变化发展的相对规律。
图5 不同感染途经中医证候分布
科研信息一体化共享系统的高度集成化,中医临床术语的标准化,病历模板的规范化,对科研数据实时自然形成与挖掘分析,建立整个流程管理机制,给中医临床服务与中医科学研究的科学化、系统化带来了变革,探索了一条中医临床服务与科研需求统一的新路径,开创了一个新的科研模式,为拓宽科研思路奠定了基础[4]。同时,本研究通过共享系统提取临床科研中所需数据,省却了以往纸质化科研重复的劳动,不仅节省了科研工作时间,也提高了科研工作的准确性,减少了大量人力物力投入,通过共享系统病历信息优化采集的方式,解决新疆地区感染人群分布分散,县、乡等基层单位医疗科研信息匮乏的问题,推动了本地区中医个体诊疗临床实践和研究的水平。同时,积累了大量中医临床经验无形资产,实现了临床科研全面协同,保证了中医临床数据全流程、全方位平滑连接、共享和交换,为中医临床科学研究多维信息查询、在线分析处理、数据挖掘和决策分析提供了有力的支持[5]。
中医学是以临床诊疗实践为基础的学科,在临床诊疗实践过程中积累的大量有价值的数据和文献资料是中医学的宝贵财富。在真实世界中利用临床实际数据开展临床研究,从大规模数据中归纳获得临床有用或具备理论意义的知识,是形成创新知识和临床决策的有效技术手段,能够充分挖掘中医几千年来潜在的宝贵精华,为制定中医相关决策和诊疗方案提供技术支持和基本保障[6]。随着更多的类似数据的加入,借助基地的临床科研共享系统数据中心,形成中医大数据,挖掘出我们中医诊疗规律,从而指导临床[7]。目前全国有多家临床基地开展科研信息一体化共享系统,前期基础已做好,但后期的工作和工作升华仍需要我们继续努力,再接再厉。临床科研信息一体化平台的实现必将为中医临床研究提供新思路和新技术,促进中医学术思想的升华和创新。
1赵明,陈颖,王海岩.基于共享系统对冠心病心绞痛取效核心中药的研究.吉林中医药,2013,33(7):749-753.
2余海滨,符宇,李卓,等.基于临床科研信息共享系统开展中医临床研究的探索.中医杂志,2013,54(24):2092-2094.
3谢雁鸣,毛平,田峰,等.真实世界研究在中药上市后临床再评价中应用前景的探讨.中药新药与临床药理,2010,21(5):324-327.
4宋红梅,刘保延,何丽云,等.基于中医药临床科研一体化的数据挖掘需求与数据前处理方法.中国中医基础医学杂志,2011,17(12): 12-17.
5胡铁骊,胡智勇,陈南,等.基于乙型肝炎相关性肝衰竭(肝瘟)中医临床与科研信息共享系统的构建与应用.世界科学技术-中医药现代, 2013,15(5):838-842.
6赵明.基于共享系统开展证候要素相关研究.长春中医药大学学报, 2013,29(6):1104-1105.
7胡金亮,李素云,张兴红,等.基于复杂网络AECOPD证候分布及中药组合研究.世界科学技术-中医药现代,2015,17(6):1268-1273.
Correlational Study on Traditional Chinese Medicine Syndrome Distribution Characteristics of HIV Infection in Xinjiang Region Based on Information Sharing System
Zhang Ying,Ma Xiulan,Aihemaiti·Abudureyimu,Li Jingru,Zeng Lin,Ma Jianping,Sun Qi
(Xinjiang Region Traditional Chinese Medicine Hospital,National Clinical Research Base of Traditional Chinese Medicine,Xinjiang 830000,China)
This paper was aimed to study traditional Chinese medicine(TCM)syndrome distribution characteristics of HIV infection in Xinjiang region based on the Clinical Medical Research Information Sharing System(CMRISS). CMRISS was used to establish a database(data were from 1151 hospital electronic medical records from May 2011 to March 2012).Oracle and ETL software were used in the data processing.Visualization analysis was used in the data mining.The results showed that syndrome distribution of HIV infection in Xinjiang region was concentrated in four categories with the blockade of dampness due to qi deficiency,deficiency of both qi and yin,yin deficiency of liver and kidney,and the stagnation of liver qi.The syndrome of blockade of dampness due to qi deficiency was relativelyconcentrated in the range of 20-30 years old,with the majority of female population.The proportion of sexually transmitted infection was more.The syndrome of deficiency of both qi and yin was relatively concentrated in the age range of 30-40 years old,with the majority of male population.The large proportion of infection was due to intravenous drug use.Among different TCM syndromes,Uyghur population occupied relatively large part.Stratified analysis on disease course due to the change of TCM syndrome according to 1 year,3 years and 5 years revealed the disease development rule from excess syndrome,deficiency combined with excess,to deficiency syndrome.It was concluded that the application of CMRISS was able to process a large amount of clinical data.The data mining results can be used to guide clinical practice.It provided a better platform for the scientific research of TCM clinical practice.
Clinical Medical Research Information Sharing System(CMRISS),HIV infection,traditional Chinese medi⁃cine syndrome,distribution characteristics
10.11842/wst.2017.04.022
R02-3
A
(责任编辑:郭嫦娥,责任译审:王晶)
2017-01-17
修回日期:2017-04-01
*科学技术部国家科技重大专项课题(2014ZX10005003):艾滋病和病毒性肝炎等重大传染病防治-中西医结合治疗艾滋病应用技术研究,负责人:马建萍。
**通讯作者:马建萍,主任医师,主要研究方向:艾滋病中西医防治研究;孙奇,讲师,主要研究方向:医学统计学。