统计分析在甲状腺超声诊断数字化管理系统中的应用

2016-02-06 20:23于佳祝丽娜李绚璇王冬梅青岛海慈医疗集团功能检查科山东青岛266033
中国卫生产业 2016年13期
关键词:数据挖掘管理系统变量

于佳,祝丽娜,李绚璇,王冬梅青岛海慈医疗集团功能检查科,山东青岛 266033

统计分析在甲状腺超声诊断数字化管理系统中的应用

于佳,祝丽娜,李绚璇,王冬梅
青岛海慈医疗集团功能检查科,山东青岛266033

近年来,随着超声数字化水平、存储技术、计算机技术等关联技术的发展,许多医院开始着手构建超声诊断数字化管理系统,以辅助疾病管理。甲状腺疾病是临床常见病,超声是甲状腺疾病筛查、诊断、疗效评估等重要技术,获取信息十分丰富,这些数据具有较大挖掘价值,在甲状腺疾病超声智能诊断、流行病学分析、病因与发病机制等研究中具有较高的价值。统计分析在甲状腺超声诊断数字化管理系统中发挥关键作用,可供选择的数据挖掘方法包括关联规则、集对分析、粗糙集理论、聚类分析等,可供选择的统计学方法包括Logistic回归分析、因子分析与主成分分析、典型相关分析、结构方程模型、线性混合模型、最大似然判别,目前我国医学统计学仍处于较低水平,数据挖掘利用水平远远不足,卫生工作者应努力掌握更加专业的统计学理论、方法,提高自身统计应用水平。

甲状腺疾病;统计学分析;超声诊断数字化管理系统

[Abstract]In recent years,with the development of ultrasound digital level,storage technology,computer technology and other correlation technology,many hospitals begin to build ultrasound diagnosis digital management system in order to assist disease management,the thyroid disease is the common disease in clinic,and the ultrasound is the important technology of screening,diagnosis and curative effect evaluation of thyroid disease,and it can obtain rich information,and the data are of biggermining value and are of higher value in intelligent diagnosis of thyroid ultrasound,analysis of epidemiology and research of pathogeny and pathogenesis,and the statistical analysis is vital to the thyroid ultrasound diagnosis digital management system,the available datamining methods include correlation rule,setpair analysis,rough set theory and cluster analysis,the available statistical methods include Logistic regression analysis,factor analysis,principal component analysis,canonical correlation analysis,structural equation model,linear mixed model and maximum likelihood discriminant.At present,the medical statistics of our country is still at a lower level,the datamining use level remains far from adequate,and the health workers should make an effort to master more specified statistical theory and method and improve their own math application level.

[Key words]Thyroid disease;Statistical analysis;Ultrasound diagnosis digital management system

甲状腺疾病是临床常见病,发病率高达4%,其中绝大多数都需要经超声诊断。近年来,甲状腺癌、甲状腺肿发病率逐年上升。超声医学是物理学、医学与电子工程技术相结合的一门学科,在甲状腺等疾病诊断中具有重要价值,定性诊断甲状腺良恶性疾病符合率约为80%~90%,近年来弹性超声、高频超声等技术的应用,极大地提高超声诊断效用,在甲状腺疾病筛查、诊断中的价值无可替代[1]。迈入21世纪,数字化、信息与计算机飞速发展,并在医院信息管理领域得到广泛的应用。超声诊断数字化信息十分庞大,信息管理需求加强,超声诊断数字化管理系统便是在这种背景下孕育而生,在流行病学管理、超声智能诊断等领域发挥关键作用,给临床工作带来巨大的便利,但遗憾的是许多医学工作者统计学分析能力欠佳,导致发表的文献错用误用统计学方法等许多问题[2]。数据挖掘是超声诊断数字化管理系统运用的基本工作,其中大量应用医学统计分析,该研究就此进行概述,总结统计学分析在甲状腺超声诊断数字化管理系统中的应用价值与方法。

1 甲状腺超声诊断数字信息

超声诊断甲状腺疾病数字信息十分庞大,特别是近年来超声诊断技术飞速发展,不仅二维超声、彩色多普勒超声等常规超声技术不断发展进步,弹性显像、高频超声等技术也得到广泛应用,图像由二维图像向三维、四维图像转变,这些技术也都已应用于甲状腺疾病诊断。鉴于甲状腺疾病高发,医院甲状腺超声诊断信息十分惊人。甲状腺超声诊断基本信息包括:①形态学信息结节形态、边界、包膜、纵横比、边缘光滑程度等,部分医院利用计算机辅助诊断系统中还可能有圆形度、平均方向数、归一化径向长度标准差、粗糙度等信息;②衰减信息特征,后部回声是超声诊断甲状腺结节的重要依据,衰减系数是超声诊断基本的信息;③纹理特征信息,根据数据计算方式,数据的形式、内容繁多;④其他信息,如血流流速、频谱等信息,组织弹性应变值等。

2 统计分析在甲状腺超声诊断数字化管理系统中的应用

2.1统计分析在数据挖掘中的应用

甲状腺超声诊断信息庞大,呈现多模式特征,一定程度上增加了数据挖掘难度,部分信息体现出的客观不完整、描述疾病主观不确切,进一步增加了信息的复杂性。数据挖掘的意义在于从数据中发现有意义的知识,以总结甲状腺超声特征信息,或用于预测未来趋势,进行前瞻性的决策。不同医院超声诊断数字化管理系统收集信息受医院需求、设计者设计思路影响,统计学处理的软件以SPSS系列为主,目前可供应用的数据挖掘方法包括关联规则、集对分析、粗糙集理论、聚类分析等。

2.1.1关联规则 关联规则是最常用的研究方法,侧重于数据中不同领域的关系研究,满足给定条件下的多个域间的依赖关系,如甲状腺肿疾病形态学信息之间的关系,根据一个事物中某些数据项可以导出另一些数据项。在甲状腺超声诊断中,大量出现的形态学、组织学、物理学相关信息十分复杂,关联规则可找出相关联的各个数据,但某个信息总是同时出现时,可以找出某种疾病的规律,甚至是疾病发生进展规律[3]。当然,关联规则可能并不能反映临床实际情况,两组信息存在关联但并不代表这种关联具有临床意义。

2.1.2集对分析与粗糙理论 不确定性是自然界与人类社会普遍存在的一种客观现象,对于超声诊断更是如此,超声诊断并不是诊断“金标准”,不可避免存在误漏诊。集对分析可作为统一处理模糊、随机、中介和信息不完全所致的不确定性。其对不确定性的处理思路简要概括可分为“客观承认、系统描述、定量刻画、具体分析”,借助对系统中不确定性与确定性相互关系,以及一定条件下相互转化的过程描述,处理不确定性在具体条件下的取值规律。如针对甲状腺弹性应变值,受扫查切面、仪器性能等因素影响,取均值也不能保证完整真实可靠,某些超声主观评价结果较模糊或不一致。集对分析职能在系统层次上,可与解决精确问题方法相结合,扬长避短。粗糙集理论为研究不精确数据分析、推理、挖掘数据间的关系,发现潜在的关联性提供了行之有效的工具,将其引入到超声诊断,可为智能化诊断提供一种方法,通过以患者一般情况、症状、超声信息,建立信息表,采用差别矩阵法等获得上下近似集,抽取确定规则、可能规则,以辅助诊断,避免可临床医师主观性、片面性[4]。

2.1.3聚类分析 聚类分析是超声诊断系统信息管理最常用的数据挖掘策略,通过分析变量之间的线性关系,按照相似程度进行归类,将具有共线性关系的变量聚类分析到一类,从而达到降维目的。聚类分析应用于甲状腺超声诊断信息,有助于寻找某一个给定条件下,具有共性特征的超声信息特征,如恶性甲状腺肿瘤超声特征群。

2.2统计方法

2.2.1Logistic回归分析Logistic回归分析可分为非条件与有条件两种,前者适用于队列研究、成组病例对照组资料分析,后者适用于配比设计病例对照组研究资料分析[5]。甲状腺超声诊断信息十分庞大,其中可供对照研究的信息包括性别组、年龄组、良恶性组等,通过进行对照、队列研究,利用标准偏回归分析绝对值可了解各自变量对甲状腺疾病的影响。通过大量的回顾性分析超声诊断信息,可采用判别分析、回归分析建立超声诊断信息与“病种”之间的判别函数,以达到筛查、诊断目的。Logistic逐步归因分析考虑每一个变量与诊断树每一个树杈对“病种”的贡献,符合临床逻辑思维过程,更接近临床实际。

2.2.2因子分析与主成分分析 因子分析是对多个指标变量,用少数几个潜在指标的线性组合表示,综合反映全部变量的大部分信息,虽然这些变量原始变量少,但包含的信息量可占原始信息的85%以上,且这些新变量可信度仍较高,而且这些新变量彼此之间并不相干,可消除多重共线性[6]。R型因子分析是指指标变量做的因子分析,对观测的个案所做的因子分析叫做Q型因子分析,两者结合得到对应分析,可同时揭示观测对象、指标变量两方面的结果。通过随机调查足够足量的甲状腺超声诊断信息,利用SPSS软件建立数据模型,进行实性因子分析(CFA),结果经2-n因子分析,其中某n个因子分析可与临床实际(甲状腺主要病种)相符,根据结果排序,以标准回归系数作为疾病的界值,可划分不同甲状腺疾病超声诊断信息群。

2.2.3典型相关分析 典型相关分析是研究两组变量相关关系的一种多元统计方法,应用于甲状腺超声诊断信息处理,可揭示病种实质,通过希望了解的病种与客观指标的相关关系,利用典型相关分析,可将病种作为一组变量,某一个超声诊断信息作为一组变量,分析疾病信息与超声诊断信息相关性,了解推测客观指标变化情况。

2.2.4结构方程模型 甲状腺恶性特征并非一个可以准确的、直接测量的变量,这种变量可称为潜变量,通过对纵横比等外显指标,间接测量这些潜变量,结构方程模型可分析潜变量复杂关系,用来寻找各种疾病相应的主要超声诊断信息[7]。

2.2.5线性混合模型线性模型主要包括线性回归模型、方差分析模型、协方差分析模型、方差分量模型等。方差分量模型不同于其他固定效应模型,其中含有部分效应为随机变量。混合模型的一种表示形式为:Y=Xβ+ Zu+e,Y是n×1的观测向量,β为p×1的非随机未知参数向量,成为固定效应,X、Z分别为n×p和n×q已知的设计矩阵,u和e分别为q×1、n×1随机向量,u为随机效应,e为通常意义上的误差。通过随机抽取甲状腺超声诊断信息,所有信息并非这些个体本身的特征,而是整个甲状腺超声诊断综合体特征,将单个甲状腺超声诊断信息产生的个体效应看作随机而引入模型,可提高模型的精度。线性混合模型在超声辅助诊断、目标预测中具有较高的价值,如以某一个时间段发病人数作为Y,既往任何一种甲状腺疾病、不同时间段诊断人数作为自变量,可构建线性混合模型,以预测未来某一个时间段就诊人数值域。

2.2.6最大似然判别 最大似然判别法最好用于计数资料的判别分析,用于甲状腺超声诊断数字化信息处理,基本原理是,计算某一种甲状腺疾病各相关超声计量信息的条件概率,再将条件概率转化为指数值,按照相对指数值大小对相关因素进行赋分,其与因素回归分析主要差别在于因变量不是定量的。在获得新的一组自变量(超声诊断客观信息)后,依据方程组计算概率值,判断该组数据来自于哪一个类别的概率最大,从而判断该组数据来自于哪一类。最大似然判别特别适用于病例样本较大的数据,得出的数据频率较稳定,作为目标指标评价指标要多,则判断而定准确率越高。最大似然判别法可与计量学中概率换算法进行结合。

3 结语

统计研究是卫生领域作用工作内容,有报告显示全世界约80%的数字信息是医学信息。我国人口众多,医学信息十分庞大,一方面为开展医学统计学工作提供了更丰富的材料;另一方面对统计工作者业务能力提出了更高的要求[8]。医学统计在公共卫生、临床等领域发挥重要作用,卫生工作者应努力提升自身的统计学知识水平,以提升挖掘数据、处理数据,提升自身科研能力。

[1]詹维伟.甲状腺结节的超声诊断进展[J].中华医学超声杂志,2011,8(6):1170-1179.

[2]何庆勇.临床论著中常见统计学错误辨析[J].中国中医基础医学杂志,2011,15(7):552-553.

[3]王华,胡学钢.基于关联规则的数据挖掘在临床上的应用[J].安徽大学学报:自然科学版,2006(30):21-25.

[4]张文修,吴伟志.粗糙集理论与方法[M].北京:科学出版社,2003:22-23.

[5]王济川,郭志刚.Logistic回归模型—方法与应用[M].北京:高等教育出版社,2001:9.

[6]王芳.主成分分析与因子分析的异同比较及应用[J].统计教育,2003(5):14.

[7]侯杰泰,温忠麟,成子娟.结构方程模型及其应用[M].北京:教育科学出版社,2004:13-14.

[8]赵耐青.医学统计学[M].高等教育出版社,2004:1.

Application of Statistical Analysis in the Thyroid Ultrasound Diagnosis Digital Management System

YU Jia,ZHU Li-na,LI Xuan-xuan,WANG Dong-mei
Functional Inspection Department,Qingdao Haici Medical Group,Qingdao,Shandong Province,266033 China

R73

A

1672-5654(2016)05(a)-0178-03

于佳(1982.1-),女,山东青岛人,本科,住院医师,主要从事超声诊断方面的工作。

王冬梅(1983.12-),女,山东青岛人,本科,住院医师,主要研究方向:超声诊断,E-mail:wangdongmei1108@163.com。

2016-02-04)

猜你喜欢
数据挖掘管理系统变量
基于James的院内邮件管理系统的实现
抓住不变量解题
探讨人工智能与数据挖掘发展趋势
也谈分离变量
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于LED联动显示的违停管理系统
停车场寻车管理系统
海盾压载水管理系统
分离变量法:常见的通性通法
高级数据挖掘与应用国际学术会议