程华玲
[摘要] 该文探讨和研究在医院病案统计分析中采用数据仓库技术的应用效果。通过对医院信息系统数据的挖掘和分析发现,数据挖掘技术和数据仓库目前处于初步阶段,存在发展潜力。认为应用数据仓库技术可使医院信息系统更完善,能提高统计工作的效能,在医院管理中提供比较重要的科学依据。
[关键词] 数据仓库技术;医院病案统计;应用研究
[中图分类号] R197.32 [文献标识码] A [文章编号] 1672-5654(2019)12(b)-0163-03
Application Research of Data Warehouse Technology in Statistical Analysis of Hospital Medical Records
CHENG Hua-ling
Department of Medical Records, Jurong People's Hospital, Jurong, Jiangsu Province, 212400 China
[Abstract] Discuss and study the application effect of data warehouse technology in the statistical analysis of hospital medical records. Through the mining and analysis of hospital information system data, it is found that data mining technology and data warehouse are currently in the preliminary stage and have potential for development. The application of data warehouse technology can make the hospital information system more perfect, improve the efficiency of statistical work, and provide more important scientific basis in hospital management.
[Key words] Data warehouse technology; Hospital case statistics; Applied research
病案统计是医院管理工作中比较重要的部分,而且已经成为医学发展的学科,它将不断促进医院管理体系的发展。病案统计信息是临床工作中最为原始的记录资料,同时也关系着患者在接受治疗时和治愈后的工作总结。在这个过程中,其总结工作的好坏直接反映医务人员日常工作的效果以及管理的水平。因此病案统计的原始资料及统计分析的再生数据资料,对医院管理的决策发挥着重要的作用。随着医院信息系统工作的不断运用,病案统计的查询工作逐渐复杂,而且统计的信息量也逐渐增多,病案分析工作速度大大降低了,无法满足病案统计的工作需求,因此要寻求一种比较有效的方式促进病案统计分析工作[1]。而数据仓库技术的出现,恰恰满足了病案统计工作的需求。数据仓库技术是用科学的方式整理数据,从不同角度对医院病案统计进行分析,可以精确分析和准确判断。该文通过以下几个方面叙述数据仓库技术在医院病案统计分析中的应用效果,旨在宣传当今顺息万变的大数据时代,应用数据仓技术势在必行。
1 医院病案统计分析中出现的问题
1.1 在查询过程中速度比较慢
随着医院信息量的增大,在信息管理系统的运营过程中,数据量逐渐增多,在查询分析过程中具有一定的复杂性,最终导致统计查询的速度降低,无法满足工作的效率,同时历史的数据也无法充分运用。而且系统管理的技术是属于传统的数据库,因此在平时的工作中,无法满足增多的信息量,使历史的数据脱离系统管理。而且传统数据库的统计比较单一,难以符合决策性的需求[2]。
1.2 病案统计分析工作不健全
当前医院病案统计分析系统是十几年前安装使用的老程序,随着医疗技术水平的提高和一些新病种的出现,各种新的疾病治疗方法、技术和新的手术项目应运而生,系统对这些新内容无法识别和更新,或者系统储存容量不够,在检索和分析病案数据资料时,会丢失部分数据或者根本查不到该有的信息(经常有医生来说帮查一下收治的几份重要和特殊病例但病案室查不到),有时信息还会互串和重叠。导致数据统计缺乏真实性,势必影响整个医院的发展[3]。
1.3 在病案统计分析工作中基础建设比较薄弱
在经济不断发展的今天,医院信息统计方面的需求不断增加,在病案统计分析工作中,信息统计不规范,其建立的信息数据不健全,确保不了质量。部分人员对待工作责任心不强,因此病案统计分析工作存在疏忽和漏洞[4]。
2 采用数据仓库技术的作用
對传统的数据仓库系统而言,在进行数据统计和分析时只能用于平时的数据统计,而对于辅助决策的数据分析工作是无法完成的,而数据仓库技术在分析数据方面具有比较大的优势。传统的数据分析满足不了病案统计工作,直接影响病案统计分析工作的价值。而数据仓库技术可以在传统数据技术的基础上提升管理需求,在数据仓库技术开展下,将病案中的各类数据、信息等相互结合起来,重新建立新型的信息知识库。分门别类的实现统计分析的目的,同时可以在医疗工作中实施非数字的信息安排,也能进一步提高病案中数据统计的利用率。数据仓库技术的实施,可以有效的识别出大量数据中最有用的数据并进行分析。在病案系统管理应用中,数据仓库技术对各类病案中的医疗过程产生的数据进行集成、综合、对比,其产生的数据是真实有效的,对比性与推理性都比较强[5]。
3 在病案统计分析中应用数据仓库技术的特点
3.1 实施建立数据仓库
数据仓库是按照数据結构来组织、存储和管理数据并建立在计算机存储设备上的仓库。可以长期存储在计算机内,是有组织可以共享的数据集合。建立数据仓库的第一个步骤是要通过与医院业务部分的交流沟通,充分了解建立数据仓库所要解决的问题和真正的含义,确定查询分析的需求。第二是要选择满足数据仓库系统要求的软件平台,其中包括数据库、建模工具以及分析工具等。要考虑到系统对数据量、响应时间、分析功能的要求等。第三要建立数据仓库的逻辑模型,确定建立数据仓库逻辑模型的基本方法,将主题中数据定义转到逻辑数据模型中,进行审核逻辑数据模型。
3.2 逻辑数据模型转化数据仓库的数据模型
在数据仓库模型中不需要包含非战略性的数据,因此在用操作处理的数据要进行删除。在数据仓库中的数据一定是时间的快照,在分析数据要提高使用性能。在病案统计工作中,要实施确定主题,首先对患者的疾病进行分析其特点,对该病的治疗措施进行制定,将所需花费的费用进行统计,以及对患者的住院时间进行评估和对患者治疗后的工作进行总结。针对所要发生的情况,提供缩短治疗的时间、减少患者所承担的医疗费用、对患者实施最佳的治疗方案,同时也确保了医院效益的情况进行统计分析,制定相关的表格。在数据模型建立的过程中,将无关此次分析的数据进行排除,将所发生的事实明确并仔细地记录[6]。
3.3 建立数据模型后提取相关的数据
在将所需的数据模型建立以后,根据数据仓库技术的要求,对数据仓库中所需要的数据进行提取,首先要对外界的数据资源进行收集和提取。在提取数据的过程中,首先要将数据提取的目标与数据进行联合建立,在统一的服务器中完成。如果数据结构化,在数据提取的过程中要在源系统内执行。采用的是完全提取法,无需跟踪更改,逻辑简单,但是系统负载较大。增量提取,将跟踪源数据中的更改,可以创建更改表以跟踪更改或检查时间戳,数据仓库内置变更数据捕获功能,虽然逻辑比较复杂,但是系统负载却大大减少了。
3.4 创建多维数据表进行分析
在将外界数据源进行收集和提取后,要建立多维数据库,将数据存放在一个n维数组中,而不是像关系数据库那样以记录的形式存放。工作人员可以通过多维视图来观察数据,多维数据库增加了一个时间维,与关系数据库相比,更加提高了数据处理的速度,加快了反应的时间,提高查询的效率。创建多维数据库首先要选择事实数据表,以及需要的雪花架构和星型架构维度,采集后存储到多维数据库内。
4 数据挖掘
4.1 数据挖掘的概念
数据挖掘是近年来伴随数据库系统的大量建立和万维网的广泛应用而发展起来的一门技术。数据挖掘是交叉性学科,是数据库技术、机器学习、统计学、人工智能、可视化分析等多门技术的融合。在大量的、不完全的以及有噪音或模糊的实际数据中,提取隐含的,有潜在价值的信息和知识的过程。数据的挖掘首先是搜集数据、数据越丰富越好,数据量越大越好,只有获得足够的高质量的数据,才可以获得准确的判断,才可以产生认知模型,是量变到质变的过程。目前挖掘数据的方法分类有神经网络方法、遗传算法、决策树方法、统计分析方法、模糊集方法等,神经网络方法是由于本身良好的鲁棒性、自组织自适应性、并行处理以及分布存储和高度容错的特性,比较适合解决数据挖掘的问题。遗传算法是一种基于生物自然选择与遗传机理的随机搜索的算法,是一种仿生全局的优化方法,具有隐含并行性,易于和其他的模型结合的性质,应用比较广泛。决策树方法是一种常用于预测模型的算法,通过大量的数据有目的地分类,在这当中找到有价值以及潜在的信息,优点在于描述比较简单,分类速度较快,比较适合大规模的数据处理。统计分析方法是在数据库字段项之间存在的两种关系,函数关系和相关关系,对它们的分析主要采用统计学方法,利用统计学的原理对数据库中的信息进行分析,主要进行回归分析、相关分析以及差异分析和常用统计等。模糊集方法对实际问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析,其系统的复杂性比较高、模糊性比较强[7]。
4.2 数据挖掘任务
数据挖掘任务包括关联分析、聚类分析,关联分析是指两个或两个以上变量的取值之间存在某种规律性为关联。数据关联是数据仓库中存在的比较重要和可被发现的知识,分为简单和时序以及因果关联。其目的是找出数据库中隐藏的关联网,使数据挖掘的规则更加符合要求。聚类分析是数据按照相似性归纳为若干类别,同一类的数据彼此相似,不同类的数据相异,可以建立宏观的概念,发现数据的分布模式。
4.3 数据挖掘的特点
数据挖掘是基于大量的数据,并非说小数据量上不可以进行挖掘,在大多数据挖掘的算法是在小数据量上运行而且得到的结果,小数据量无法反映出真实世界中的普遍特性。数据挖掘出来的知识是以前未知的,是一个全新的知识,可以帮助医院获得进一步的洞察力。数据挖掘具有一定的价值性,可以给医院直接带来效益,是提升医院总体价值的利器[8]。
近年来,医院的整个信息系统当中,数据仓库技术以及数据挖掘技术都处在一个比较初步的阶段,有着广阔的发展空间,医院在整体的信息系统采用数据仓库技术,学习和掌握数据仓库技术的理论知识和操作应用,改变自身的知识结构,既要有良好的统计思维,又要熟练掌握现代信息技术,成为复合型的统计工作者。充分利用数据仓库技术的信息资源,为医院领导决策提供依据。
[参考文献]
[1] 周清.如何利用数据仓库技术开展医院病案统计分析[J].财经界:学术版,2019(3):169.
[2] 陈力.关于医院信息化建设中数据仓库技术的应用研究[J].中国信息化,2019(1):64-65.
[3] 余冬.医院信息化建设中数据仓库技术的应用[J].信息与电脑:理论版,2018(22):160-161,164.
[4] 陈翔,刘春,杨锐.数据仓库技术在糖尿病健康教育中的应用研究[J].医学信息,2018,31(20):1-2,5.
[5] 李宏桢.基于数据仓库技术建立医院管理信息数据平台的实践[J].数字技术与应用,2017(9):90-91.
[6] 彭欣元.解析数据仓库和数据挖掘在医院管理中的应用[J].中国新通信,2017,19(4):118.
[7] 李韬,冯佳莉,张屹,等.数据仓库技术在医院信息化建设方案实现中的应用价值[J].中国医药导报,2016,13(4):160-163.
[8] 唐瑞璠,刘虹群,何拥群,等.基于病案信息数据仓库及数据挖掘技术构建医院管理决策平台[J].现代医院,2016,16(1):132-134.
(收稿日期:2019-09-19)