安文琛
(广州市第一人民医院,广东 广州 510180)
大数据在现代化医院建设中的应用
安文琛
(广州市第一人民医院,广东广州510180)
医院每天都会产生海量的数据,充分运用大数据技术在数据中心、商业智能、医疗科研管理等方面的作用,对医院大数据进行整合、发掘与利用,为医院管理者提供决策依据,将可以极大提升医院的核心竞争力。
大数据;数据中心;商业智能;医疗科研管理
这是一个信息爆炸的时代,也是一个概念爆炸的时代。当业界还在探讨物联网和云计算等前沿概念的时候,一些国际IT巨头已经聚焦于物联网和云计算产业背后的大数据,并努力挖掘其潜在价值。医院每天产生海量的数据,大数据应用技术将推动现代化医院更迅猛、更高层次地发展。能否抓住“大数据”所带来的机遇,将成为医院提升核心竞争力的关键环节[1]。
全球数据量每两年大约增加一倍,根据国际数据资讯(IDC)公司监测,估计到2020年,全球将拥有35ZB的数据量,这些数据85%以上以非结构化或半结构化的形式存在。IT界用“BigData(大数据)”来形容这个问题。早在上个世纪80年代就有美国人提出来“大数据”这个名词。2008年9月,文章“Big Data:ScienceinthePetabyteEra”在《科学》杂志发表,“大数据”这个词开始广泛传播[2]。
大数据中的数据其数量级以PB(1PB=1024 TB)或EB(1EB=100万TB)或更高计算,它们包括结构化的、半结构化的和非结构化类型,其规模和复杂程度超出了以往。在数据管理中,一方面数据量和业务量双向增长,更重要的另一方面是现代企业向全社会互联互通的交互式云计算业务模式的逐渐演进。传统的数据管理方式在容量、效率、扩展性上存在瓶颈,为了克服以上瓶颈,现代的数据管理需要达到以下目标:海量容纳能力,多类型,多结构,高负载,高可用,高可靠,低成本。
“大数据”的“大”不仅体现在数量庞大,更重要的是数据发生质的变化,即数据具有网络化和交互性特性。到目前为止,大数据没有统一的定义,比较流行的是4v定义:即有以下四个特征的数据称为大数据,这四个v特征分别是Volume,Velocity,Variety,Value。其中,Volume代表容量大,Velocity代表变化速度快,Variety代表种类和结构类型多,Value代表价值密度低。从数据形态出发,大数据的来源主要有社交媒体上的用户评论,互联网上客户交互的行为数据,传感器等机器数据等。医疗是一个拥有海量大数据的行业,而医院则是具体的承载单位。
2.1来源复杂
从数据来源来看,医院大数据主要来自以下8个方面:
1)社会化媒体、互联网及移动互联网、电子商务;
2)传感器网络、链接设备、智能终端、实时监控设备;
3)商业智能(BI)、医院辅助决策系统;
4)计算机、平板电脑、手机、其他移动设备、移动存储;
5)物联网、货币联网、RFID、GPS、GIS等医院信息技术的应用;
6)云计算、第三方数据处理技术、第三方平台的应用;
7)专业研究报告、行业资讯、行业活动记录;
8)其他大交互、大交易数据来源。
2.2类型繁多
医院的大数据类型呈现出多样化特点,可以描述如下:
1)人的行为信息、习惯信息、偏好信息、交互数据等;
2)Web文本数据、流量分析数据、电商交易数据、使用者网上活动数据等;
3)各类设施设备采集的数据如传感器读数、运营数据、实体数据、医院信息、仪表读数、监控视频数据等;
4)医院内部基干类系统和信息类系统所采集或处理的各类数据如辅助决策信息、运营数据、产品数据、供应链数据、人力资源数据、财务数据、病人数据、呼叫记录、市场数据等;
5)计算机使用数据和移动设备使用数据等;
6)基础地理位置信息、RFID读取信息、GPS映射数据、图像文件、医院信息、时间与位置数据、货币数据、高分辨率影像、矢量、遥感及动态监测数据等;
7)CRM、KDD、DWH、流量监测、查询应用、分析器等应用数据;
8)报告资讯、科研数据、调研数据、公共数据、公共信息。
2.3结构多维,格式多样
医院的大数据,可以从多个维度进行解构:
1)结构化数据、半结构化数据、非结构化数据。医院的大数据既包括存储在数据库里的结构化数据,也包括日志文件、XML文档、JSON文档和电子邮件等半结构化数据,而更多的数据类型是办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等非结构化数据,半结构化、非结构化数据约占大数据总量75%~85%。
2)内部数据与外部数据。医院的大数据既有来自医院经营的内部交易数据、CRM数据,也有来自其他数据源的外部数据。医院的大数据兼具公共、私密二重属性。外部数据的公共性特征比较明显,而内部数据由于和行业标准和商业机密密切相关,因而具有私密性。
3)与数据结构的多维特征相对应,医院大数据的格式也是多样的。除了传统的纸质文件、档案、报表、表格、记录、信函等之外,更多的是以数字数据存在的Web文本、视频、短信、音频、视频、邮件、存储信息、配置文件、符号、图片、档案等。数据格式的多样性和互不兼容、数据访问的随机性,为数据的采集、存储、分析、应用带来了困难。
在《大数据时代》一书中,作者提出“大数据的核心就是预测”。信息使用者通过收集大量的数据,对其进行加工处理,建立起数据的内在发生发展规律,通过计算分析所获得的有价值的信息成为企业预测顾客喜好、潮流趋势、企业发展方向等事物的有力依据,对企业管理者的决策有着极大的帮助。从这里可以看出信息就是一种资产,对这种类型的资产来说,对其进行加工精炼才是它的增值方式。具体到医院的实际情况,就是研究如何应用医院产生的海量数据,提取出有用的信息为医院的管理者提供决策依据,提升管理水平与服务质量,具体有以下这些表现形式:
3.1数据中心
医院信息化建设在保障与支持医药卫生体制改革顺利进行、保证医院可持续发展等方面的作用日益显著。由于大型公立医院信息化建设时期较长,各业务信息子系统分散,各数据库模块信息耦合困难,势必会造成实时抓取数据真实性差、稳定性差、关联性差。因此,通过大数据集成平台的建设,能够有效采集数据、高度集成数据、实时分析数据,提高数据信息的准确性和可利用性,实现医院内部各信息系统之间的数据整合、信息共享和流程协同,提高医院管理水平[3]。
随着医疗信息技术的迅猛发展及快速更新,信息量日益丰富,单纯依靠各个医疗信息系统的归口信息管理模式已远远不能满足现代化医院发展的步伐,医疗信息系统的交互与集成研究已经成为建设全面、专业、集成和智能的数字化医院的迫切需求。
构建以临床数据仓库为核心的全院数据中心平台,不仅可以实现医院内不同部门的、异构信息系统间的临床交换、共享、互操作和统一管理,而且能够将临床业务和临床用户的需求与临床数据的智能化应用相结合,为医院提供智能化临床数据浏览的临床医生门户、临床管理数据分析门户、临床科研门户以及患者健康门户,实现各类集成业务应用。全面集成的智能化信息系统必将实现医院“人、财、物”“医、教、研”基于统一平台的协同管理,数据仓库和商业智能技术将使医院领导者的决策得到真正的支持,有效提高医院精细化管理水平,保障医院健康可持续发展。
当前,基于信息集成平台的建设来实现医院内部绩效的实时管理与评价、提高各管理层级的调控能力与决策水平具有重要发展前景,已成为广大医院信息建设的主攻方向。
3.2商业智能平台
商业智能(BusinessIntelligence)运用数据仓库、在线分析和数据挖掘等技术来处理和分析数据,它允许用户查询和分析数据库或数据仓库,进而得出影响医疗活动的关键因素,最终帮助用户做出更好、更合理的决策,最终目的是为决策者提供决策支持将数据变为知识[4]。
随着医院信息化的快速发展,信息系统积累了海量的管理与医疗数据,但在信息资源的开发应用方面,普遍存在以下问题:原始信息多、加工整理少;孤立分散多、联合共享少;为宏观服务多、为微观服务少;静态信息多、动态信息少。如何整合医院中的各类信息资源,进行有效的开发利用,构建一个以患者为核心,覆盖广泛的应用领域,面向不同信息使用者的数据分析平台就显得尤为迫切。
商业智能可以帮助医院的管理层进行快速,准确的决策,迅速的发现医院业务中的问题,提示管理人员加以解决。但商业智能软件系统不能代替管理人员进行决策,不能自动处理医院运行过程中遇到的问题。因此商业智能系统并不能为医院带来直接的经济效益,但必须看到,商业智能为医院带来的是一种经过科学武装的管理思维,给整个医院带来的是决策的快速性和准确性,发现问题的及时性,以及发现那些其他医院未发现的潜在的知识和规律,而这些信息是医院产生经济效益的基础。不能快速,准确地指定决策方针将造成病源流失,不能及时发现业务中的潜在信息等于浪费自己的资源优势。比如:通过对病人就诊数据的分析可发现各类病人的就诊高峰时间以及用药及治疗信息,这样就可进行更有针对性的排班,或向某一类特定的病人提供更具有个性的服务推荐等,这都会为医院带来直接的经济效益。
3.3医疗科研管理
医疗科研管理信息化存在数据共享度比较低,科技产出数据零散不系统,数据质量不理想,信息化数据利用率低等问题。将大数据概念以及技术引入到医院的科研管理中,对积累的数据进行重新利用,将现有的管理数据转化为可供使用的知识,以此提高科技管理水平和技术含量,能够为管理部门决策提供客观、科学、全面的参考。建立科学、高效的科研管理模式,优化科研资源配置和提高科研计划项目的管理绩效,保障医疗科研事业的良性、健康发展,已经成为当前医疗科研管理体制改革的一项重要内容,大数据方法在这一领域的实施具有广泛的应用前景[5]。
大数据环境下,随着数据收集、存储、分析技术的突破性发展,可以更加方便、快捷、动态地获得与研究对象有关的所有数据,而不再因诸多限制不得不采用样本研究方法,相应地,思维方式也应该从样本思维转向总体思维,从精确思维转向容错思维,从而能够更加全面、立体、系统地认识总体状况。对于临床科研人员,信息需求发生显著性的变化,研究对象从样本数据变成全部数据,为疾病全过程研究提供广度信息展示、个性化信息推送和深度信息互动。
在大数据时代,生物医学研究模式已由原来的假设驱动转向数据驱动。大数据研究应关注历史沉淀数据的挖掘,关注社交媒体与患者就诊行为数据,进行更加准确和个性化的患者行为分析,改善就诊流程,提升就诊体验。医院管理、医院营销、医院规划、医院战略、病患满意度等无不与大数据关联。通过挖掘这些信息,可以预测医院市场需求,进行智能化决策分析,从而制定更加行之有效的研究战略。
大数据分析将为生命机制解读、医院管理、个性化医疗带来革命。在医学科研领域,信息化环境越来越复杂,使信息化资源由成本单元转变为利润单元并助力科研活动,将科研管理由精细化的数字管理引申到趋势化的数据管理,聚合各种相关数据为科研目标的凝练、科研方向的遴选等提供依据,满足知识创新需求等方面,这些问题的解决为大数据应用提供了强劲的内生动力。大数据已成为科技发展的竞争战略,利用大数据进行科学研究和从事科研管理,建立科学、高效的科研管理模式,优化科研资源配置和提高科研计划项目的管理绩效,保障医院科研工作的良性、健康发展,并将其价值转化成科研活动的竞争优势,从而提高创新驱动能力。
越来越多的医院已经意识到大数据的价值,针对这些数据的各种预测、分析、统计在医院管理和决策的过程中正扮演越来越重要的角色。能够更加充分利用大数据的医院,必将在未来的竞争中占得先机,保持蓬勃的发展潜力。
[1] 王淑娟,石晓宇.大数据应用对现代信息化医院竞争力的影响[J].现代医院管理,2015,13(1):68-71.
[2] 林海文.大数据研究综述[J].电脑知识与技术,2015,11 (26):1-2.
[3] 吴正一,崔迎慧,陆耀,等.以临床数据仓库为核心的医院大数据平台构建[J].中国医院管理,2015,35(11):13-15.
[4] 秦芳,高轶,孙仁峰,等.基于大数据的商业智能在医院门诊管理中的设计应用[J].中国数字医学,2015,10(11):93-95.
[5] 张胜行,陈大鹏,凌小明.基于大数据视角的医院科研管理[J].解放军医院管理杂志,2015,22(5):481-483.
F274