城乡居民医保信息系统优化研究

2022-05-30 08:38王灵
电脑知识与技术 2022年27期
关键词:负载均衡区块链

王灵

摘要:城乡居民医保信息系统早期大部分采用了单一关系型数据库存储数据,该方案扩展难,并发能力小,不适合处理半结构化,非结构化数据。而后随着分布式技术如Hadoop等平台的出现,因其具备使用廉价的机器来存储处理数据的优点,城乡居民医保系统也开始使用该平台。但Hadoop在设计之初是将数据均分给集群中的节点进行存储和处理的,忽略了集群节点本身在存储和计算能力存在差异,个别节点的性能甚至影响了整理系统的性能,且是主从节点方式处理数据,存在数据可篡改,系统终端过于单一等问题。本文给出了城乡居民医保系统的整体架构和技术路线,提出了异构节点数据流动的优化办法,能有效节约集群规模和成本,借助区块链技术保证数据安全性和可信性,优化前端集群服务架构,支持多渠道高并发的关键信息推送模式,具备很好的推广性。

关键词:城乡居民医保系统优化;Hadoop;区块链;负载均衡

中图分类号:TP311      文献标识码:A

文章编号:1009-3044(2022)27-0102-03

开放科学(资源服务)标识码(OSID):

1引言

城乡居民医保制度[1-2]是由政府支持和引导,城乡居民积极参加,是城乡居民个人和政府等共同筹资的一项以大病统筹医疗为目的互助制度。为落实该项制度,国家出台了关于城乡居民医保信息系统等一系列技术规范,主要规定了各省市主管部门应做好城乡居民医保系统的发展规划,本着节约建设成本,结合当地实情,建立和升级符合实际需要的城乡居民医保信息系统,便于广大城乡居民享受这一政策。在城乡居民医保信息系统建设之初,其广泛采用了单一的关系型数据系统来存储数据,随着城乡居民医保系统数据不断增加,数据类型的不断丰富,该种数据存储方案扩展困难,软硬件升级成本越来越高,维护难度也不断加大,特别是医疗检查中存储的图像、视频等半结构化、非结构化的数据,存储和分析异常困难。

由于城乡居民医保信息系统中涉及数据规模和复杂度的不断增加,传统的单节点数据处理所需的时间变得难以接受。因此,为了提高数据处理效率,许多学者一直在研究大数据的并行处理。过去,由于开发并行处理程序需要丰富的并行知识,开发难度极高,且并行计算框架也是为具有大量内存空间和高网络带宽的环境(如超级计算机)而设计的。近十年中,由于Hadoop[3]等分布式框架的出现,如下图1所示,用户能够很容易地开发大规模并行程序。城乡居民医保信息系统也开始采用这种分布式并行处理技术,统筹组织分析处理参合、门诊、检查、药品等数据。但是目前系统中存在集群规模不恰当、建设成本过高、医疗数据易篡改,终端用户数据推送不及时,系统针对性不强和并发性能较差等问题。 本文将着重优化三个问题:1)搭建适当的集群规模,优化异构节点数据流动,有效节约集群规模和能耗成本,提高MapReduce[4]的执行速度;2)提高系统安全性和数据可信性,高层采用区块链技术确保城乡居民医保系统关键数据可信,无法篡改,保证城乡居民,政府,医疗系统利益不被侵害;3)优化系统并发性能,提升前端集群服务架构,扩展终端形式,通过数据挖掘等技术及时推送不同角色的关联数据,提升城乡居民医保系统的用户体验。

2相关研究

城乡居民医保系统从传统的关系型数据库升级到Hadoop平台,广大工程师和科研人员主要围绕三个问题进行探索建设。

(1)数据存储能力和建设成本,优化Hadoop底层文件存储系统方面。不同分布式场景,存在着很大的性能差异和不稳定性。究其原因在于城乡居民医保系统涉及的服务器性能存在明显差异,这方面研究主要集中在Hadoop在具有不同性能能力的节点的异构集群[5-6]上运行时,性能会降低。每个节点的吞吐量可能会存在差异,所有计算节点无法对相同数量的块来执行同样操作。因此,空闲节点(即已经完成工作的节点)可以通过网络通信连续地接收未完成任务的数据,从而导致网络拥塞,严重影响整体性能。而在异构环境中,因节点的计算能力与分配给它的块数之间可能存在不匹配,数据局部性无法保持。国内外相关学者已对这个问题进行了相关研究,例如,Xie[7]等提出了一种基于每个节点性能比的数据放置方案。方案包括两个步骤:首先,初始数据放置是使用Preduce Application的Normalized Response Time来循环执行,数据被重新分配到与测量的性能度量成比例的自定义数据放置。这是因为删除或添加块后,初始数据放置可能会折叠。尽管他们提出的方案解决了一些性能下降的问题,但是该方案不足以评估异构环境中每个节点工作负载,因为它使用了简单的性能度量。

(2)信息系统数据安全与可信性方面。城乡居民医保系统涉及资金、医疗病历等原始数据,具备很强的严谨性,是广大城乡居民结算报销的重要依据,是国家惠民政策的直接体现,也是进行更深层次数据分析的依据。因此,务必确保数据无法修改,可在数据存储层之上采用“区块链”技术,确保城乡居民医保系统关键性数据可信无法篡改[8]。对于这方面的研究有很多,“去中心化”的分布式系统和并行计算在很多领域的研究越来越受到广大学者重视。目前“区块链”研究属于相对较新的领域,国内外许多研究人员都在研究这一技术,该技术对于互联网将产生颠覆性的创新,而其去中心化、不可篡改、信息跟踪等特点可以广泛地应用于产品供应链、证券交易、电子银行、政务系统、医疗管理等领域。近两年学术界和工业界对于此技术给予了较高的关注,研究开发区块链在诸多领域的应用场景也取得了进展。综上,区块链技术主要解决不同领域的数据可信问题,能实现跨时空交易,更加方便快捷。

区块链技术不仅可应用在经济金融等领域,凡是对交易的真实性、不可篡改性、可回溯性、安全可靠性等有需求的各个领域都可以应用该技术。虽然“去中心化”的分布式系统在其他行业已经逐步开始应用,但目前为止,根据相关文献检索结果显示,对城乡居民医保系统进行整体“去中心化”分布式架构与设计还鲜有报道。如果能够借鉴该种架构设计方案在电子商务中的成功应用经验,归纳汇总区塊链技术在医疗领域的零散应用,将其整合到城乡居民医保系统综合信息系统中,将能大幅度降低系统扩充的软硬件成本,提升系统的安全可信程度,也可为决策者、医疗工作者及广大城乡居民推送智能化信息,提升本区域城乡居民的医疗服务质量。

(3)信息系统高并发性能,系统友好性,挖掘关键信息并主动推送等方面。前端采用Web,App,微信小程序,微信公众号等方式,多渠道对接城乡居民医保信息系统。通过优化数据存储,相关Web服务功能,采用负载均衡等策略,提高系统的并发性能。同时采用数据挖掘技术,抓取并推送关键信息,便于智能化平台的建立。通过改进传统数据挖掘算法,挖掘出不同的数据,建立给不同对象使用的智能化信息推送平台。用户可以通过微信、短信、邮件等各个平台获取相关信息。

3系统总体架构

为了使系统具备很好的扩展性、可信性、安全性、智能性,系统使用分布式存储技术解决数据扩展性问题,上层采用区块链技术建立可信性认证,应用层将挖掘出相关数据进行高并发推送。具体系统架构如图2所示。

整个城乡居民医保信息系统主要采用了三层总体架构。应用层面向不同对象,处理相应的业务逻辑,同时结合相应的感知设备,例如手机、智能穿戴设备、RFID等获取相应辅助数据,并特别提醒、推送或预警与城乡居民息息相关的健康与结报数据;网络层除了传输数据外,对于关键性数据,例如住院数据、诊断数据等进行区块链网络节点共同认证,确保数据可信无法篡改;在数据存储层,则对不同数据采用不同的数据存储方式,例如缓存数据进入Redis,涉及金额等数据进入Mysql,其他非结构化,半结构化数据进入Hbase、Mongodb等数据库中,统筹处理。城乡居民医保信息管理系统建设是以卫生部《关于城乡居民医保信息系统建设的指导意见》等一系列文件为立项依据,城乡居民医保系统应提供费用智能测算、参合经费拨付与收缴、报销支付补偿、监督部门审计、医疗主管部门决策分析和相关政策公告等功能,能有效提高城乡居民医保系统资金的运转效率、有效杜绝资金监管漏洞、大力提升政府部门的服务质量和监管力度。该信息系统建设一般由各省招标建设,其省级管理信息系统基本功能为数据处理与交换、统计报表、会计报表、业务监测、基金监管、转诊管理、分析评价、配置维护、门户网站等;县级业务系统基本功能包括参合管理、补偿管理、基金管理、会计核算、查询统计、监测分析、业务公示和配置维护等功能。为节约系统的存储、系统总体功耗、人员管理成本,首先可对数据存储层进行优化。

4 区块链技术应用

针对城乡居民医保系统的参保信息、住院费用、结算比例等关键性数据,确保其是可信无法篡改的,笔者将从技术层面进行保障,建立多部门参与的区块链节点,采用链式传输和普通传输相结合的方式与底层数据存储层通信,构建城乡居民医保系统信息安全管理模型,如图3所示。

区块链技术主要有公有链、私有链以及联盟链三种常见方式,公有链的特点是所有人均可访问,主要代表是比特币、以太坊等应用,其明显应用范围超过城乡居民医保系统角色的应用范畴;私有链主要在企业内部进行使用,其操作的权限一般被单个组织或机构掌握,城乡居民医保系统是多方参与的,因此该种方案也不符合城乡居民医保系统。而联盟链是非常适合多方参与和共同监督的,采用相关共识算法,加入与退出链均需得到相关组织认定,具备去中心化的特点,其代表为Hyperledger。因此,城乡居民医保系统具体选择上可采用联盟链,可选用Hyperledger技术建立城乡居民医保系统的联盟链,具备了高可信、隐私信息保护等优势明显,既可以使监管部门具备监管权,又能对医疗卫生部门、广大城乡居民开放相应级别权限,符合城乡居民医保系统的要求。

5总结

城乡居民医保信息系统是涉及普通百姓的综合医疗业务系统,数据增长速度快、涉及业务流程复杂、资金量大。本文主要从数据存储底层架构优化、可信网络、多渠道并发访问、前端服务架构几个方面做了一些研究,可对城乡居民医保信息系统的进一步建设优化提供思路,也可为类似信息系统建设作为技术参考。同时本文所涉及的数据量为模拟器产生,数值较小仅在实验环境中论证,下一步将继续关注和优化HDFS的文件块调度算法及其应用,区块链技术的发展以及前端服务器集群架构技术更新,重点关注并研究分布式底层数据存储与可信方法领域,以期在实验室和现实环境中进一步论证,整合并优化相关工程级技术并应用到城乡居民医保等系统中。

参考文献:

[1] 李姝荟,李姝熠,张洋,等.新医改环境下新型农村合作医疗制度的发展现状及对策研究[J].中国市场,2020(8):74,79.

[2] 王奥,陈虹,秦立建.我国新型农村合作医疗制度高质量发展研究[J].齐齐哈尔大学学报(哲学社会科学版),2020(1):19-21.

[3] 黄訸,易晓东,李姗姗,等.面向高性能计算机的海量数据处理平台实现与评测[J].计算机研究与发展,2012,49(S1):357-361.

[4] 林伟伟.一种改进的Hadoop数据放置策略[J].华南理工大学学报(自然科学版),2012,40(1):152-158.

[5] 夏新岳.基于区块链的股权资产购买和转赠设计与实现[D].呼和浩特:内蒙古大学,2016.

[6] 黄永刚.基于区块链技术的电子健康档案安全建设[J].中华医学图书情报杂志,2016,25(10):38-40,46.

[7] 蔡维德,郁莲,王荣,等.基于区块链的应用系统开发方法研究[J].软件学报,2017,28(6):1474-1487.

[8] 薛腾飞,傅群超,王枞,等.基于区块链的医疗数据共享模型研究[J].自动化学报,2017,43(9):1555-1562.

[9] 王海隆.区块链技术在中医药领域中的应用展望[J].贵阳中医学院学报,2017,39(3):1-4.

[10] 倪培昆.区块链技术及其在医疗领域的价值研究[J].医学信息学杂志,2018,39(2):9-13.

[11] 朱正望,朱平生,苗艳艳,等.基于数据挖掘的含大枣中成药用药特点分析[J].中国中药杂志,2021,46(9):2344-2349.

[12] 譚定国,黄婉飞,貌俊伟,等.某医院内微信平台用药信息推送对提高临床处方合理用药的影响[J].抗感染药学,2020,17(6):827-829.

【通联编辑:唐一东】

猜你喜欢
负载均衡区块链
异构环境下改进的LATE调度算法
区块链技术的应用价值分析
“区块链”的苟且、诗和远方
基于负载均衡的云资源调度策略研究
基于区块链技术的数字货币与传统货币辨析
多站点同步更新系统的设计
用“区块链”助推中企走出去
模糊理论在Ad hoc网络通信领域的应用