姚剑锋
摘 要:随着互联网络、计算机技术等的发展,人类社会逐步迈入大数据时代。基于大数据技术的信息处理在医学领域发挥着十分重要的作用,尤其是在医疗保险信息安全隐私保护方面。但互联网、计算机以及大数据的发展在为医疗保险信息带来便利的同时,医疗保险信息容易丢失与泄露的问题也随之产生,这给生物医学的发展带来了极大的风险和隐患。因此,基于大数据技术,对医疗保险信息安全隐私保护进行研究,以云存储、判别分析算法以及中间构件等技术对医疗保险信息进行保护。通过实验证明,基于大数据的医疗保险信息的安全性得到很大提高,且信息准确率达92%以上,能够极大地保护医疗保险信息的安全性。
关键词:大数据;医疗保险信息;安全隐私;保护研究
中图分类号:G 642
文献标志码:A
文章编号:1007-757X(2020)11-0168-03
Abstract:With the development of the Internet and computer technologies, human society has gradually entered the era of big data. Information processing based on big data technology plays an important role in the medical field, especially in the protection of medical insurance information security privacy. However, while the development of the Internet, computers, and big data is facilitating medical insurance information, the problems of easy loss and disclosure of medical insurance information have also arisen, which has brought great risks and hidden dangers to the development of biomedicine. Therefore, based on big data technology, the research on the security and privacy protection of medical insurance information is carried out, and medical insurance information is protected by technologies such as cloud storage, discriminant analysis algorithms and intermediate components. The experiment proves that the security of medical insurance information based on big data is greatly improved, and the information accuracy rate is over 92%, which can greatly protect the security of medical insurance information.
Key words:big data;medical insurance information;security privacy;protection research
0 引言
互聯网络、计算机技术、云计算以及大数据技术等的飞速发展与革新,使得信息存储方式发生了翻天覆地的变化[1]。这些技术的广泛应用,深刻影响着人类社会生活、工作以及思维等各个方面,人类社会正迈入大数据时代。网络与大数据的背景下,生物医学也迎来了新的发展机遇。大数据技术、计算机技术为医疗诊治以及医疗保险信息的存储提供了强大的技术支持。如今的医疗保险信息一般都是以电子档案的形式存放的,电子档案中记录着无数医疗保险数据,是医院发展最珍贵的无形资产。但是,计算机以及大数据的发展在为医疗保险信息带来便利的同时,医疗保险信息容易丢失与泄露的问题也随之产生[2]。由于医疗保险信息对于医保工作的重要性,如何有效保障医疗保险信息安全隐私成为当前医保机构亟需解决的重大问题。因此,基于大数据技术,对医疗保险信息安全隐私保护进行研究,以云存储、判别分析算法以及中间构件等方法对医疗保险信息进行保护。通过实验证明,基于大数据的医疗保险信息的安全性得到很大提高,且信息准确率达90%以上,能够极大地保护医疗保险信息的安全性。
1 基于大数据的医疗保险信息安全隐私保护研究
大数据本身是一种信息资源,具有其他资源无可比拟的潜力与优势[3]。大数据技术的发展在人类社会发展与进步的各个方面都起着一定的支撑与促进的作用。基于大数据,对各种数据信息进行分析与应用,关键在于使这些数据资源的效益真正的发挥出来。当前,医疗保险信息一般都是以电子档案的形式存放的,电子档案中记录着海量的医疗保险数据,是医院发展、患者诊治最为重要的无形资产。但是,处于网络发展迅速、信息传播更加便利的环境下,医疗保险信息容易丢失和泄露的问题也随之产生[4]。因此,基于大数据,对医疗保险信息安全隐私保护进行深入研究,提出一种针对医疗保险信息安全隐私的保护方法,旨在为更好地提高医疗保险信息的安全性与可靠性。
1.1 医疗保险信息安全隐私保护方法总体设计
基于大数据的医疗保险信息安全隐私保护方法由三部分构成,分别是医疗保险信息的备份与处理、医疗保险信息的传输与权限控制以及网络安全的维护。其中,医疗保险信息的备份与处理部分主要是对管理信息系统、Web信息系统、物理信息系统以及科学实验系统采集来的数据信息采用大数据技术进行分类,然后进行云存储和分布式文件储存[5]。医疗保险信息的处理是对数据信息进行清洗与分析。医疗保险信息的传输与权限控制部分包括两方面的内容,信息传输是采用大数据技术,搭建中间构件,以此保证医疗保险信息可靠安全的传输。信息的权限控制是主要是对医疗保险信息进行统一维护以及采用灵活调控机制对数据信息的访问权限进行控制。医疗保险信息的网络安全维护主要是以数据信息的功能进行区域划分,再利用防火墙技术实现不同区域的隔离、控制与审计。
1.2 医疗保险信息的备份与处理
医疗保险信息备份的主要作用是在发生信息事故时能够有效的保护原始数据,尽可能地减少因信息丢失或泄露而造成的损失。数据备份时首先使用大数据技术对采集来的数据进行分类,将数据分为结构化、半结构化以及非结构化数据,然后进行保存备份。信息保存采用大数据技术中的云存储与分布式文件储存的方法。云存储主要是把数据信息存放在第三方托管的多台虚拟服务器上,以保证数据的安全性,同时还能节约存储空间[6]。备份则采用冷备份与热备份的方法。冷备份即静态转储,在数据库关闭的情况下,对数据库中的数据文件、日志文件等进行复制,在复制过程中拒绝其他应用程序的并发访问。热备份即动态转储,在数据库正常运行的情况下,备份数据库数据文件,再次过程中允许其他应用程序的并发访问。采用冷备份与热备份相结合的方式能够为医院提供实时有效的医疗保险信息。
医疗保险信息的处理是对数据信息进行清洗与分析,并对数据进行完整性和有效性的检验,在信息源头判定数据的准确与否,以及检验存储录入的信息是否与医疗保险数据库本身有冲突,及时排除有可能影响数据库本身数据进行有效处理与分析的非法数据与程序[7]。在进行医疗保险信息的处理工作时主要采用大数据统计分析方法中的判別分析法。这种方法是就一定数量样本的一个分组变量和相应的其他多元变量的已知信息,来确定分组与其他多元变量所属的样本进行判别分组[8]。判别分析通常都要建立一个判别函数,然后利用这个函数进行批判。判别函数具体如式(1)。
式中,W(x)代表判别函数值,x代表样本信息,代表样本信息的均值向量,α代表判别系数。这样,利用该判别函数对医疗保险信息进行分析与判别,保证数据信息的准确性。
1.3 医疗保险信息的传输与权限控制
医疗保险信息的传输必须确保传输的完全安全。健康保险信息的传输实际上是基于大数据技术的整合来创建中间组件,使用可靠的机制来传输中间组件以进行打包和传输信息。当信息源发送数据信号时,中间组件首先将数据传递给缓冲队列,然后利用其封装处理机制确保数据信息在传输过程中不受外部因素的影响,从而保证数据信息的安全性和纯度。当在信道上传输信息期间发生事故时,中间组件可以根据传输信息之前的记录来跟踪信息丢失的位置,并重传该信息。一旦移除了通道的阻塞机制,健康保险信息可以防止传输过程中的数据丢失,确保信息传输效率,并提高信息利用率。
在传输健康保险信息的过程中,可能出现与由于外部信息的侵入而导致的信息质量不可靠性相关的问题。中间组件可以使用服务连接功能来消除外部入侵的干扰信息,并在中间组件节点和传输信道之间建立逻辑连接[9]。通道确保每个节点上传入和传出数据的信息一致性,从而确保信息传输的安全、可靠与稳定。并且中间构件的传输,在医疗保险信息的数据层、传输层和应用层搭建起了桥梁,具体的结构体系,如图1所示。
这样的三层体系,能够为医疗保险信息设置一道安全屏障。一方面,确保医疗保险信息不任意流失。另一方面,保证外部的信息不回随意入侵医疗保险信息系统本身,从而实现数据的更深层过滤。由中间构件组建的传输方式保证了医疗保险信息的相对稳定性。
医疗保险信息的权限控制主要是指不同用户在访问医疗保险信息系统时,进入系统前必须进行用户验证,登录系统的操作,进行有效的身份认证,在得到系统赋予的不同权限后,方可完成不同级别的医疗信息使用等相关操作。例如,一般权限的用户登录后仅限于查看公共医疗信息,高级别的用户才具有增、删、查、改以及更新医疗保险信息的操作权。
基于权限的定义可以根据设定为定位坐标的相似度的判定上,假设在定位判定中出现U1rights1和U1rights2两个类别,其使用账户为同一账户,而设定的用户级别不同,在账户应用中的应用集合,如式(2)。
式中,T表示不同时间段发生的操作行为,在不同权限下形成的动作集合可以形成欧式距离的计算,如式(3)。
根据公式计算可得不同坐标产生的相似度距离。
如果距离过大,则通过判定规则定义为非可靠性操作,距离小于判定值的也会标示为疑似概率问题,是否存在匿名登录等问题,进入限制操作的管理中。
采用灵活的调控机制,对医疗保险信息进行权限控制与维护,使得医疗保险信息得到一定保护,不被流失与泄露,进而预防信息泄漏可能造成的损失与伤害。而且,通过对医疗保险信息的权限控制,还能够防止违规操作,保障医院与患者的隐私权利。
1.4 网络安全的维护
医疗保险信息包括统计类、业务类、基金财务类、医院基础类以及政策类等方面的信息,涉及到银行、医院、患者多方。基于大数据的网络时代,无论是医疗保险信息的保存备份、信息处理还是传输与权限控制都离不开网络技术的支持。因而,基于大数据的医疗保险信息安全隐私保护一定要对网络安全进行必要的维护,使网络间的访问具有可控性。具体的维护方法是:定义维护数据位置形成类别集合,计算各个集合的优化路径,通过最短的响应保持数据间隔,同时获得系统的稳定可靠运行,如式(3)。
最佳路径的获取会随着用户使用频率的提升而不断改变,所获取的精度也会不断地提高,对于降低用户推测延迟,数据集合的响应时间均会有所帮助。
在医院核心层的网络同其他层次的网络之间采用物理隔离的方式来保证网络的安全。对于安全层的网络,则在局域网中划分虚拟子网来实现各个安全域之间、用户与安全域之间的安全隔离。在医院内网和外网间使用防火墙建立起数据共享、数据交换以及数据应用的安全隔离带[10]。对可信任的网络进行医疗保险信息传输时可以不用加密。而对于业务专网进行信息传输时,为确保信息的安全可靠 ,涉及医疗保险业务、就医数据、医护人员、患者的相关信息就必须采用打包传输和设置特定访问权限的方式进行传输。
2 实验结果与分析
上述采用提出的基于大数据的医疗保险信息安全隐私保护方法最大程度上防止医疗保险信息的泄露和丢失,为医疗保险信息的安全提供保障,充分的证明了医疗保险信息安全隐私保护方法的可行性,但是其有效性还有待进一步研究。因此,采用对比实验对提出的基于大数据的医疗保险信息安全隐私保护方法的有效性进行实验。
2.1 实验参数设置
对比实验主要采用提出的基于大数据的医疗保险信息安全隐私保护方法与传统的医疗保险信息安全隐私保护方法进行实验。实验外部环境参数设置情况,如表1所示。
2.2 实验数据分析
以上述设置的实验外部环境参数为依据进行实验,通过对医院数据库中的数据信息进行增删查改等操作,看两种保护方法下导出数据的准确率、安全方面等是否达到预期效
果。由于实验组与对照组机制的不同,无法对其进行直接的对比分析。为此,采用统计软件对实验数据进行记录与对比分析。实验数据对比结果,如图2所示。
图2中实验组导出数据的准确率明显高于对照组导出数据的准确率,实验组导出数据的准确率最低为92%,而对照组导出数据的准确率最低为40%。随着实验次数的增加,对照组数据的准确率曲线呈曲折式的下降,而实验组数据的准确率曲线保持平稳状态。说明提出的基于大数据的医疗保险信息安全隐私保护方法具备极高的有效性。
对于系统的数据安全经过数次迭代计算后效果,如图3所示。
图3中,基于传统的医疗保险信息安全隐私保护方法对于数据安全溢出检测不太敏感,进行100次迭代计算后仍然高于80%,而大数据中对于数据溢出安全的检测是依靠智能化的叠加关系,随着迭代次数的增加,其安全水平也会不断提高,经过100次迭代后的安全溢出概率低于20%,证明大数据环境对数据安全溢出的控制效果高于传统保护方法。
对于系统反应情况的测试,通过对不同数据组的累计计算获取结果,如图4所示。
图4中,数据累计计算会增加系统的负荷,虽然两种方法均会在累计计算过程中增加响应时长,但效果仍然是本文方法较好,经过10 000次数据累计结果,本文研究方法在系统响应时间控制在80毫秒以内,而传统方法已经达到176毫秒的响应时长,结果证明了传统方法无法有效控制复杂计算带来的系统负荷,而大数据系统中的算法则可以更好的降低系统负荷,增强系统的稳定性。
3 总结
基于大数据技术,利用云存储、判别分析算法、中间构件等提出医疗保险信息安全隐私保护方法,实现了对医疗保险信息的保护,提高了医疗保险信息的可靠性与安全性。但是其仍然存在较大的上升空间,因此,需要对其进行进一步的研究与分析。
参考文献
[1] 孟庆华.基于消费者行为特征大数据平台信息安全与隐私保护模型研究[J].上海商学院学报,2017,18(3):30-36.
[2] 张云飞,王晓洁.大数据环境下信息安全与隐私保护研究[J].数字技术与应用,2017(7):190-191.
[3] 李亚子,尤斌,王晖,等.医疗保险信息泄露案例分析及对我国安全隐私保护的借鉴水[J].医学信息学杂志,2014,35(2):6-12.
[4] 匡文波,童文杰.个人信息安全与隐私保护的实证研究——基于创新扩散理论的大数据应用视角[J].武汉大学学报(人文科学版),2016,69(6):104-114.
[5] 刘加奇,黄小燕.健康大数据研究热点与隐私保护[J].中国信息安全,2016(4):94-97.
[6] 杨丽丽.大数据时代信息隐私关注与隐私保护行为研究[J].电子商务,2017(5):48-49.
[7] 赵文正,王在云,李阿芳.基于云计算的大数据安全隐私保护的相关分析[J].网络安全技術与应用,2018(4):49-50.
[8] 迟晨阳,毛华坚,孟海滨,等.电子健康档案信息安全和隐私保护的关键问题和研究进展[J].中华医学图书情报杂志,2015,24(11):22-26.
[9] 吕欣,韩晓露.大数据安全和隐私保护技术架构研究[J].信息安全研究,2016,2(3):244-250.
[10] 聂燕敏,陈刚,何志强.基于信息熵的位置大数据隐私保护研究[J].黑龙江科技信息,2016(12):189.
(收稿日期:2019.09.09)