刘梦迪
摘要:现如今,我国医学行业已经与现代化信息技术融合得越来越深入,而在互联网等现代信息技术的推动下,与人们生命健康密切相关的医疗数据也逐渐呈现出爆炸式增长的特点。其中,医疗大数据不仅作为业界展开相关研究的重要基础,同时更是人们对现有资源进行再分析和再利用的关键突破点。而医疗大数据平台的建设与应用,往往可以更好地帮助工作人员完成过去仅靠传统思维、技术方法等无法解决的工作,从而进一步从整体上提升我国医疗服务的质量。然而,由于目前的医疗数据大都呈现出多源异构、信息涉及隐私等特点,所以这也就大大增加了人们对数据的采集与应用难度,可见当前医疗大数据平台的建设还存在一定的困境有待解决。
关键词:医疗大数据平台;建设困境;应对策略
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2022)15-0019-03
一般情况下,医疗大数据的来源通常有四个方面,即制药企业、临床医学的实验数据、费用报销以及社交网络,而这些数据的应用领域极为广泛,譬如可以用于研究、支付、个性化治疗、疾病分析等多个方面。对此,为了更好地为大众提供优质医疗服务,社会各业界纷纷为人们提供了大量的数据资源和相关技术,所以,这也就为医疗大数据平台的建设带来了机遇。当然,既然存在发展的机遇,那么必然也会存在一定的挑战需要解决,因此,本文简要阐述了当前建设医疗大数据平台所面临的困境及其应对策略,旨在进一步完善我国的医疗服务体系。
1 当前医疗大数据平台建设的发展机遇
1.1 国家医疗政策体系的不断完善
自2015年9月份以来,我国相关部门专门颁发了一系列关于医疗大数据发展的政策和文件,譬如《促进大数据发展行动纲要》《关于促进和规范健康医疗大数据应用发展的指导意见》等。这些政策的提出不仅深入分析了当前医疗大数据的发展形势及其意义,同时还进一步完善了医疗大数据平台的统筹与规划体系,从而极大地促进了健康医疗大数据的全面深化与改革。另外,从医疗大数据产业目前的发展情况来看,可以说人们所提出的一系列行业性、专业性的政策为其今后的稳定长远发展提供了便利,并且还在福建、江苏等多个地区建设了医疗大数据试验区来响应国家所提出的医疗政策[1]。
1.2 现代化技术的不断发展
一方面,自从进入大数据技术时代以来,大数据技术架构体系得到了进一步完善,尤其是大规模的服务器、基础软件等产品的不断涌现,大大加快了当前信息化时代的发展步伐。近些年来,以Spark和Flink为代表的新型计算引擎已经逐渐取代了MapReduce框架,并且还涌现出了很多其他种类的数据技术结构框架,譬如Greenplum框架、Impala、SparkSQL等一系列结构化数据处理技术,旨在更好地满足数据处理的需求,最终真正将数据问题解决好[2]。当然,除了结构化数据处理技术以外,社会中还兴起了很多非结构化的数据处理技术,如语音识别、图像识别等智能技术,从而大大提升了医疗大数据的深度整合。另一方面,二代测序技术的推出和应用大大降低了医疗基因测序的成本,也正是因为技术的进步和成本的降低,使得我国医疗行业与数据技术的融合发展成为必然趋势,从而让医疗研究真正步入大数据信息化时代。
1.3 数据资源的优势不断凸显
作为世界第一人口大国,我国不仅有着丰富的医学研究资源,同时还拥有大量的疾病数據资源,毕竟目前社会人口老龄化的问题越来越明显,再加上居住环境、经济发展以及生活方式等的变化,最终必然会让人类的死亡率和各类疾病发病数逐渐呈现出不断增长的趋势。因此,从这一角度来看,庞大的诊疗人群和各种病学特征都可以作为极为可靠的医学科研数据资源。
2 医疗大数据平台建设所面临的困境
2.1 数据标准化
到目前为止,虽然我国已经累计制定并发布了多项卫生信息标准,但是对卫生信息标准的制定起点相对较低,起步也比较晚,而且也缺乏具有强制性和有效性特点的执行措施,所以往往会在制定与执行的过程中存在各种问题[3]。譬如,由于每个医药厂商的信息系统并不是十分规范,而且各个医疗单位的数据采集与整合质量也是各不相同的,所以导致各种医疗数据难以真正实现完全互通和共享。中国医院协会信息专业委员会通过对医院信息化管理的现状进行调查和分析,了解到大部分的信息化产品与数据采集起来比较困难,只有极少数的医疗单位对数据互通的标准化程度相对成熟一些。由于各医疗单位所使用信息化产品的厂家数量非常多,管理结构也各有不同,所以这也是导致医疗数据不规范、不准确、不互通等问题出现的重要原因,仍需要建设有一定标准的数据管理平台。
2.2 数据挖掘的现状及其挑战
深入分析目前的医疗大数据,可以发现绝大多数数据都是非结构化的自由录入,其中就包括病人的出入院记录、病情诊断报告、手术记录等信息,所以这些数据信息通常有着极高的参考和研究价值[4]。然而,这种非结构化的数据信息录入方式往往会呈现出多模态、多源等特点,再加上原始信息的不完整、汉字也存有歧义性,所以这也就大大增加了数据信息提取和技术融合的难度,同时也更不利于工作人员对有价值信息的筛选与整合。虽然近些年来BERT、XLNET、ERNIE等工具已经在处理医学领域自然语言方面取得了一定成绩,但是仍然不能很好地对医疗行业的常识问题进行处理和推理。即便人工智能在我国医学研究领域的应用越来越广泛,但是由于标注数据比较稀缺,标注的过程也非常复杂并且周期较长,再加上复杂的医疗概念和隐私性较强的数据信息大大增加了数据标注的成本和难度,所以人工智能技术的发展并不是很顺利。除此之外,从目前国内相关专业人士对医学术语标准化的建设情况来看,虽然已经取得了初步的研究成果,但是由于起步较晚,数据信息和医学知识的来源渠道也非常广泛,所以这就导致有很多临床证据、医学文献等资料中的内容经常会出现不一致的问题,从而致使医疗领域出现越来越多新的医疗概念、产品和治疗方式。这样一来,怎样更好地对医学产品、概念、治疗方式等内容的标准进行统一就显得尤为重要,只有不断更新和完善医疗专业知识的准确性与时效性才能灵活应对今后医疗领域存在的挑战。328914AB-F61E-4124-8E19-47EC583A36D2
2.3 医疗大数据的共享与应用
从一定角度来看,数据信息往往有着自身的归属权、使用权和隐私权,但是由于目前的数据开放和共享机制还不够完善,所以并不能明确人们所需要承担的法律后果,由此可见,不同行业和部门在公开、流动和交易这些医疗大数据时,就必须要进一步制定出一套相对完善的国家政策和创新机制以作保障[5]。然而,目前我国医疗大数据的外部应用环境和技术平台还是比较脆弱的,所以往往在面对如此庞大的数据信息时,就极容易出现医疗大数据泄露的问题。因此,为了避免医疗大数据泄露事件的出现,怎样有效保证医疗大数据平台建设和应用的安全性与平衡性,值得每位工作和研究人员引起关注。
3 解决医疗大数据平台建设困境的应对策略
3.1 医疗大数据平台的建设与规划
1)建设以各类疾病为中心的医疗大数据平台
疾病的种类有很多,而且还有的疾病有着较高的发病率和死亡率,比如恶性肿瘤等,而这些疾病将会给人类的身体健康造成极为严重的生命威胁。就以恶性肿瘤临床医疗大数据平台建设为例,我国目前尚未建立比较完善的以该疾病为基础的研究平台,再加上关于肿瘤发病与治疗的各种数据还不够精准,并且在肿瘤防治、医学研究、治疗评价等方面有着一定的盲目性,所以就必须要建立起更完善的以各类疾病为中心的医疗大数据平台,并加强平台的管理与应用,从而为疾病的预防与治疗提供标准和依据。另外,国家也要制定并发布相关的政策体系,为医疗大数据平台的建设与应用提供政策支持,从而让各类疾病的防治更规范、更科学,最终真正实现医疗与数字技术的深度融合。
2)平台的建设原则
在医疗大数据平台的建设过程中,必须始终坚持“1234”的基本原则,即:1个中心转变、2个维度,3个互联互通,4个环节。其中,1个中心转变其实就是指各类疾病今后的发展将从治疗逐渐转变为预防,致力于早诊断、早治疗、早康复,而这将直接影响着我国医疗数据信息的采集、分析与整理工作[6]。2个维度则主要指医疗服务对象的广泛性,包括药企、医疗公司等;现代技术的多元化,包括大数据、云计算等技术。3个互联互通主要表现为医疗大数据平台与各大医疗机构的数据、区域健康卫生信息平台、医疗技术研究领域这三个方面实现互联互通(如图1)。4个环节则主要包括医疗大数据的采集、治理、赋能和联动环节,从而通过严格把控各环节的数据信息来达到提升疾病预防和治疗水平的目的。
3.2 各类疾病医疗大数据平台相关技术领域的深入研究
1)数据的处理
一般情况下,医疗大数据的处理往往会涉及技术规范、治疗流程、实践战略等多个方面的内容,其中,技术规范及其标准才是重要的核心关键,因此,在研究各类疾病医疗大数据的过程中,必须要对数据的处理引起高度重视。
2)数据的采集要规范且标准
在构建跨地域的医院大数据采集平台标准时,对元数据的检索与数据管理就特别重要,因此有关技术人员一定要注意这些元数据的可读性与一致性,从而更好地解决各大医院数据的相关性问题。而在管理元数据时,就必须根据医院项目的目标、数据特征等去构建一个最小的元数据集合,并在这一基础上去展开元数据的建设与管理工作,尽可能保证医疗数据库的规范性和科学性。而由于建立元数据管理主索引的工作相对比较复杂,经常会涉及患者个人信息、医保卡号、治疗日期等的关联信息的匹配,所以这就需要不同的厂商和业务系统在数据交换时都必须进行专家论证和技术攻关,以保证数据信息的有效读取。
3)數据的处理与转化
由于目前我国的医疗大数据仍存在很多质量方面的问题,严重阻碍着这些数据资源的有效转化,难以发挥出其自身的医疗价值,所以还需要相关研究人员和专业人士探索出更合适的数据处理与转化技术,以便促进各大数据分析更加结构化和规范。而数据的管理与转换通常都是一个循序渐进的过程,“数据—信息—知识”都可以互为因果来推动医学的应用实践,最后可以建立封闭式的医学信息处理和认知转换模式(如图2)。
4)数据的安全采集与应用
安全作为医疗大数据平台建设与发展的重要基础,需要对一些敏感性的医疗数据实施分级分类管理,旨在进一步完善数据安全管理与应用体系。而在技术层面,需要从三个方面来保证数据的安全采集与应用:一是通过借助虚拟专网、强制访问等控制技术来确保数据的安全存储;二是借助可信网络通讯、可信设备等来构建安全防御框架;三是认真学习关于数据安全与隐私等相关新型技术的应用方法,从而真正实现数据的安全互通。
3.3 医疗大数据平台的建设实践
1)数据处理
通过结合理论和临床数据库,医疗大数据平台在进行数据信息处理时一般都是以CDM(Common DataModel)为基础来创建数据库的,通常会经历数据的录入、关联、转化、质控等一系列的处理流程[7]。在数据分析这一环节的过程中,医疗人员通常都会结合患者的电子病历等信息,利用非结构化的数据运用模板来分析所采数据信息的文本格式;在数据清洗这一环节中,通常会涉及BERT、LSTM、SRF等技术的融合应用,以便更好地标识并合并患者的诊疗信息;在数据质控环节中,需要以专业规范的医学术语和数字技术为标准,从而真正实现各项医疗数据的自动映射和归一[8]。
2)数据平台的实际应用
随着互联网技术的不断完善和数据资源的不断增加,医疗大数据的建设与应用也逐渐进入了一个更加深入的重要阶段,各类疾病的标准化医学术语也必然会越来越规范,同时对数据信息的处理技术也必然会更成熟[9]。因此,建设一个日趋规范且合理的医疗大数据平台,必然会对今后我国医疗行业的创新发展提供更有力的数据信息支撑[10]。
4 结束语
总之,国家政府和医疗业界越来越注重医疗大数据平台的建设和应用,旨在通过借助各种现代化信息技术,来更好地为我国医疗大数据平台的建设与管理提供保障,最终达到逐步提升我国医疗水平的目的。经过上述分析,可以发现医疗大数据平台的建设与应用过程中既存在机遇也存在挑战,只有以国家政策为参考依据,将数据技术与医疗行业充分结合起来,才能更好地实现医疗行业智能化的有效转型。
参考文献:
[1] 吴燕秋,黎美秀,丁元杰,等.面向临床科研的全院级医疗大数据平台建设与数据治理实践探索[J].中华医学科研管理杂志,2021,34(2):81-86.
[2] 郭强,王丛,衡反修.医疗大数据平台建设机遇、挑战及其发展[J].医学信息学杂志,2021,42(1):2-8.
[3] 姜瀚.健康医疗大数据产业分析与前景展望探讨[J].产业创新研究,2020(18):21-22.
[4] 宋斐.区域医疗大数据建设存在的问题及对策[J].信息与电脑,2020(8):28-30.
[5] 王胜锋,宁毅,李立明.健康医疗大数据互联互通模式的经验与挑战[J].中华流行病学杂志,2020,41(3):303-309.
[6] 戴明锋,孟群.医疗健康大数据挖掘和分析面临的机遇与挑战[J].中国卫生信息管理杂志,2017,14(2):126-130.
[7] 刘磊,郑姗姗.大数据时代医疗信息安全现状分析和发展对策[J].包头医学,2020,44(1):64-65.
[8] 侯岩.医疗大数据应用需求分析与平台建设构想[J].中国新通信,2020,22(1):106.
[9] 汪鹏,吴昊,罗阳,等.医疗大数据应用需求分析与平台建设构想[J].中国医院管理,2015,35(6):40-42.
[10] 乐颖,刘南.医疗大数据平台的建设路径[J].电子技术与软件工程,2018(3):198.
【通联编辑:谢媛媛】328914AB-F61E-4124-8E19-47EC583A36D2