基于数据挖掘的移动医疗多维数据可视化关键技术研究与实现

2020-12-04 02:09:44彭连刚
无线互联科技 2020年9期
关键词:剪枝决策树数据挖掘

彭连刚

(长沙航空职业技术学院,湖南 长沙 410124)

在医疗发展过程中,数据的可视化始终是重点的发展方向。随着时代的发展和进步,可视化医疗已经不再局限于CT、磁共振、超声成像等,在移动医疗中,同样需要数据的可视化,不同于传统医疗,可视化过程面向医护人员,在诊断上提供便利,移动医疗的多维数据可视化主要面向用户,是为了帮助用户理解复杂且专业的医疗数据,并进行直观的分析,得到想要的结果,因此,要求移动医疗的数据可视化快速、简洁、准确、直观等。

1 移动医疗数据的特点

1.1 数据量庞大

移动医疗往往是根据监测到的用户的各种生命体征和运动指标来对其身体状况进行判断,在这个过程中,牵涉的数据量非常庞大,一些特殊的指标(如心率等)甚至可能需要以分钟为单位进行监测,导致每天每个用户都会产生相当庞大的数据总量。对于用户而言,数据的罗列显然是没有意义的,因此,移动医疗要求在庞大的数据中找到关键信息[1]。

1.2 数据动态变化

对于移动医疗的数据来讲,其整体上存在不断变化的情况,由于人体的健康状况不同,所处的环境不同,甚至当时的情绪不同,产生的数据也会有一定的差别。正常人体的温度在不同时刻都会有一定的差异,这个差异甚至能够达到0.5~1.0 ℃,因此,移动医疗数据是动态变化的,而不是一成不变的。

1.3 数据具有实时性

用户的某些生命体征通过传感器和数据采集器上传之后,具有一定的时间属性,该数据只能代表该时段内用户的生命体征和状态,并针对这个状态,对用户是否患病或者是否健康给出一定的预期和结论。当时间属性丢失后,数据将失去意义。

1.4 数据具有多维性

移动医疗相比于传统医疗,虽然对于公共医疗资源的压力释放有重要的意义,但是也存在诊断失误率高、诊断疾病种类限制多等问题。这主要是因为在移动医疗诊断过程中,患者不能清晰地对自己的病情进行表述和搜索,数据挖掘有时候可能会产生一定的误导,导致最终的诊断结果相差甚远,带来误诊的情况。因此,移动医疗为了能够准确地判断用户的身体情况,要尽可能更多、更全面地收集相关的数据和指标,一般不能只通过某一个数据或者某一个维度的数据孤立地对用户的身体情况进行判断[2]。

2 数据挖掘与数据挖掘的算法

2.1 数据挖掘

数据挖掘是当下计算机领域非常常见的一个名词,被广泛应用于多行业、多领域、多用途。之所以需要使用数据挖掘,是因为数据的总量在发生变化。所谓的数据挖掘,就是在大量的数据集合中,找到目标信息。由于信息集合具有复杂性的特点,内含很多重复信息和噪声信息,因此,如何从信息海中准确、快速地找到目标信息,对于用户来讲是非常有用且必要的。最显著的例子是“百度搜索”,作为目前中国大陆比较成功的搜索引擎,在海量的互联网信息中找到用户所需要的信息并提供相应服务,就离不开精准、快速的数据挖掘技术。数据挖掘的关键在于模型的构建,它决定了在进行数据挖掘的过程中采用何种算法,常见的数据挖掘算法很多,例如决策树算法、贝叶斯分类算法、神经网络算法、遗传算法等。本研究对决策树方法做一个简要的介绍,主要是因为该方法迭代次数少,因此运算速度更快,在数据基数越来越庞大的今天,更少的迭代次数、更快的挖掘速度,将使决策树算法有更多的应用,而决策树在进行数据挖掘的过程中,还能兼顾准确性,因此,在整个数据挖掘算法体系中,始终具有非常重要的地位[3]。

2.2 决策树算法

决策树算法是一种树形结构,在每一个节点进行判断和决策,最终找到具有价值的目标信息,是一种典型的自上而下的递归算法。随着计算进程的深入,逐步缩小范围,最关键的两步可以概括为生成和剪枝,直观形象地解释了决策树算法的工作过程,通过不断地剪枝,缩小数据的挖掘范围,快速找到目标结果或者目标结果的近似合集。决策树剪枝过程更复杂,具体可以分为前剪枝和后剪枝,前剪枝是为了缩小匹配的范围,避免高度拟合,后剪枝则是进一步校验挖掘过程,让结果更加精确[4]。

3 移动医疗数据可视化发展现状

移动医疗虽然在当下存在一定程度的应用,但是整体发展还有待提高。2019年年末的数据显示,目前我国的移动医疗APP市场规模大概在300亿元左右,略低于预期,整体发展进入平缓期。移动医疗APP大致可以分为问诊类、挂号导诊类和健康管理类3大类,其中,问诊类APP最多,占据总数量的43%,例如,好大夫在线、平安好医生等平台的用户数量非常多,下载量超过一个亿。与数据方面形成鲜明对比的,是“红红火火”背后的“如履薄冰”,由于移动医疗关乎用户的生命安全和身体健康,因此,对于移动医疗APP的实用性、准确性、权威性都有着很高的要求。近年来,因为轻信一些移动医疗APP的建议而导致病情延误甚至医疗事故的情况时有发生,不论是广告法还是行业监管都有一定程度的缩紧,这也是移动医疗目前发展放缓的主要原因之一。根据调查显示,目前受政策影响比较大的移动医疗主要是问诊类。近年来,一些运动手环、血糖仪、血压仪等传感器的升级换代,给健康管理类APP提供了更多的发展契机,再加上减肥、健身等始终处于高热状态,未来移动医疗的发展仍大有可为。

借着移动医疗发展而水涨船高的,是移动医疗的数据可视化技术。数据可视化技术属于IT领域,无疑是一种跨专业、跨领域的合作。数据可视化的主要目标是直观、快速、有效地将医疗数据呈现给用户,基于诊断结果给予用户合理的意见和建议。时代的发展和进步,移动医疗市场也迎来了更加激烈的竞争,为了在竞争中脱颖而出,就必须实现搜索快速、交互简洁、结果准确、用户友好等内容,这也刺激了医疗数据可视化相关技术的进一步发展,不过就目前而言,移动医疗数据可视化仍存在以下的几点问题。

3.1 学术理论研究不足

目前关于移动医疗数据可视化的专项研究并不多,尤其是与市面上丰富多样的移动医疗APP相比更是捉襟见肘。造成这种情况的原因,主要是目前我国的大部分移动医疗APP作为移动端手机应用之一,几乎都是由APP生产厂商进行研发和出售,采取的研究方式主要是通过市场和受众分析,以程序实现某些功能,也就是说,在整个移动医疗数据可视化系统的设计方面,遵循的是与所有服务类APP相同的思路,差异只在于实现数据可视化技术的差别。因此,其整体上缺少学术理论基础支撑,学术文献和研究都略显单薄[5]。

3.2 专业性的矛盾

就本质来看,移动医疗数据可视化技术是比较典型的交叉学科类型,这导致了其行业特征不够明显,所涉及的知识又具有一定的跨度。不论是医学知识还是计算机相关知识,都需要投入大量的时间和精力去学习和专研,因此,很少有人能够同时对两个领域精通,需要各个领域的人才通力合作。但是因为所处领域不同,交流和沟通也并不顺畅,给移动医疗的数据可视化发展带来了不小的影响。

3.3 普及程度和受认可的程度有待提高

由于医疗与人们的身体健康息息相关,很多时候当事人都会非常重视。移动医疗中的一些诊断结果目前还不能让人相信,这在很多情况下导致了移动医疗成为摆设。一些人选择在移动医疗APP上问诊,得到的结果是没有问题之后还是不放心,依然会选择前往医院进行诊疗,这就使得移动医疗对提升医疗资源利用率、释放公共医疗资源压力的作用得不到体现,实际上主要也是民众对于移动医疗的认知程度不高、信任程度不够导致的。在这样的情况下,很多移动医疗APP不能得到很好的应用和发展,一定程度上限制了数据可视化技术的发展[6]。

4 基于数据挖掘的移动医疗多维数据可视化的关键技术

4.1 动态过滤交互技术

医疗数据具有一定的实时性,很多情况下显示的结果需要不断地更新,这就需要应用到动态过滤交互技术,不断地对数据进行重新挖掘和过滤,实时对结果进行刷新,确保结果显示的准确性。

4.2 Canvas绘图技术及HTML5

Canvas绘图具有编辑容易、绘制便利的特点,随着移动端HTML5页面被苹果公司大力推广,Canvas绘图也成为移动端数据可视化的关键技术之一。HTML5界面相当于是介于图片和网页之间的一种数据可视化表现形式,既保留了图片的简介,也继承了网页的交互性,受到了国内智能手机用户的喜爱和追捧,是现阶段网络广告推广的主流形式之一。在移动医疗APP中,也经常以HTML5页面的形式实现数据的可视化,将诊疗和搜索结果直观地展示给用户,很多HTML5界面具有很强的交互性,实现了整体功能的拓展,方便了数据可视化的实现。

4.3 ESL加载器技术

ESL加载器相比于传统的加载器具有更小的体积和更高的性能,使得其更加适用于现代化的移动医疗数据可视化。在移动医疗APP的数据可视化实现过程中,需要运用大量的编程,而这些程序存在编译过程,想要生成Java程序的作用对象,实现程序的功能,就要利用加载器加载.class后缀的被编译文件。也就是说,想要让程序功能顺利实现,加载器的存在是必不可少的。传统的加载器一般为RequireJS,这是一款同样适用于浏览器的模块加载器,通过加载器实现程序的各个功能模块。在移动医疗APP中,使用ESL加载器能够提升整体的加载效率和速度,减轻系统的压力,更加契合移动医疗数据可视化的应用需求。

4.4 基于智能手机系统的常规交互技术

对于移动医疗APP来讲,为了实现数据可视化,需要借助不同的智能手机操作系统的交互技术。例如,APP中各个按钮在被点击时产生的跳转功能,图片的平移、缩放功能,基于互联网的分享和保存功能,数据表单的输入和计算功能。这些技术并不是移动医疗APP特有的,但是对于其数据可视化具有必要性,只有适用于手机操作系统,基础功能得到完善,才能确保数据可视化的实现。

4.5 JSON数据格式

JSON数据格式是一种无序合集,合集中的所有元素都是成对出现的,一般是由名称和对应的数值组成,这种数据格式对于移动医疗的数据可视化具有非常重要的意义,能够准确地实现数据的挖掘、筛选和调用,极大地提升了数据挖掘的效率,增强了数据可视化的便捷性,对于移动医疗的数据可视化发展具有非常重要的影响[7]。

5 结语

总而言之,对于移动医疗来讲,数据可视化决定了用户的观感,面对日益激烈的市场竞争,只有赢得客户信赖和喜爱的移动医疗APP才能够在市场生存和发展。一方面,企业应该结合用户需求,站在用户角度不断精进数据可视化;另一方面,应该进一步对学术理论体系进行补充和完善。只有这样,才能真正顺应时代的发展和社会的需要,推动移动医疗的整体发展。

猜你喜欢
剪枝决策树数据挖掘
人到晚年宜“剪枝”
保健医苑(2022年5期)2022-06-10 07:47:22
探讨人工智能与数据挖掘发展趋势
基于YOLOv4-Tiny模型剪枝算法
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
剪枝
天津诗人(2017年2期)2017-03-16 03:09:39
基于决策树的出租车乘客出行目的识别
一种基于Hadoop的大数据挖掘云服务及应用
基于肺癌CT的决策树模型在肺癌诊断中的应用