浅析生物大数据可视化的现状及挑战

2016-03-11 08:17刘江涛邢辉
中国新通信 2016年2期
关键词:发展趋势

刘江涛 邢辉

【摘要】 生物大数据可视化的实现能够对科研工作人员对海量复杂数据进行综合、多角度观察提供极大的帮助。生物数据量越大,复杂性越强烈,生物大数据可视化的作用就越加重要。文章主要针对生物大数据可视化的现状及挑战进行分析。

【关键词】 生物大数据 大数据可视化 发展趋势

在以往的10余年中,生命科学的各个领域得到了快速的增长,并且累积了海量的数据信息。海量的数据信息类型多样,数量惊人,拥有巨大的潜在价值。如果采用传统的处理方式来对海量数据进行处理不仅仅需要大量的人力、物力投入,而且还会使得失误率大大提升。在这一情况下,生物大数据可视化技术应运而生。

一、大数据及其技术

大数据是一种区别于传统意义的研究模式,其与传统模式中以个别案例作为研究对象的方式不同,其需要使用大规模的数据来开展研究。大数据最为显著的特征就是包括:1)海量数据。伴随着信息技术的进步,2009-2012年在医学领域有数以千百万计的患者的病历并采用电子格式保存[1]。电子病历形式的数据给予了利用大量患者数据开展医学研究的机会。2)类型多样。基因测序技术在细胞领域的各个层面都形成了组学系统。同时,很多数据都是呈现非结构化的状态,给医疗信息化的进步带来了巨大的空间;3)形成速度快。当前大数据的增长数据依然处于持续增加的状态中。在临床医学领域中,预计2019年采用电子病历形式存储的患者将会增加10倍。

二、生物大数据应用

生物大数据不仅仅拥有大数据的特点,而且同时还拥有生物数据的特征,生物大数据拥有数据量大、数据多样化、数据价值高等重要特征。就当前生物大数据的应用状况来看,生物大数据的应用有待进一步的深入开发,根据生物大数据的上述特征,其能够在医疗健康、农业领域、食品健康领域得到广泛的应用。

三、生物大数据可视化的现状

1、测序数据。测序数据能够将被比对至基因组中的所有数据类型通过图像的形式显现出来。其对于基因组数据展示模式大部分现存浏览器的相同特征:1)将染色体位置作为索引的基因组数据视图;2)以参考基因组为标准提供位置坐标轴;3)优越的交互性与可定制性,可以根据不同需求来隐藏或装载相关内容[2]。

2、分子结构数据。结构分子生物是物理、化学与生物学紧密联系的重要学科,其主要关注3D与4D复杂形状与功能关系的探索,成像捕捉、显微观察等技术给其研究工作提供了直观的视图数据。例如,软件Para View在使用过程中,使用者可以利用其通过定性预定量的方式选取大海量的数据快速建立三维视图模型,并且可以从随意一个角度来进行分子的结构进行细致观察。蛋白质等类型大分子结构十分复杂,其内部的位置关系与详细情况需要海量的运算空间,所以三维视图软件的使用相对于二维软件来说需要更加强劲的算法设计,因此软件的硬件设备也需要相应的提高,以支持软件的运算。为了全面提升海量数据的处理能力,Para View可以使用分布式存储计算资源,能够在超级计算机中来进行运算,从而实现可视化。

3、临床数据。虽然电子病历的普及范围是在不断扩大,然而非统一的标准以及非结构化的数据模式对于获取患者资料有着一定的阻碍[3]。鉴于改善这一问题,Flatiron技术建立Oncology Cloud就能够归纳整理来自多渠道的患者详细信息与患者恢复情况,并且还可以对数据集进行分类研究。医生不单单可以利用Oncology Cloud搜索到同类病人的治疗结构,还可以实时搜索到以往不同治疗方式下不同的疗效。又例如,Chimera软件可以将分子结构、序列对比、轨迹等数据整合起来,以形成高质量的动画效果。另外,针对临床数据的可视化软件还包括能够实现核小体定位与组蛋白分析的可视化等。

四、生物大数据可视化新技术展望与挑战

首先,在目前拥有的海量数据中存在着大量的冗余,因此在未来的生物大数据可视化技术发展趋势中可以将数据分类归纳,采用统一的规格来进行存储,降低数据存储与处理的成本,提升数据的易用性。其次,由于生物大数据都是位于不同的研究机构的,因此可以建立相关的通信协议,在通信协议的支持下可以实现同一界面对异地数据的可视化。最后,生物大数据的多样性与海量性给数据挖掘带来了巨大的困难,为了提升生物大数据的挖掘,在实现生物大数据可视化的过程中要在保证实用性的基础上提升软件的人性化水平,兼顾到使用者的体验感,提供更加友好的人机交互界面。

五、结束语

生物大数据可视化工作种类多样,针对不同需求有不同的工具来实现可视化。基于更彻底、更好的挖掘有效数据,生物大数据可视化工具的开发趋势已经朝着拥有统计分析功能的一站式集成软件发展。伴随着科技的进步,未来的生物大数据可视化工具将会更加人性化、更加美观、更加实用。

参 考 文 献

[1]周琳 , 孔雷 , 赵方庆.生物大数据可视化的现状及挑战[J].Science Bulletin, 2015, (Z1):547-557.

[2]苏咪咪.大数据的“豆形”可视化及其在资本市场中的应用[J].科学与管理, 2014, (06):3-8.

[3]第一次“中国生物大数据统计方法研讨会”在重庆第三军医大学召开[J].中国卫生统计, 2015, (01):145.

猜你喜欢
发展趋势
湖北省P2P借贷行业发展趋势研究
浅析暖通设计的问题
我国机械设计制造及其自动化的现状及发展趋势
简析住宅建筑设计中BIM技术的应用
机械自动化技术运用和为来趋势
基于网络的信息资源组织与评价现状及发展趋势研究